上周技术关注：大型高并发高负载网站的系统架构

[数据库技术, 系统架构, WEB开发] 说说大型高并发高负载网站的系统架构 >> 上面提供的几个解决思路在一定程度上也意味着更大的投入，并且这样的解决思路具备瓶颈，没有很好的扩展性，下面我从低成本、高性能和高扩张性的角度来说说我的一些经验。1、HTML静态化2、图片服务器分离3、数据库集群和库表散列4、缓存5、镜像6、负载均衡一个典型的使用负载均衡的策略就是，在软件或者硬件四层交换的

曾登高

5827人浏览 · 2006-12-19 15:16:00

曾登高 · 2006-12-19 15:16:00 发布

[数据库技术, 系统架构, WEB开发] 说说大型高并发高负载网站的系统架构 >>
上面提供的几个解决思路在一定程度上也意味着更大的投入，并且这样的解决思路具备瓶颈，没有很好的扩展性，下面我从低成本、高性能和高扩张性的角度来说说我的一些经验。1、HTML静态化2、图片服务器分离3、数据库集群和库表散列4、缓存5、镜像6、负载均衡一个典型的使用负载均衡的策略就是，在软件或者硬件四层交换的基础上搭建squid集群，这种思路在很多大型网站包括搜索引擎上被采用，这样的架构低成本、高性能还有很强的扩张性，随时往架构里面增减节点都非常容易。
[互联网] Page View将死？ >>
能够想到的应对法子就是找到相应合适的评测参数。有什么好的提议呢？Ryan Stewart建议是否能够记录下用户与程序的交互，提出“Interaction Rate”。也许这是个解决办法，PV升级为交互频率，实质还是一样，广告要牢牢抓住用户的眼球。其实，我更期盼见到的是，通过在网站产生的种种行为，网站的推荐系统介绍给我可能钟意的信息和物品。
[Yahoo] 雅虎的“花生酱宣言” >>
我们有着巨大的优势。几乎所有的媒体、电脑公司都觊觎我们的行业领导地位。还有我们数量庞大参与度极高的客户数以及成为互联网标签的Yahoo！品牌。只要我们奋起直追，变革创新，最后的胜利是属于我们的。有很多条路供我们选择。我个人愿意提供一些解决问题的思路和方法。我强烈建议我们要快速行动。也许方法不够完善，不过聊胜于无。需要改进的三个方面:专注明细的责任制和所有权改革重组
[P2P] Trend Watch: P2P Traffic Much Bigger Than Web Traffic >>
Peer-to-Peer (P2P) traffic was 60% (and rising) of Internet traffic in 2004, with BitTorrent accounting for 30% of traffic, per CacheLogic
[搜索市场] Search 2.0 - What''s Next? >>
We have positioned the latest search trends into 3 main categories:UI Enhancements Technology Enhancements Approach Enhancements (Vertical Engines)
[WPF, Adobe, Apollo, 开源] Microsoft WPF/E vs Adobe Apollo >>
这几个星期发生在Flash社区的震撼事件，包括Adobe将ActionScript Virtual Machine 2(AVM2)的核心源代码捐献给Mozilla组织，变成了一个叫做Tamarin的开源项目。Tamarin的目标是实现一个高效的ECMAScript 4th edition(ES4)引擎，它会成为现在Firefox中代号为SpiderMonkey的JavaScript引擎的新核心，同时也用于运行ActionScript3的AVM2。另一个震撼的事件是Adobe的Apollo即将来临，这家伙将有十足的实力在全平台上与WPF/E对抗。
[google, Nutch] MAP/REDUCE:Google和Nutch实现异同及其他 >>
Nutch和GOOGLE的区别与联系：1) 大体上Nntch是按照GOOGLE的论文做的，但是有几点区别，总体感觉Nntch在完整性和复杂性方面还不如GOOGLE的系统； 2) GOOGLE更像一个软件框架，客户在这个框架下写自己的程序，而nutch更像一个固定功能的系统，当然之所以nutch的mapper和reducer类基本只起到一个接口的作用，也是为了体现框架的意图，由用户继承并定义新类来使用框架完成自己的任务，但是nutch的 jobclient和jobsubmission使得它更像一个静态的功能而非框架； 3) GOOGLE的实现版本框架，其中的变化点在于用户自定义mapper; 用户自定义reducer; 用户可以对输入文件格式解析进行自定义；用户通过一个类来设定系统参数并将map/reduce类和输入文件绑定起来；用户自定义partition类，该类主要由reducer调用，功能是通过HASH(KEY)使得同一个KEY的能够映射到一台机器上，这样方便统计处理；
[Javascript, ajax] Best Top Ten Open Source,Ajax/DHTML Librearies For Web Developer >>
I made a list of the top 10 libraries that I have come across or that I personally use. Libraries can be best for a web developers friend. They are great resources to learn from and can save hours and hours of time. These libraries include JavaScript, Ajax, Colors, PHP, and CSS. These should be in any web developers bookmarks, so go ahead and look through these libraries and bookmark your favorite ones. The list is in no particular order.
[SQL_Server, 性能] SQL Server2005性能调优（简化翻译版） - 3 >>
我个人认为，更好的利用这些DMVs和sp的前提是，对于sql的基本概念要有所了解。索引、锁、阻塞、死锁等，为什么会产生，他们在SqlServer这种数据库下面是如何处理的，等等。否则，看着那些DMVs，很容易发懵。
[SQL_Server, 性能] SQL Server2005性能调优（简化翻译版） - 2 >>
每个实例只有一个tempdb，所以这里很可能成为性能或者磁盘空间的瓶颈。
[搜索技术, 网络广告, 百度] 搜索引擎定向广告策略－－以百度为例 >>
百度处理模糊关键词匹配的方法是：分析用户查询，比如用户输入“海鲜花彩铃”，先根据空格信息分成两个子成分“海鲜花”和“彩铃'，然后两个字符串序列和广告词数据库执行多模式匹配策略，得到如下的匹配结果：”海鲜“，'鲜花”，“彩铃”四个匹配结果，然后按照一定标准输出到右侧广告栏，这个输出策略可能跟企业购买关键词的出价有关，比如出价高的排列在前面，同时输出结果不超过比如10个等等。
[搜索技术, google] google怎么做（3.搜索结果重排序) >>
GOOGLE在用户初次检索结果基础上又利用链接关系进行了重排序,期望能够使得排序结果与用户查询更加相关,其算法如下:
[搜索技术, google] Google怎么做(1.相关提示) >>
在我以前发的帖子里面讲过百度的相关提示功能是如何实现的,下面说说GOOGLE(http://googlechinablog.com/2006/04/blog-post_10.html)的相关提示如何实现的,你使用两个搜索引擎并观察一下两个系统的相关提示就会发现,GOOGLE的技术含量比百度高出很多.比如输入查询”刘翔”,GOOGLE的相关提示”足球”/”罗雪绢”/”姚明”/”田径”等等,而百度的相关提示是:”刘翔图片”/”刘翔简介”等等.最大的区别是:百度的相关提示一定包含查询本身,而GOOGLE的相关提示视野要开阔很多.那么GOOGLE是如何做的?
[搜索技术, google] google怎么做(2.相似网页算法) >>
看起来比较繁琐,实际上基本想法很简单,一句话概况就是:谁的链接指向我?那么这些指向我的页面还指向谁?
[搜索, google, 开源, 安全] Google代码搜索：漏洞的汇集？ >>
“gets()”函数的例子仅仅是使用Google代码搜索能够找到的这类问题的一个例子。著名安全研究人员Dug Song和Aaron Campbell在博客中指出，Google代码搜索能够用来发现十几种不同的安全漏洞，包括某些缓存溢出状况，格式串漏洞、off-by-one错误等等。在近期，Google代码搜索将帮助开发人员找到和修复能够导致严重安全漏洞的编写不佳的代码。从长远看，Google代码搜索将改善安全状况，因为这项功能提供了一个令人难以置信的查看代码的功能强大的方法。然而，近期的发展是非常不平坦的，因为在其它团体努力修复漏洞的时候，坏蛋们也在挖掘安全漏洞。
[SQL_Server, 性能] 50种方法巧妙优化你的SQL Server数据库 >>
[SQL_Server, 性能] SQL Server2005性能调优（简化翻译版）- 1 >>
[CSDN, TrackBack, Spam] BSP防范Trackback垃圾的一种方法 >>
我们知道，Trackback垃圾发送者有2个目的：一是希望用户通过连接访问他们的网站(比如一些美女色情站)，二是希望搜索引擎加强他们网站的排名和收录。因此，他们通常都有Trackback回溯地址。我们通过这些地址的分析可以找出一些有价值的规律。然后基于这个规律上去清理Trackback垃圾。本文基于对Trackback回溯地址主域名的统计分析的基础上给出了一种大批量消除Trackback垃圾的方法，并在CSDN Blog消除效果良好。值得大型BSP借鉴。

CSDN技术网摘生成。更多技术动态，请访问我的技术网摘（RSS）

Cloudpods

开源、云原生的融合云平台

更多推荐

面向未来的 IT 基础设施管理架构——融合云（Unified IaaS）

随着数字化时代的到来，IT系统已成为人类社会正常运转不可或缺的组成部分。不远的未来，智能制造，5G和人工智能等技术将成为推动生产力发展的重要引擎，人类社会将面临前所未有的全面彻底的数字化浪潮。IT基础设施作为IT系统运行的平台和载体，是实现数字化的基石。在这场数字化浪潮中，企业必须积极拥抱云计算技术，采用符合技术发展趋势、面向未来的IT基础构架，才能在未来的竞争中赢得先机。一、云计算历经十余年

Cloudpods

Cloudpods负载均衡的功能介绍

作者:周有松今天的内容会从以下几个方面展开：负载均衡产品简介。主要介绍负载均衡作为一个云上产品，它的功能模型是怎样的，日常使用中会遇到的业务词汇负载均衡的功能与典型应用场景。这部分主要结合业务词汇，对负载均衡服务中常见的一些功能选项进行介绍，并举例介绍一些典型的应用场景最后，我们做一下总结，讨论一下负载均衡产品相比传统方式的优点一、产品简介 1. 以NGINX为例提到负载均衡，我们以

Cloudpods

使用Linux vfio将Nvidia GPU透传给QEMU虚拟机

Linux 上虚拟机 GPU 透传需要使用 vfio 的方式。主要是因为在 vfio 方式下对虚拟设备的权限和 DMA 隔离上做的更好。但是这么做也有个缺点，这个物理设备在主机和其他虚拟机都不能使用了。 qemu 直接使用物理设备本身命令行是很简单的，关键在于事先在主机上对系统、内核和物理设备的一些配置。单纯从 qemu 的命令行来看，其实和普通虚拟机启动就差了最后那个-device的选项。这