• [数据库技术, 系统架构, WEB开发] 说说大型高并发高负载网站的系统架构 >>
    上面提供的几个解决思路在一定程度上也意味着更大的投入,并且这样的解决思路具备瓶颈,没有很好的扩展性,下面我从低成本、高性能和高扩张性的角度来说说我的一些经验。1、HTML静态化2、图片服务器分离3、数据库集群和库表散列4、缓存5、镜像6、负载均衡一个典型的使用负载均衡的策略就是,在软件或者硬件四层交换的基础上搭建squid集群,这种思路在很多大型网站包括搜索引擎上被采用,这样的架构低成本、高性能还有很强的扩张性,随时往架构里面增减节点都非常容易。
  • [互联网] Page View将死? >>
    能够想到的应对法子就是找到相应合适的评测参数。有什么好的提议呢?Ryan Stewart建议是否能够记录下用户与程序的交互,提出“Interaction Rate”。也许这是个解决办法,PV升级为交互频率,实质还是一样,广告要牢牢抓住用户的眼球。其实,我更期盼见到的是,通过在网站产生的种种行为,网站的推荐系统介绍给我可能钟意的信息和物品。
  • [Yahoo] 雅虎的“花生酱宣言” >>
    我们有着巨大的优势。几乎所有的媒体、电脑公司都觊觎我们的行业领导地位。还有我们数量庞大参与度极高的客户数以及成为互联网标签的Yahoo!品牌。只要我们奋起直追,变革创新,最后的胜利是属于我们的。有很多条路供我们选择。我个人愿意提供一些解决问题的思路和方法。我强烈建议我们要快速行动。也许方法不够完善,不过聊胜于无。需要改进的三个方面:专注明细的责任制和所有权改革重组
  • [P2P] Trend Watch: P2P Traffic Much Bigger Than Web Traffic >>
    Peer-to-Peer (P2P) traffic was 60% (and rising) of Internet traffic in 2004, with BitTorrent accounting for 30% of traffic, per CacheLogic
  • [搜索市场] Search 2.0 - What''s Next? >>
    We have positioned the latest search trends into 3 main categories:UI Enhancements Technology Enhancements Approach Enhancements (Vertical Engines)
  • [WPF, Adobe, Apollo, 开源] Microsoft WPF/E vs Adobe Apollo >>
    这几个星期发生在Flash社区的震撼事件,包括Adobe将ActionScript Virtual Machine 2(AVM2)的核心源代码捐献给Mozilla组织,变成了一个叫做Tamarin的开源项目。Tamarin的目标是实现一个高效的ECMAScript 4th edition(ES4)引擎,它会成为现在Firefox中代号为SpiderMonkey的JavaScript引擎的新核心,同时也用于运行ActionScript3的AVM2。另一个震撼的事件是Adobe的Apollo即将来临,这家伙将有十足的实力在全平台上与WPF/E对抗。
  • [google, Nutch] MAP/REDUCE:Google和Nutch实现异同及其他 >>
    Nutch和GOOGLE的区别与联系:1) 大体上Nntch是按照GOOGLE的论文做的,但是有几点区别,总体感觉Nntch在完整性和复杂性方面还不如GOOGLE的系统; 2) GOOGLE更像一个软件框架,客户在这个框架下写自己的程序,而nutch更像一个固定功能的系统,当然之所以nutch的mapper和reducer类基本只起到一个接口的作用,也是为了体现框架的意图,由用户继承并定义新类来使用框架完成自己的任务,但是nutch的 jobclient和jobsubmission使得它更像一个静态的功能而非框架; 3) GOOGLE的实现版本框架,其中的变化点在于 用户自定义mapper; 用户自定义reducer; 用户可以对输入文件格式解析进行自定义; 用户通过一个类来设定系统参数并将map/reduce类和输入文件绑定起来; 用户自定义partition类,该类主要由reducer调用,功能是通过HASH(KEY)使得同一个KEY的能够映射到一台机器上,这样方便统计处理;
  • [Javascript, ajax] Best Top Ten Open Source,Ajax/DHTML Librearies For Web Developer >>
    I made a list of the top 10 libraries that I have come across or that I personally use. Libraries can be best for a web developers friend. They are great resources to learn from and can save hours and hours of time. These libraries include JavaScript, Ajax, Colors, PHP, and CSS. These should be in any web developers bookmarks, so go ahead and look through these libraries and bookmark your favorite ones. The list is in no particular order.
  • [SQL_Server, 性能] SQL Server2005性能调优(简化翻译版) - 3 >>
    我个人认为,更好的利用这些DMVs和sp的前提是,对于sql的基本概念要有所了解。索引、锁、阻塞、死锁等,为什么会产生,他们在SqlServer这种数据库下面是如何处理的,等等。否则,看着那些DMVs,很容易发懵。
  • [SQL_Server, 性能] SQL Server2005性能调优(简化翻译版) - 2 >>
    每个实例只有一个tempdb,所以这里很可能成为性能或者磁盘空间的瓶颈。
  • [搜索技术, 网络广告, 百度] 搜索引擎定向广告策略--以百度为例 >>
    百度处理模糊关键词匹配的方法是:分析用户查询,比如用户输入“海鲜花 彩铃”,先根据空格信息分成两个子成分“海鲜花”和“彩铃',然后两个字符串序列和广告词数据库执行多模式匹配策略,得到如下的匹配结果:”海鲜“,'鲜花”,“彩铃”四个匹配结果,然后按照一定标准输出到右侧广告栏,这个输出策略可能跟企业购买关键词的出价有关,比如出价高的排列在前面,同时输出结果不超过比如10个等等。
  • [搜索技术, google] google怎么做(3.搜索结果重排序) >>
    GOOGLE在用户初次检索结果基础上又利用链接关系进行了重排序,期望能够使得排序结果与用户查询更加相关,其算法如下:
  • [搜索技术, google] Google怎么做(1.相关提示) >>
    在我以前发的帖子里面讲过百度的相关提示功能是如何实现的,下面说说GOOGLE(http://googlechinablog.com/2006/04/blog-post_10.html)的相关提示如何实现的,你使用两个搜索引擎并观察一下两个系统的相关提示就会发现,GOOGLE的技术含量比百度高出很多.比如输入查询”刘翔”,GOOGLE的相关提示”足球”/”罗雪绢”/”姚明”/”田径”等等,而百度的相关提示是:”刘翔图片”/”刘翔简介”等等.最大的区别是:百度的相关提示一定包含查询本身,而GOOGLE的相关提示视野要开阔很多.那么GOOGLE是如何做的?
  • [搜索技术, google] google怎么做(2.相似网页算法) >>
    看起来比较繁琐,实际上基本想法很简单,一句话概况就是:谁的链接指向我?那么这些指向我的页面还指向谁?
  • [搜索, google, 开源, 安全] Google代码搜索:漏洞的汇集? >>
    “gets()”函数的例子仅仅是使用Google代码搜索能够找到的这类问题的一个例子。著名安全研究人员Dug Song和Aaron Campbell在博客中指出,Google代码搜索能够用来发现十几种不同的安全漏洞,包括某些缓存溢出状况,格式串漏洞、off-by-one错误等等。在近期,Google代码搜索将帮助开发人员找到和修复能够导致严重安全漏洞的编写不佳的代码。从长远看,Google代码搜索将改善安全状况,因为这项功能提供了一个令人难以置信的查看代码的功能强大的方法。然而,近期的发展是非常不平坦的,因为在其它团体努力修复漏洞的时候,坏蛋们也在挖掘安全漏洞。
  • [SQL_Server, 性能] 50种方法巧妙优化你的SQL Server数据库 >>
  • [SQL_Server, 性能] SQL Server2005性能调优(简化翻译版)- 1 >>
  • [CSDN, TrackBack, Spam] BSP防范Trackback垃圾的一种方法 >>
    我们知道,Trackback垃圾发送者有2个目的:一是希望用户通过连接访问他们的网站(比如一些美女色情站),二是希望搜索引擎加强他们网站的排名和收录。因此,他们通常都有Trackback回溯地址。我们通过这些地址的分析可以找出一些有价值的规律。然后基于这个规律上去清理Trackback垃圾。本文基于对Trackback回溯地址主域名的统计分析的基础上给出了一种大批量消除Trackback垃圾的方法,并在CSDN Blog消除效果良好。值得大型BSP借鉴。

CSDN技术网摘生成。更多技术动态,请访问我的技术网摘RSS

Logo

开源、云原生的融合云平台

更多推荐