大型web搜索引擎的分析
http://infolab.stanford.edu/~backrub/google.html
本文,我们将把分析的目标对准所有大型web搜索引擎的原型:google。Google被设计来高效率的爬行和索引web网络,同时快速的生成比现有系统更优秀的结果页。我们可以访问http://google.stanford.edu/这样一个google的迷你模型,这个模型包含超过两千四百万个页面。
设计搜索引擎是一项很有挑战性的工作。搜索引擎需要索引数以亿计在风格、内容上截然不同的页面。每天快速响应数以千万计的查询需求。尽管搜索引擎如此的重要,但是几乎没有人投入足够的精力来研究它们。此外,伴随技术和web特性的快速进步、改善,现在建立一个搜索引擎要比几年前困难的多。本文将会第一次提供一个有关搜索引擎的深度剖析。
除去传统的搜索引擎所要面对的问题之外,还有一些新的技术带来的挑战,比如在html中使用额外的信息以提供更好的搜索结果。本文也会罗列这些问题,并试着分析一些有关如何在一个实用的搜索引擎的结果页html中添加额外的信息。此外我们也会分析怎样处理那些编写不当的页面。
文章源作者: wujia
如转载请标明出处:达闻SEO博客-搜索引擎基础
上海达闻营销版权所有
Google 咖啡因效率确实提高蛮多
Google推出了新的搜索引擎:咖啡因推出有一段时间了。关于新搜索引擎咖啡因,Google关于其官方的特点:
其索引结果是当前Google索引工具的1.5倍,这也是Google迄今为止所提供的Web内容的最大量。无论是新闻、博客、论坛帖子,你都可以在其发布后更快地找到其链接。在Caffeine中,“我们只在小的范围内分析Web内容,并不间断地更新索引,进而设计全球网络内容。一旦我们发现新的页面或现有页面上更新了内容,我们可以直接将其添加到索引中,也就是说,你可以更快地搜索到新的Web内容。
在这段官方的声明当中,有提到Google抓取、索引网页内容的方式有所变化,即减少了分析的Web内容、加大了索引结果数量。SEO从业人员都应该知道,如果最终在Google看到的,前台索引页面数量有变化的话,那么Google的页面抓取行为,势必也会有所改变,因为只有先进行页面的抓取、然后才能产生所说的内容分析、页面索引。那有谁知道Google的索引行业到底有什么变化吗?这个当然是没有确切的、官方的答案了。但从最近一些网站的数据来看,确实体验到了咖啡因的强大。
最近从看到的一些Google抓取的数据来看,Google在对大部分网站的页面抓取的数量,在5~6月之间,确实是在减少。
我们可以看下下面的三个图,都是从Google管理员工具抓取出来的:
数据一
数据二
数据三
但是有一点需要说明的是,虽然Google蜘蛛对页面的抓取数量在减少,但是,从流量或收录量这两个数据来看,在上面三个网站上,这三项数据都没有相应地,随着页面抓取数量的降低而下降,所有这些网站的流量、收录量都是上午的。
由此,我们不得不感叹,Google新搜索引擎的效率确实提高不少, 在不降低用户体验、不增加服务器成本的情况下,扩大了自身的一个内容抓取范围。
文章源作者: revonqi
如转载请标明出处:达闻SEO博客-Google 咖啡因效率确实提高蛮多
上海达闻营销版权所有
牛顿力学第三定律明确指出:
对于每一个作用力,必然同时产生一个方向相反、大小相等的反作用力。
这条定律解释了为什么打别人的的拳头自己也会痛、为什么扇动翅膀的鸟儿会飞、摆动尾部的鱼儿会向前游。虽然我们不能直接把牛顿的第三定律原封不动的照搬到用户体验中去,但是在某种程度上,它确实给我们以很多启发。
文章源作者: wujia
如转载请标明出处:达闻SEO博客-即时反馈是改善用户体验的重要手段
上海达闻营销版权所有
百度凤巢&百度站长平台的推出——只是一个开始
Snoon 发表于 2010年04月15日 分类: SEO技术研究 Tag: 凤巢系统 | 凤巢计划 | 用户体验 | 百度SEO | 百度凤巢 | 百度变化在关注谷歌迁往香港的同时,
我们也惊喜的发现百度近期的种种变化
一、10个推广+10个网页快照
百度的付费推广占据搜索结果大量位置的现象一直为用户所诟病,近期百度对此做了大刀阔斧的改革。
凤巢计划特点之一:采用左侧最多3个付费推广的限制。
凤巢的上线有效限制了推广在结果中所占的比重,某中程度来讲凤巢的出现有着她的必然性:
首先用户体验是任何网站和商业组织都必须要重视且无法回避的问题;
其次百度在国内市场占有率的提升使其有了绝对的垄断地位,搜索推广市场的天平进一步向卖方市场倾斜。
当然凤巢计划留了一个小尾巴,就是对于竞价用户购买较多、费用较高的词给予了特殊照顾——依旧保留了左侧的10个推广。
对此个人有三点分析
1、如果完全按照左侧3个推广的限制,很难给已有的竞价词购买者一个合理交待;
2、这些词也确实能给百度来了大量货真价实的利润;
3、保留了左侧的10个推广的词往往也是“商业价值较高的词”,这些词的搜索者通常本身就有一定的商业需求;
于是你在百度搜索某些“商业价值较高的词”时会发现,第一页左侧包含20结果:10个推广、10个网页快照(可能存在1个百度百科、8个自然结果、1个相关新闻) 还真是有气势。
二、百度开始对SEO敞开怀抱
一直以来无论是站长还是SEOer们都会或多或少的感到百度对SEO行为的抵制,或者退一步讲很难找到SEO和百度之间的互动渠道。而这种现象随着百度站长工具的出现,也表现出冰溶的迹象。
个人认为百度对SEO行为的抵制也是其无奈之举,数年来国内SEO的大环境一直不是很好,存在着大量的“黑帽”SEO,各种SEO作弊手段横行。
但随着百度技术的发展,很多SEO作弊手段已经可以轻易被识别,站长们也逐渐认识到采用SEO作弊手段将不会获得有效结果,这些作弊手段也在逐渐淡出市场。
在正规的SEO终于可以成为主流之际,百度自然意识到SEO的发展对于搜索引擎同样有着重要的意义。正规的SEO不仅仅是帮助网站获得较好的排名,也可以帮助搜索引擎更轻松的获得真正有价值的信息,从而提高百度的用户体验。
百度凤巢&百度站长平台的推出还只是一个开始,期望一个更开放更注重用户体验的百度出现。
文章源作者: Snoon
如转载请标明出处:达闻SEO博客-百度凤巢&百度站长平台的推出——只是一个开始
上海达闻营销版权所有
互联网中最早的应用主要考虑的是如何更好的展示内容给浏览者,以及如何帮助浏览者更好的在网络中进行导航而不至于迷失。由于技术限制,这个时候的网络对交互性考虑的非常之少。自05年以来,以ajax为代表的“新”前端技术被广泛的使用,其精神与理念更是深入网络开发与应用的每一个环节,新web时代的大幕也缓缓拉开。短短几年时间,从googleMail、googleMaps、googleDocs到facebook、twitter,各种新的web应用程序不断带给用户更接近桌面应用程序的使用体验。用户体验则被提高到一个史无前例的地位,成为影响一个网站或者web应用生死的决定性因素之一。
文章源作者: wujia
如转载请标明出处:达闻SEO博客-简单明了是良好用户体验的第一步:从输入表单谈起—未完成…orz
上海达闻营销版权所有

