中文blog搜索引擎再比较

Wednesday, February 15th, 2006 | Chitchat on IT

去年7月的时候曾经写过一篇Blog中文搜索引擎简单比较,半年多过去了,Google推出了自己的blog搜索引擎,Baidu还没有这方面的动作,Technorati在不断地改进,在国内也出现了奇波、中客、博搜等新的中文blog搜索引擎。

我选取了昨天blog圈的一个热门话题“google 黑板报”再进行一次简单的搜索比较,不过从结果上看,国内的blog搜索引擎不但没有改进,反而在退步。

测试评价的标准是收录的相关文章数量以及是否收录黑板报CWR以及keso的三篇相关文章,分别判断其对blogger.com, 国内BSP以及独立域名Blog的收录能力,当然这三篇文章未必具有代表性,只是作个很简单的判断。(update:本来以为黑板报是使用独立域名的blogger.com服务,不过刚才看看可能不是)

    先看几个主要的英文搜索引擎

  • Technorati:得到503个结果,不过剔除非相关结果后,实际搜索结果约70个,三篇文章均有收录;
  • icerocket: 得到61个结果,剔出非相关结果后,实际结果50个,似乎未收录黑板报与keso的文章;
  • Feedster:仅得到3条结果,Feedster这样的搜索能力要到中国拓展市场也不是什么好事啊,呵呵;
  • Google Blogsearch:得到125个结果,实际相关结果约85个,三篇文章均有收录;
  • Yahoo Blogsearch:上次比较中使用的Yahoo RSSsearch不知何故这次出不了任何结果,是用Yahoo Blogsearch得到6条结果,其中一条重复结果,全部相关,收录了keso以及CWR的文章。
  • 上次测试中还比较过的Blogline、Blogpulse,由于搜索效果差,就不一一列出。

    再看几个中文搜索引擎服务的结果

  • 八方:这是上次测试中表现最好的国内搜索引擎,但这次却只有5条结果,而且全部为不相关结果,几乎都是spam blog;
  • Grassland:得到7条结果,全部相关,但三篇文章均未收录;
  • Feedsearch.net:得到11条结果,全部相关,但三篇文章均未收录;
  • Feedss:得到10050条结果,但其中没有任何相关结果;
  • Rsshow:无任何结果
  • Booso:出错(Service Temporarily Unavailable);(Update: Booso得到数万条结果,但没有任何相关结果)
  • 号称最大的blog搜索引擎中客网:得到7条结果,无任何相关结果;
  • OKRSS:无任何结果
  • 李安科的奇波:得到6条相关结果,全部相关,三篇文章均未收录
  • 七搜八搜:得到大约10条相关结果,三篇文章均未收录

比较的结果,很明显是Google Blogsearch和Technorati胜出,上次的赢家icerocket开始落伍了,而国内的所有服务商全线溃败,而且输得非常彻底。Blog搜索有没有独立的商业模式,我们姑且不论,但两次比较的结果至少说明要做好blog搜索引擎并不容易,甚至由于其实时性以及大量更新的特点,要比普通的网页搜索更难做好。或许我们需要等待百度的blog搜索引擎?

如果还有哪个中文blog搜索引擎我漏掉的话,欢迎大家指出,我再补充进去。

ps. 由于technorati、Google Blogsearch以及Icerocket的收录结果在不断更新,所以你们再去搜索的时候结果可能与我作测试的时候有所不同。
再ps. 大家可以玩玩这个中文搜索引擎比较的小游戏

Tags: , , , , , , , , , , , , , ,

22 Comments to 中文blog搜索引擎再比较

guest
February 15, 2006

“当然这三篇文章未必具有代便行”
里面有个错字哦

campus
February 15, 2006

google 黑板报不一定是blogger.com吧?

好象是dreamhost的主机.

loverty
February 15, 2006

黑板报是用blogger发布系统发布的,可能主机不是Google的。

yasker
February 15, 2006

有点问题,http://segame.phx.cn/结果很奇怪。
我用 萨特 作为关键词,只有yahoo全部相关了。google一塌糊涂,但是我记得google当时我试的也是全部相关哪……
再试一下,用英文google和中文google都是全部相关,google.cn由于种种奇怪的原因,我登不上
但是这个“比较游戏”怎么回事呢?

[...] [...]

WP
February 15, 2006

不错学到不少东西!

Yong Liu
February 16, 2006

理解搜索引擎的人都知道,收录速度只是衡量SE的一个指标之一,并且不是一个很重要的指标。以前的一个标准衡量准则叫做TREC,衡量一个引擎对此文档集的索引速度和准确度。

Blog搜索应该和一般搜索有差别,但如何衡量Blog搜索仍然是个问题。

Datou
February 16, 2006

很专业的比较,如果比较因素能够细分化,比如搜索结果的实时性、全面度、搜索时间、排序规则等,就更完美了。

guest
February 16, 2006

http://www.scenda.cn,帮忙看看结果怎样?!

babyfish
February 16, 2006

看很久了你的博客,一直用RSS订阅,今天打开你的网页,现在的BLOG头。。呵呵,我不知道称为什么,很好看,喜欢那样的倒影和字体

scxp
February 16, 2006

哥们,你这个已经挺详细了,最近我正好搞了个集成搜索引擎,这里先谢过了。

nortuen
February 16, 2006

这跟资源投入有很大的关系,国内的有钱人不认为blogsearch有商机.硬件资源的比例太大了,10000台机器和1台机器比抓取更新速度,所以不能过于埋怨国内的服务商

feedss
February 17, 2006

feedss.com最近没有更新索引,抱歉!

song
February 17, 2006

这个还可以。
http://www.bolaa.com

[...] The details of the comparision can be found in my Chinese blog. The winner goes to GBS and Technorati with 85 and 70 results, icerocket followed with 50 results. But all the China’s blog search engines sucks, the best one only returns 11 results. (Note: all the results are base on the time I made the comparision, that is in the morning of Feb. 15, 2006) [...]

123goo.com
February 18, 2006

博客不要搜索而要列表,或收藏

http://www.123goo.com

最专业权威的中文网址导航

zeal
February 24, 2006

感觉现在的blog search,即便如google这样的搜索高手,做出来的结果也不是很令人满意。更多时候我还是愿意使用传统的搜索引擎来寻找内容。

BLOG
April 3, 2006

BLOG收录站http://www.bestsite.cn,希望与该站做链接。现在申请加入,你的BLOG将出现在首页

Allen
May 10, 2006

welcome to my blog!

虚拟主机
June 27, 2006

博客不要搜索而要列表,或收藏

ABAN
December 12, 2006

我想问问你感觉ICEROCKET 的潜力有多大

我做域名投资的
有他的中文域名!!

FackWeb
January 24, 2007

一、搜索响应时间
随手测试了下,网易的有道和百度的博客频道以及奇虎搜索在响应时间上,有着一定的优势。大多数的结果都会在0.05秒以下,博狗紧随其后在0.03-0.07区间内,Souyo则响应相对有些迟缓大致上会在1秒上下。

百度 ★★★★★
有道 ★★★★★
奇虎 ★★★★★
博狗 ★★★★
搜游 ★★★

Leave a comment

Search

Google Friend Connect

RSS My Del.icio.us