2004年,作为互联网上第二大应用的搜索发生了哪些变化?年初,Google推出了区域搜索;年中,中搜和Google的桌面搜索越炒越火,搜狗则宣布启动第三代搜索引擎;年底,微软亚洲研究院正式把“互联网搜索和挖掘”纳入其主要研究方向…… 一场场造势运动给人以箭在弦上、蓄势待发的感觉,而其瞄准的靶心无疑是2005,第三代搜索引擎全面启动之年。 超链分析,历史的过客 曾有国外的第三方机构对搜索引擎网站进行了一次隐式测评,即拿掉各家网站的LOGO,让用户在没有先入概念的情况下为其搜索结果打分。没出预料的是,Google依然是这次评测的第一名;但出乎预料的是,Google只领先第二名一个百分点。这一个百分点对用户来说,几乎是察觉不到的。难道发明Pagerank技术的Google,如今的领先优势就剩这么一点了吗? 以Pagerank为代表的超链分析技术,是根据网页之间的超链关系来决定网页内容的重要程度,它在现有技术对网页内容缺乏足够认识时发挥了作用,但其理论基础并不坚实,因为这体现的是“谁的声音大,谁就代表真理”的思想,也就是谁的链接多、流量大,谁的排名就靠前。比如有关SARS的文章,新浪网上的文章会排在中华医学会网站的前面。这些事例都表明超链分析只是一种参照性技术,而无法揭露内容本身。 如果无法理解内容,也就无法做到个性化。几年来,搜索网站都在利用相似的超链分析技术对搜索结果进行排序,各家也会不时打开竞争对手的网站,查看一下别人的排序情况,思量一番再微调自己的参数。这样调来调去,各家网站的搜索结果变得越发相似。中搜总裁陈沛认为:“结果和别人不同,可能做得好;如果结果和别人相同,肯定没法做得好。第二代搜索使用的超链分析技术已经不可能实质性改善搜索质量了。” 第二代搜索行将退出历史舞台,而各种新思想和新技术则开始崭露头角。虽然它们的叫法各不相同,但其带来的第三代搜索很可能在即将到来的2005年成为主流趋势,陈沛甚至预言:“如果搜索公司在2005年下半年还没有第三代搜索技术,就有可能被淘汰掉。” 第三代搜索,回归的革命 从上世纪90年代初搜索引擎诞生至今,有数不清的公司投身其中,发明了五花八门的技术用以实现搜索,但具有划时代意义的技术只有两种,一是以人工目录分类为基础的网站搜索,它开始了互联网搜索的时代,是一次开创性的革命。二是以超链分析技术为基础的大规模网页搜索,其搜索结果的准确度从网站上升至网页,让网络用户的搜索体验充满惊喜,成为了一场开拓性的革命。 第三代搜索日益临近,关于它的概念却还没有统一的定论。但可以肯定的是,搜索引擎正在诸多方面发生着深刻的变化:搜索技术将更加智能化,搜索资源将更加广泛,搜索方式将更加便捷,专项搜索将更加丰富,接受终端也将向移动设备发展。因而即将到来的绝不是一次改良运动,而是一场改朝换代的革命,一次“回归的革命”,让搜索回归内容本身,去贴近生活和普通用户,从而也为搜索产业开拓更大的市场。 现在,微软、中搜和搜狗都在将人工智能技术融入到搜索排序当中,从而实现搜索结果的个性化。如果用户关心电影,搜索“绿茶”就会将有关电影的结果排在前面,而不是有关饮料的网页。智能化也可以实现区域搜索,虽然互联网是跨区域的,但是内容和服务却是本地化的。如果搜索“川菜馆”,搜索引擎把全世界的川菜馆都给用户,那么大部分结果都将是垃圾。 |