User:Beizhigai

维基百科,自由的百科全书

--Beizhigai留言) 2013年1月20日 (日) 13:52 (UTC)我是这样的一个人啊http://u.cyzone.cn/space.php?uid=228708&do=blog&id=529220 [[

]] 只不过这个过滤器(filter)太庞大了。而Facebook之所以能把其图谱搜索的实质转化成分类检索和过滤,还是因为它根本不需要抓取其它任何外部网站的信息,一句话,Facebook就是整个数字世界。

它是怎么做到这一点的?

原因是:Facebook的10亿用户,每个人都是Facebook的爬虫。Facebook不需要爬取外部网站的任何信息,就知道这个世界上发生了什么。最近两岸三地在热映《一代宗师》、NFL下周末将有一场新的决赛、旧金山的Inner Richmond的街区又开了一家新的墨西哥餐厅……Facebook并没有努力去知道这些,这些都是你们——10亿Facebook的用户,只要有人Like或分享了这些信息,就等于这些用户扮演了搜索引擎的蜘蛛爬虫,主动把这些信息爬给了Facebook。也就是说,10亿用户带给了Facebook 2000亿张图片,上完亿条信息流和20000万人与人的关系链接,这些数据背后的信息,Facebook不费吹灰之力就知道了。

这就是Facebook敢在自己的围墙花园里将搜索变为分类过滤的原因。当然了,Facebook会告诉你,这叫“为每个人呈现不同的搜索结果”。