研究问,你能相信谷歌的个性化搜索结果吗? 2016-09-11 07:23:22

$888.88
所属分类 :奇闻

旨在分析谷歌个性化搜索结果并使搜索引擎使用更加透明的过程的新研究产生了有趣和有争议的发现

该研究审查了一些关于个性化的普遍观念,包括个性化是微妙的,它经常表面的想法更多的长尾结果,个性化完全基于一个人过去的搜索和网页浏览行为主要结论之一:尽管个性化的结果,对于大多数人来说,搜索质量一直在下降,结果不那么个性化,反映了更多的标准化谷歌比以往任何时候都更加中心化,个性化搜索比搜索者更有利于广告商的利益 - 即使在查看有机结果并在搜索结果页面上排除付费的AdWords列表时该研究由研究人员Martin Feuz和大学的Matthew Fuller撰写

伦敦和苏黎世艺术大学的Felix Stalder,专注于e鉴于其在全球范围内的巨大影响力,谷歌的研究结果非常有用,但该研究提供了有关搜索的有趣见解

重要的是要注意“个性化”在搜索结果方面有很多含义今天,您看到的个性化搜索结果受到您自己的影响很大在线行为但搜索引擎总是汇总和分析来自所有用户的数据,以帮助提高整体相关性,使用协作过滤,链接流行等技术甚至PageRank是一种聚合分析形式,计算内容创建者的“投票”(链接) )而不是查看搜索者的行为谷歌最初开始跟踪2005年4月用谷歌帐户登录的用户的搜索历史记录当年6月,它引入了基于搜索历史的个性化搜索作为谷歌实验室实验个性化搜索从实验室毕业成为2007年初所有登录用户都可以使用的功能最初,个性化是主要基于您的搜索历史记录和您倾向于点击的结果,以及您的Google书签以及您可能添加到个人iGoogle主页的任何内容Google还声称个性化很微妙 - “我们以前做过的事情谷歌副总裁玛丽莎梅尔当时表示2007年4月谷歌大幅扩展了有关用户的信息,不仅仅是跟踪搜索历史记录并监控所有内容,他们正在考虑两到三个适合您口味并注入其中的结果

用户在网络上做了这大大增加了Google可用于微调个性化搜索结果的数据您可以(现在仍然可以)选择退出Google收集您的网络历史记录并通过管理您的Google帐户来个性化结果,但您必须拥有一个帐户首先要管理这个问题2009年末,谷歌开始为每个人个性化搜索结果,无论是否登录到Google帐户对于任何给定的查询,不再有任何“标准”或“典型”的谷歌搜索结果有点讽刺的是,除非你创建并登录谷歌帐户,否则无法选择退出个性化搜索结果最近,谷歌已经尝试为其许多产品和服务添加个性化,包括本地和产品搜索结果(使用您的IP地址或GPS坐标的位置),其个性化推荐引擎Hotpot和许多其他人访问我们的会员库了解有关Google个性化工作的更多信息研究人员首先认为谷歌并不是真正从事搜索引擎运营的行业 - 相反,它是一家以“受众”(搜索者)为主要商品的广告公司,就像电视节目制作一样,制作费用昂贵免费赠送以吸引观众,算法搜索结果服务于同一目的,并由重视机会的广告商“付费”通过自然搜索结果宣传他们的产品和服务随着广告越贴切,搜索结果越有价值,谷歌和广告商的搜索结果越多,个性化搜索结果就是针对用户的一种方式根据研究人员的说法,个性化结果Google构建用户的三维配置文件首先,知识人员,您根据查询和点击流数据感兴趣的内容 第二,社交人 - 你通过电子邮件,社交网络和其他通信工具连接到的人三,具体的人,你的下落由你的计算机或移动设备的物理位置决定然而,研究人员声称Google正在进行通过将个人资料汇总到统计相关的群组中,将个人资料定位到统计相关群体之外,这样您的个性化搜索结果将结合您可能感兴趣的内容以及Google确定的具有相似特征的其他人,每个搜索者都能获得个性化结果,甚至可以看到对于相同的关键词有时会产生不同的结果,问题是如何实际检测哪些结果是基于用户行为的,哪些是“非个性化的”结果为了实现这一点,研究人员以着名哲学家的形式创造了三个人物角色:每个人都来自18,19和20世纪用于生成e的网络历史的搜索术语哲学家基于每个哲学家的七本书的索引在“培训课程”之后,允许谷歌为每个哲学家建立搜索历史,结果与“匿名用户”进行比较,“匿名用户”定义为没有登录凭据或过去历史记录的人Google服务这使研究人员能够将哲学家的个人资料与“通用”结果集进行比较(尽可能通用,因为Google会对所有搜索结果进行个性化)最后,使用三组搜索字词来比较个性化结果第一组基于培训集中的术语,所有三位哲学家都有共同点(例如美学,知识,美德等)

第二组是基于来自社会书签服务Delicious的流行标签词(例如软件,旅行,博客,等)第三组基于亚马逊关于监视,网络理论和全球民主的三本书的“统计上不可能的短语”在2009年7月的测试期间,测试期间提交了超过18,000个查询

仅考虑了第一页结果(具有讽刺意味的是,尽管谷歌长期以来一直支持外部学者的许多类型的研究,但研究人员报告称谷歌将他们的查询视为看起来“类似于来自计算机病毒或间谍软件应用程序的自动请求”)研究人员测试了三个假设,最终基于所收集的数据拒绝所有这三个假设假设1:“个性化是微妙的 - 起初你可能没有注意到任何差异”这个假设是2007年官方Google博客文章直接引用个人化工程负责人Sep Kamvar和搜索和用户体验翻译副总裁Marissa Mayer:你不会看到很多个性化的结果,特别是最初相反,研究人员发现个性化结果出现得相对较快,而且福柯人物平均收到64个个性化结果第一页中的10个结果研究人员指出,即使这些大量的个性化结果也可能不容易被用户检测到,导致他们提出“他们如何信任结果

”的问题,并得出结论大多数用户不会能够判断谷歌在其搜索结果中的个性化质量假设2:收集的用户搜索历史越多,检索的长尾内容就越多个性化的承诺是,谷歌越了解您的兴趣,就越少可能应该是你会获得“通用”结果,并且更有可能从索引中更深层次地获得更接近你所寻找的结果的结果 - 在大海捞针中寻找针头的圣杯,或者克里斯安德森称为“长尾”这实际上意味着一些个性化的搜索结果应该由谷歌在超出搜索词的前100个结果的集合中浮出水面研究人员发现事实并非如此,写道“我们的研究发现Google个人搜索似乎无法以实质性的方式提供长尾内容”为什么

它们提供了三个可能的原因,其中没有一个可能是相互排斥的:第三个结论显然是最有争议的谷歌一直坚持认为这一切都与搜索者的相关性有关,而不是关于赚钱 但谷歌也一直在寻找通过广告赚取越来越多资金的方法,如果长尾内容与“头”内容相关性较低,搜索者和广告商都不会感到高兴 - 即使个性化算法表明内容适合于给定用户基于过去的行为和假定的意图假设3:个性化仅反映个人用户过去的搜索和网络兴趣在测试过程中,哲学家们都收到了一些查询的个性化结果,即使搜索历史与搜索词之间没有关系也是如此

研究人员得出结论,谷歌已经创建了一段时间的群组资料,这些资料不仅与搜索术语有关,还与其他人口统计信息和社会偏好有关,例如年龄,收入,首选度假目的地等

与真正的个性化不同,研究人员建议这种分组实际上减少了搜索结果中的多样性(因此质量)但是正如我在开始时提到的,搜索引擎有很长的汇总数据来编译组的统计概况在研究人员测试的所有三个假设中,这个看起来是我们对搜索引擎如何运作的最弱和最少的支持研究人员得出的结论是个性化是“两者都发生在令人惊讶的程度,但结果相对微不足道,很可能反映出我们处于流程的早期阶段”他们还指出,由于谷歌不断变化的动态,进行这种类型的研究很困难它的算法,以及个性化本身的本质使得很难建立任何有意义的普遍基线但是继续这种类型的研究是很重要的,因为正如作者所总结的那样,“除非我们能够更新我们的研究方法和工具,否则我们无法充分解决与个性化相关的社会和政治问题以及搜索引擎的力量更广泛B.我们迫切需要做到这一点,否则搜索引擎内部和那些仅仅是强大但不​​透明机器的用户之间的知识和权力差异势必会增长“引文:语义资本主义时代的个人网络搜索:诊断个性化的机制Feuz,Martin,Fuller,Matthew,AND St​​alder,Felix“语义资本主义时代的个人网络搜索:诊断个性化机制”第一个星期一[在线],第16卷第2期(2011年2月1日)