谷歌:Bing欺骗,复制我们的搜索结果 2017-03-03 02:01:29

$888.88
所属分类 :奇闻

谷歌已经进行了一项刺激行动,据说Bing一直在观察人们在Google搜索的内容,他们从谷歌搜索结果中选择的网站,然后使用这些信息来改进Bing自己的搜索列表Bing并没有否认这一点

明显的监控,Bing的相关性可能会在谷歌自己的工作背后有所改善(或者变得更糟)谷歌把它比作数字相当于Bing在考试期间倾斜并抄袭Google的考试“我的职业生涯一直在追求一个优秀的搜索引擎,“负责监管搜索引擎排名算法的谷歌研究员Amit Singhal说道

”我对开发创新算法的竞争对手没有任何问题但是复制不是创新,在我的书中“Bing并不否认谷歌的声称事实上,微软Bing搜索引擎主管Stefan Weitz昨天通过电子邮件发送给我的声明似乎证实了这一指控:正如你可能想象的那样当我们考虑排名时,我们会使用多种信号和方法,但与此行业的其他参与者一样,我们不会深入细致地了解我们的行为

显然,我们的首要目标是做得更好确定搜索意图的工作,因此我们可以猜测给定查询的最佳和最相关的答案像[Bing]工具栏这样的选择加入程序可以帮助我们使用点击流数据,这是我们和其他搜索引擎使用的众多输入信号之一帮助排名网站这个“谷歌实验”似乎是混淆和操纵其中一些信号的黑客今天晚些时候,我可能会有更详细的回应来自Bing微软希望在今天举办的搜索活动之后进一步讨论更多关于这个事件,以及我在开始之前如何报道谷歌的调查结果,就在这个故事的结尾

但首先,谷歌的调查是如何展开的

后记:Bing:为什么谷歌在其指责中的错误是后续的故事来自与Bing交谈请务必在此之后阅读它你还可以在本文末尾找到另一个链接

去​​年5月下旬,谷歌告诉我,它开始注意到Bing似乎在返回时做得非常好当有人输入不寻常的拼写错误时,谷歌会列出相同的网站例如,考虑搜索躯干,这会导致谷歌返回:在上面的示例中,谷歌搜索了正确的拼写 - tarsorrhaphy - 即使输入了躯干,请注意纠正拼写的顶部列表是关于维基百科上的医疗程序的页面,拼写错误未得到纠正 - 但不知何故,Bing设法在其结果的顶部列出相同的维基百科页面,因为谷歌正在更正拼写结果: 得到它了

尽管单词拼写错误 - 并且错误拼写没有得到纠正 - 但Bing仍然设法从维基百科的结果顶部获得正确的页面,这是从网络上找到的四个总页面之一

它是如何做到的

谷歌认为它拥有所有搜索引擎中最好的拼写纠正系统,这一点令人自豪,谷歌甚至声称它甚至可以纠正从未被搜索过的拼写错误,之后拼写纠正团队的工程师密切关注他们是否'以不同寻常的条件赢得竞争对手因此,当Bing拼写错误拼写 - 例如上面 - 开始产生与谷歌相同的结果时,工程师中出现了红旗

2010年10月,当谷歌告诉我注意到它时,更多的红旗上升了两个主要竞争指标的显着增长在各种搜索中,Bing显示出与前几个月相比,谷歌前十大结果的重叠程度要大得多

此外,谷歌和必应全面列出的这一比例有所增加排在第一位的相同页面Bing并没有像谷歌那样拥有完全相同的搜索结果有大量的查询,其中列表有很大的不同然而,这一增长表明Bing对其搜索算法做了一些改变,导致其结果更像谷歌

现在谷歌开始强烈怀疑Bing可能以某种方式复制其结果,特别是通过观察人们的情况在谷歌搜索似乎没有任何其他方式可以与谷歌进行类似的匹配,特别是在拼写纠正发生的情况下 谷歌认为微软的Internet Explorer浏览器是其中的一部分不知何故,IE用户可能已将他们在谷歌上所做的数据发送给Bing特别是谷歌告诉我它怀疑IE或推特工具栏中的推荐网站功能可能要做到这一点为了验证它的怀疑,谷歌设置了一个刺痛操作谷歌在其历史上第一次制作了一次性代码,允许它手动对某个术语的页面进行排名(代码将很快被删除,如下面进一步描述)然后它创建了大约100个所谓的“合成”搜索,查询很少人,如果有人,将进入谷歌这些搜索没有返回谷歌或必应的匹配 - 或少数质量差的匹配,在少数情况下 - 在实验开始之前启用代码后,Google将蜜罐页面显示在每个合成搜索的顶部

这些页面出现在Google上的唯一原因是因为谷歌被迫他们在那里没有任何东西可以让他们自然地与这些搜索相关如果他们开始在谷歌之后出现在Bing上,那就意味着Bing接受了Google的诱饵并复制了其结果这一切都发生在12月当实验准备就绪时,大约20 Google工程师被告知要在家中使用笔记本电脑运行测试查询,使用Internet Explorer,建议站点和Bing工具栏都已启用

他们还被告知点击最高结果他们从12月17日开始到12月31日,一些结果开始出现在Bing这里是一个例子,我在写这篇文章时仍然有效,hiybbprqag在谷歌:和Bing完全匹配:这是另一个,对于谷歌的mbzrxpgjys:和Bing的同一场比赛:这是另外一场,这次对于indoswiftjobinproduction,在谷歌:在Bing:要明确,在测试开始之前,这些查询在Google或Bing上发现了一些或者一些质量差的结果然后Google进行了手动更改,所以在特定页面上会出现在这些搜索的顶部,即使该网站与搜索无关在两周之后,其中一些页面开始出现在Bing上以进行这些搜索它强烈暗示Bing正在复制Google的搜索结果通过观看一些人通过Internet Explorer在谷歌上做的事情只有少数测试搜索产生了这个结果,大约7到9个(取决于谷歌检查的时间)100个谷歌说它不知道为什么他们没有一切正常,但即使只有少数出现,也足以让公司相信Bing正在复制其结果正如我之前所写的那样,Bing对于许多查询而言与Google完全相同这表明即使Bing在谷歌使用搜索活动为了改善其结果,这只是众多信号中的一个被认为是搜索引擎都有排名算法,使用各种信号来确定哪些页面应该首先在页面上使用哪些单词

有多少链接指向该页面

估计这些链接有多重要

指向页面的链接中出现了哪些单词

估计网站有多重要

这些只是Bing和谷歌使用谷歌测试的一些信号表明,当Bing有许多传统信号时,可能是流行的搜索主题,它主要依赖于那些但是在Bing有较少可信赖信号的情况下,例如作为“长尾”搜索带来更少的匹配,然后Bing可能更倾向于谷歌如何为这些搜索排名页面如果除了谷歌排名之外没有其他信号,例如谷歌测试的综合查询,那么谷歌“信号”可能会更多通过互联网浏览器用户知道他们可能会像谷歌宣称的那样帮助必应吗

从技术上讲,是的 - 尽管我可以明确告诉,绝对不是Internet Explorer明确表示(对于那些懒得阅读其隐私政策的人),默认情况下,它会捕获一些浏览数据,除非您关闭某些功能

如果您启用了某些功能,也会收集更多数据建议网站是Bing可能收集有关Google上发生的事情的可能方式之一这是一个功能(如右图所示),建议其他网站访问,基于您的网站正在查看Microsoft确实披露了推荐网站收集有关您访问的网站的信息 根据隐私政策:当建议的网站开启时,您访问的网站的地址将与标准计算机信息一起发送给Microsoft为了保护您的隐私,信息在发送到与网址相关的Microsoft信息时会被加密,例如可能包含您在表单中输入的搜索字词或数据例如,如果您访问了Microsoft.com搜索网站http:// searchmicrosoftcom并输入“Seattle”作为搜索字词,则完整地址为http:// searchmicrosoftcom / resultsaspx

q =西雅图&qsc0 = 0&FORM = QBMH1&mkt = en-US将被发送我已经加粗关键部分您正在搜索的内容被发送给Microsoft即使提供的示例涉及在Microsoftcom上搜索,该策略也不会阻止任何搜索 - 包括谷歌的那些 - 从被发送回来有意义的是,建议的网站功能需要报告您正在查看的网址,否则,它不知道哪个页面向您显示su谷歌工具栏的ggestions做同样的事情,告诉谷歌你正在查看哪个页面,如果你启用了PageRank功能但是要监控你在搜索结果中点击的内容

没有理由我可以看到推荐网站这样做 - 如果它确实这样做但是即使它确实记录了点击次数,微软可能会认为这是政策允许收集的“标准计算机信息”还有Bing吧 - 一个Bing工具栏 - 微软鼓励人们从Internet Explorer单独安装(IE可能会通过某些合作伙伴交易预先安装它)当您安装工具栏时,默认设置为收集信息以“改善”您的体验,因为您可以请参阅:安装页面重点介绍将收集的内容及其使用方法:“通过允许我们收集有关您的系统配置,您执行的搜索,您访问的网站以及如何使用的其他信息来改善您的个性化内容在线体验您使用我们的软件我们还将使用这些信息来帮助改进我们的产品和服务“再次,我已经加强了关于Bing Bar colle数据的了解更多页面的关键部分具有讽刺意味的是,这比直接在安装页面上说的要少

很难说收集有关人们在谷歌搜索的内容的信息没有被涵盖技术上,没有什么误导 - 即使Bing出于显而易见的原因,并没有明确表示为了改善搜索结果,它可能会查看Bing Bar用户在Google上搜索的内容并点击其中Google拥有自己的Google工具栏以及Chrome浏览器因此我问Google它是否采用了它认为的相同类型的监控Bing有没有改善谷歌的搜索结果

“绝对不是PageRank功能会发回网址,但我们从未使用这些网址或数据将结果放在Google的搜索结果页面上我们不会这样做,我们也不会这样做,”Singhal实际上说,谷歌此前曾表示过工具栏确实在排名中发挥作用Google使用工具栏数据部分来衡量网站速度 - 网站速度是Google去年开始使用的排名信号相反,Singhal似乎在说工具栏看到的网址没有被使用用于查找要编入索引的页面(谷歌长期以来一直拒绝)或者以某种方式找到要添加到搜索结果中的新结果对于Chrome,谷歌说同样的事情 - 没有用于提高搜索排名的信息回来事实上,Google强调唯一可以从Chrome流回的信息是人们在浏览器中搜索的内容,如果他们使用Google作为他们的搜索引擎Postscript:请参阅Google工具栏:我们不使用Bing的Se拱门可以说,谷歌对整个局势非常不满,这确实引发了一系列问题

其中一个问题是,Bing似乎在做违法行为吗

Singhal“犹豫不决”地表示,因为Google在技术上没有丢失任何东西它仍然有自己的结果,即使它感觉Bing模仿他们如果它不是非法的,Bing可能会做的不公平,不知何故在搜索游戏中作弊

一方面,你可以说它非常聪明为什么不把我们选择的东西作为谷歌作为信号的最佳结果呢

这很聪明确实,我很确定我们过去曾经提供过各种小型服务,这些服务可以让人们为各种搜索引擎的最佳选择添加书签谷歌并不认为它很聪明 “这对我来说是欺骗,因为我们工作非常努力并且已经这么做了多年,但他们只是基于我们的辛勤工作到达那里,”Singhal说道,“我不知道怎么称呼它,但简单而简单的作弊另一个类比是这就像跑马拉松并背着其他人一样,他们在终点线前跳了起来“特别是谷歌似乎最关心的是挖掘用户数据对其网站的影响可能会对Bing的长尾影响最大搜索,Google认为有效的独特搜索特别难以区分自己现在谷歌的测试已经完成,它将删除它添加的一次性代码以允许种植蜜罐页面谷歌多年来自豪地声称它没有这样的能力,作为让其排名算法做出决定的证据它没有计划保持这种新能力并且想要杀死它,所以事情又回到了“正常”谷歌也向我强调,这些代码只适用于这个有限的综合查询集 - 并且它有一个额外的故障保护如果任何测试查询由于某种原因突然变得更加温和,该查询的蜜罐页面将不再显示这意味着如果您测试上面的查询,您可能不再在谷歌看到相同的结果但是,我在写这篇文章之前确实看到了所有这些结果,还有一些我没有做过屏幕截图的其他结果所以我昨天做了几个其他的编辑器是什么促使谷歌现在向前迈进了跟我谈谈它的实验

今天破坏Bing的大型搜索活动的宏伟计划

一种聪明的方式来分散目前关于其搜索质量的讨论

只是时间的巧合

最后,无论你如何相信谷歌现在谈论的原因并不重要,更重要的问题是你是否相信必应是在做什么才是公平竞争但是这是一个奇怪的背景故事回想一下,谷歌在12月31日确认了它的实验第二天 - 元旦 - TechCrunch从客座作家Vivek Wadhwa发表了一篇名为“为什么我们迫切需要一个新的(和更好的)Google”的文章,赞扬Blekko拥有比谷歌更好的日期搜索功能,并且总体上描绘了谷歌相关性的整体情况我怀疑谷歌有任何想法,Wadhwa的文章即将到来,我几乎肯定Wadhwa不知道谷歌对Bing的测试但他的文章引发了一波“谷歌的结果糟糕”的帖子来自谷歌的故事谷歌的杰夫阿特伍德恐怖出现在1月3日; Instileaper的Marco Arment于1月5日发布垃圾邮件,这是一篇关于垃圾邮件的网络搜索网站

多人误报道Paul Kedrosky在2009年12月发表的一篇关于努力研究洗碗机的文章,同时也是当前潮流的一部分

事实并非如此,但在1月份11,Kedrosky在Curation中充满了新的想法,新的搜索是新的策略波浪一直在继续它仍在继续沿途,Search Engine Land本身有几个部分,1月12日Conrad Saam的专栏,Google vs Bing:高级搜索引擎的谬误,得到了很多关注在其中,他对20个搜索做了一个简短的调查,并得出结论,Google和Bing并没有那么不同

在该专栏出现后的第二天,我接到了谷歌的电话我是否有是时候谈谈他们想要告诉我的事情,与相关性有关吗

当然检查我的日历,我说1月27日 - 星期四 - 对我来说是一个好时机,我可以从我在南加州工作的地方飞到谷歌的山景校园

第二天,Bing联系了我他们正在二月举办活动1谈谈搜索的状态,并希望确保我保存了日期,以防我想出现它我说我做到了我后来才知道这个活动是由Wadhwa组织的,作者是TechCrunch文章谷歌的一个变化将我的会议转移到了上周五的1月28日

正如我访问Google时的典型情况一样,我有很多不同的会议来讨论各种产品和问题我当天的最后一次会议是与Singhal和Cutts - 他们分享了我上面描述的所有内容,解释这是Google和Bing看起来如此相似的一个原因,因为我们的专栏作家发现是的,他们希望在Bing事件发生之前将消息发布 - 这是Google正在参与的事件在他们认为这对于搜索质量的整体讨论很重要 但是这个消息的时间非常接近事件发生在我可以去谷歌旅行的时候如果我能够早些进入,那么我可能在一周前写过这个

同时,你有Wadhwa的TechCrunch文章以及他正在组织的Bing事件的奇怪时机我不知道Wadhwa在他的文章发布之前是否被预定去做Bing事件,或者他之后是否签约这样做,也许是因为Bing看到了关于Google质量的争论开始并决定骑它很好我会试着找出最后,无论出于何种原因,谷歌的实验和Bing的事件的发现都在相互碰撞,正好在重新关注搜索质量的焦点中间这一切都计划好了吗

谷歌和必应的游戏技巧

奇怪的巧合

我跟巧合,我自己[后记:Wadhwa发推文说事件的时间是巧合而且让我补充一下,我的假设真的是这一切都是巧合,我指出它主要是因为有这么多疯狂的事情都发生在同时,有些人将不可避免地尝试连接毫无疑问Google和Bing都会玩公关游戏但是我认为现在正在发生的事情是,各种各样的发展都会在同一时间汇集在一起​​

如果那场风暴让人们专注于要求更好的搜索质量,我很高兴]最后,我对谷歌的观点表示同情,即Bing正在做一些我不应该写的事情,我写的每个搜索引擎都有自己的“搜索”声音,“它提供的一组独特的搜索结果,基于其文档集合和自己特定的排名方法,我喜欢的搜索引擎每个都有自己的声音雅虎的最糟糕的事情之一去年Bing的结果是在美国(以及世界上许多国家),我们突然只有两个搜索声音:谷歌和Bing的15年,我已经覆盖了搜索在所有这些时间,我们从来没有像我们现在这么少的搜索声音在某一点上,我们有超过10个这是我喜欢Blekko发布的一件事它给了我们一个全新的搜索声音当Bing在2009年推出时,这个笑话就是那个Bing代表“因为它不是谷歌”或“但它不是谷歌”挖掘Google的搜索使我想知道这个笑话是否应该改为“Bing Is Now Google”我认为Bing应该开发自己的搜索语音而不使用Google作为调整叉子这对我来说并不合适但是我期待与Bing更多地谈论这个问题,并希望从他们那里更清楚地了解他们可能正在做什么以及他们对它的看法从Real Genius打开图像他们正在接受测试没有任何建议在谷歌很酷的克里斯奈特或Bing是dorky肯特(或反之亦然)这是一部伟大的电影你甚至可以在这里免费观看Crackle相关故事:后记:Bing:为什么谷歌的错误在其指责是后续的故事与Bing交谈除了这个故事,请务必阅读