Blekko阻止更多“垃圾邮件”域:其中有110万 2017-01-14 04:10:25

$888.88
所属分类 :奇闻

搜索引擎Blekko已经宣布它已经使用一个名为“AdSpam”的新系统阻止其搜索结果中的1100万个网站,如果他们没有通过集合来自任何网站的新页面将不会被添加来自Blekko新闻稿:“这项新技术将在垃圾邮件显示在搜索结果页面之前阻止垃圾邮件,”Blekko首席执行官Rich Skrenta表示,“我们已经通过算法识别了索引中每个页面的多个垃圾邮件信号

从我们的索引中删除了这些域名大大清理了我们的搜索结果“并且来自公司的博客文章:今天,随着Blekko的新AdSpam算法的推出,我们迈出了新的一步

这项新技术将极大地改变搜索这是有史以来第一个发现垃圾邮件的搜索算法比排名结果该算法专门设计用于识别垃圾邮件页面,并在它们出现在搜索结果中之前将其消除

这很有趣,这个想法在将垃圾邮件页面添加到搜索索引之前阻止垃圾邮件页面它可能以前已经完成,但如果是这样,我不记得通过哪种服务当然,从来没有值得注意的事情让我回想起如果你完全保留垃圾邮件,这可能会带来更清晰的结果再说一遍,它也更有可能使Blekko受益于Google或Bing

原因是这两个搜索引擎的搜索算法都比Blekko要好得多,所以他们可能已经做得更好了尽管垃圾邮件页面本身已包含在整体可搜索索引中,但垃圾邮件仍然排在最前面的结果中 - 这就像他们收集的所有网页的一本大书更重要的是,谷歌和必应拥有庞大的资源,其中索引一百万甚至十亿个垃圾邮件页面并没有真正留下更少的“空间”来存储“好”的东西他们拥有数千个服务器存储对他们来说相对便宜但是对于Blekko来说,他们索引的每一页垃圾邮件都是如此可能更昂贵至于“AdSpam”这个名字 - 我觉得这很糟糕我的想法是这些页面装满了广告 - 但我发现它很混乱上个月,Blekko通过禁止20个“垃圾邮件”网站获得了一些关注它的索引从我们的报道然后:Rich Skrenta,Blekko的首席执行官今天证实了我们的禁令他告诉我们Blekko已经决定完全根据我们的用户点击/垃圾邮件结果禁止“排名前20的垃圾邮件网站”,其中包括ehowcom ,Demand Media的收入最高的网站之一The sites

但等等这些是排名前20的垃圾邮件网站,或者正如Blekko今天发布的那样,“前20个内容农场”两者都不会令人困惑搜索引擎垃圾邮件无论搜索引擎决定它是什么例如,Google和Bing都会考虑“隐藏”的网页 - 向用户展示的内容与他们的自动抓取工具看到的内容不同 - 是垃圾邮件双方都同意许多其他被视为垃圾邮件的策略,但他们可能不会完全同意也不会同意Blekko几乎没有从我的快速评论来看,上面的网站将被谷歌或Bing视为垃圾邮件当然谷歌导致他们中的一些人在其最近的农民/熊猫更新中失去排名但这不是因为他们在垃圾邮件谷歌这是因为他们有一些新算法决定不再像过去那样奖励的内容简而言之,低质量的内容不等于垃圾邮件,不等于Google或Bing这只是他们不会高度排名的东西,这正是他们的算法应该做的事情Blekko的初始阻止列表,它决定网站是基于用户报告的垃圾邮件,无论这些网站是否违反任何传统的搜索引擎垃圾邮件指南随着最新的举动,Blekko进一步决定低质量等于垃圾邮件再次,从帖子:那么AdSpam究竟是什么

简而言之,它是一种机器学习算法,用于检查特定垃圾邮件信号的页面 - 单个页面上存在多个展示广告位置以及内容从零到零.Blekko的方法与Google的最终结果可能与Google的目标相同保持“浅层”内容不会出现在许多搜索中,即使这些页面是收集的,Blekko也打算保持浅层内容 - 但与谷歌不同,它将“垃圾”标签应用于此类内容并阻止它从一开始就被编入索引 在纽约时报上,克莱尔·凯恩·米勒在Blekko的行动以及好的网站是否可能受到伤害方面做得很好.Blekko说:虽然看起来许多合法网站在这种算法下可能被视为垃圾邮件 - 报纸涵盖了各种各样的例如,许多博客可能都是业余作家,但他们都是各自领域的专家 - 斯克伦塔先生说,当他梳理数千个算法禁止的网站时,他发现只有两个误报,Blekko现在禁止的网站示例:便宜-refrigeratorsnet,best-weddinggifts和Bostondiningguidecom我没有做过任何广泛的测试但注意到上面的廉价冰箱网站的名称被确认为删除 - “冰箱购买提示” - 我认为搜索该主题可能是有趣的是:你可以点击放大图片我删除了Blekko和谷歌的结果顶部的广告,这样你就可以专注于前五的编辑结果我的观点:Blekko Google对不起,Blekko - 我不能说放弃那个冰箱网站,更不用说其他100万左右的其他网站,帮助你对谷歌这个特定的查询提供帮助 - 使用/ reviews斜杠标签确实有帮助 - 它得到了谷歌必须首先列出的好网站之一但谷歌在前五名结果中的其他三个好网站没有显示,而且,大多数典型的搜索者都不会使用斜杠 - 而且还有更少的理由当谷歌的同一搜索带来更好的结果时,使用它们,不需要斜线标签Blekko的帖子也说:与其他搜索引擎使用的算法不同,AdSpam正在与人类策展一起使用以检测继续垃圾邮件的真实 - Blekko正在利用人类的努力来决定什么是好的和坏的特别是,Blekko最近与Stack Exchange(以前的Stack Overlow)合作进行编程和技术主题的策划

期待Google推迟整个“它没有人类”的方面,然而它之前已经完成了,最后一次Mahalo和Search Wikia尝试了这个角度谷歌强调它有人类审稿人,他们在计算机算法上作为一种“仔细检查”它做出的改变,例如谷歌最近在制作农民更新时再次强调这一点,强调基于计算机的变化似乎得到了人类数据的支持,它试图模仿谷歌也建议人们阻止使用其Chrome个人阻止列表扩展可能是其搜索算法中使用的数据,在未来仍然,谷歌没有像Blekko提供的斜杠标签那样,Blekko尚未证明这种策展正在变成更高质量的结果,吸引了大量用户谷歌,更不用说Bing了但是在公关方面,毫无疑问Blekko的举动正在给谷歌施加压力以改善我也没有机会与B谈话lekko更多关于这个系统,因为我目前正在圣何塞Blekko的SMX West搜索营销会议 - 以及谷歌和Bing - 明天参加我们的“垃圾邮件警察”和“询问搜索引擎”会议,所以我希望更多具体的引擎盖下的详细信息将从Stay调整出来(并且还关注Techmeme上的相关报道)另外,请参阅下面的文章,了解我上面提到的一些事情的更多背景知识