Google正在使其搜索引擎更智能

谷歌的Pandu Nayak本周在其博客上宣布了他所说的“过去五年中搜索领域的最大飞跃,也是搜索历史上最大的飞跃之一”。此更新与Google搜索如何处理查询有关。

Nayak指出,人们在Google上进行搜索时会使用他所谓的“关键词”,这是因为搜索引擎无法使用限定词(例如“从”和“到”)来理解自然语言。的确,按照当前搜索的工作方式,该服务基本上会忽略这些术语,而只会专注于从查询中搜集到的关键字。

这种情况很快就会改变-至少对于美国的英语查询来说,以后还会有更多的语言和地区。Google声称,结合了神经网络在自然语言处理和专用硬件方面的最新发展,它现在可以更好地理解查询中每个单词相对于整个搜索短语的上下文。最终,这意味着它最终可以开始理解句子中“至”和“从”之类的基本限定词的重要性,而不是完全忽略它们。

这一切都可以归功于BERT-不,不是Thie Big Bang Theory的地质学家,而是Transformers的双向编码器表示-这是Google训练神经网络以理解与整个短语相关的单词的技术。以前,搜索巨头的算法倾向于以很大程度上线性的方式来解释搜索词,只相对于与其相邻的单词来理解一个单词。

在硬件方面,Google还同意 首次使用云TPU(基本上是为在神经网络上训练AI的唯一目的而创造的芯片)进行搜索查询,以便更好地处理BERT正在烹饪的所有算法复杂性起来

所有辛劳的最终结果?Google提供了上述示例,说明BERT如何有效地改善搜索结果,并使您更自然地与搜索引擎进行交流。由于对查询中的介词“ to”有更好的了解,Google现在知道该用户是巴西人,并且正打算前往美国。较旧,较不复杂的Google搜索版本会理解完全相反的内容,因此有关想要前往巴西的美国公民的信息。

这是一个微妙的差异,但这意味着世界。Google计划将这些改进应用到世界其他地方。感谢神经网络的工作原理,Nayak说,他们从在英语上使用BERT所学到的许多东西实际上可以应用于其他语言。Google已经在测试由BERT支持的韩语,印地语和葡萄牙语的小片段,并且正在看到重大改进。

版权声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。