2019年10月25日,谷歌发布了一种新的搜索算法 BERT,已经用于生产环境。这种算法最大的特点,就是考虑了搜索词的语序。以前的算法只考虑每个词本身,搜索hello world与搜索world hello,结果是一样的。) v& G4 m5 L( f; T8 d
9 K2 G$ w; Q$ o% q. j' J. |# u9 w
1 |; o! X2 F/ k但是很多时候,语序是搜索结果的关键因素之一。上图搜索"巴西游客去美国的签证",里面的单词to表示语序。传统的搜索算法往往识别不了这个to,搜索的第一个结果是美国游客去巴西不需要签证,新算法的第一个搜索结果则是美国大使馆的签证网页。+ D$ J* N. C H i5 M9 c: _! i
, o) y5 z+ ]9 K: l v" m- `) ~$ L
目前,这种算法只对英语搜索有效,后面会扩展到其他语言。