2019年10月25日,谷歌发布了一种新的搜索算法 BERT,已经用于生产环境。这种算法最大的特点,就是考虑了搜索词的语序。以前的算法只考虑每个词本身,搜索hello world与搜索world hello,结果是一样的。& W: w. ]6 E7 w2 ?& |; W1 g
/ g; ` p( e, h* V, S, C" s1 q/ \. X) v- T9 D2 Q( o
但是很多时候,语序是搜索结果的关键因素之一。上图搜索"巴西游客去美国的签证",里面的单词to表示语序。传统的搜索算法往往识别不了这个to,搜索的第一个结果是美国游客去巴西不需要签证,新算法的第一个搜索结果则是美国大使馆的签证网页。. a F! x! T. L
" m1 W+ j- }0 a3 {% \1 \5 I+ Z) B目前,这种算法只对英语搜索有效,后面会扩展到其他语言。 |