您需要了(le)解Google的(de)新算(suàn)法

發布于:2019-11-27

Google的(de)最新算(suàn)法更新BERT可(kě)以幫助Google更好地理(lǐ)解自然語言,尤其是在語音(yīn)搜索中上起到非常大(dà)的(de)作用(yòng)。

BERT将影(yǐng)響大(dà)約10%的(de)查詢。這(zhè)也(yě)将影(yǐng)響自然排名和(hé)精選内容結果,爲用(yòng)戶帶來(lái)更好的(de)更精準的(de)信息。所以這(zhè)是不小的(de)改變!

但是您是否知道BERT不僅是任何算(suàn)法更新,還(hái)是研究論文和(hé)機器學習(xí)自然語言處理(lǐ)框架?

實際上,在實施該産品的(de)前一年,BERT引起了(le)産品搜索活動的(de)狂熱(rè)風暴。

之前有專家解釋了(le)Google的(de)BERT到底是什(shén)麽,它如何工作,如何影(yǐng)響搜索以及是否可(kě)以嘗試爲其優化(huà)内容。

了(le)解谷歌(gē)新算(suàn)法

 

搜索中的(de)BERT是什(shén)麽?

BERT代表變壓器的(de)雙向編碼器表示,實際上有很多(duō)東西。

它被廣泛稱爲Google搜索算(suàn)法成分(fēn)/ tool / framework(稱爲Google BERT),旨在幫助Search更好地理(lǐ)解Search中單詞的(de)細微差别和(hé)上下(xià)文,并使這(zhè)些查詢與有用(yòng)的(de)結果更好地匹配。

此外,BERT是Google生成的(de)自然語言處理(lǐ)NLP框架,然後将其開源,因此整個(gè)自然語言處理(lǐ)研究領域實際上可(kě)以更好地從整體上理(lǐ)解自然語言。

您可(kě)能會發現,在線上大(dà)多(duō)數BERT提及都與Google BERT更新無關。

其他(tā)研究人(rén)員(yuán)正在發表許多(duō)有關BERT的(de)實際論文,這(zhè)些論文并未使用(yòng)您認爲Google BERT算(suàn)法更新時(shí)會使用(yòng)的(de)東西。

BERT極大(dà)地促進了(le)自然語言對(duì)NLU的(de)理(lǐ)解,而Google轉向開源BERT的(de)舉動可(kě)能永遠(yuǎn)改變了(le)自然語言的(de)處理(lǐ)方式。

機器學習(xí)的(de)ML和(hé)NLP社區(qū)對(duì)BERT感到非常興奮,因爲它需要花費大(dà)量的(de)精力來(lái)進行自然語言的(de)研究。它已經對(duì)很多(duō)單詞進行了(le)預訓練,整個(gè)英語維基百科中有25億個(gè)單詞。

Vanilla BERT爲機器學習(xí)和(hé)自然語言多(duō)樣化(huà)任務中的(de)神經網絡提供了(le)預先訓練的(de)起點層。

雖然BERT已在Wikipedia上進行了(le)預培訓,但已對(duì)問題和(hé)答(dá)案數據集進行了(le)微調。

可(kě)以微調的(de)那些問答(dá)數據集之一稱爲MS MARCO:由Microsoft構建和(hé)開放源代碼的(de)人(rén)類生成的(de)機讀理(lǐ)解數據集。

研究人(rén)員(yuán)還(hái)與SQuAD(斯坦福問題解答(dá)數據集)就自然語言理(lǐ)解展開競争。BERT現在甚至超過了(le)SQuAD上的(de)人(rén)類推理(lǐ)基準。

許多(duō)主要的(de)AI公司也(yě)在構建BERT版本:

(1)Microsoft通(tōng)過MT-DNN(多(duō)任務深度神經網絡)擴展了(le)BERT 。

(2)來(lái)自Facebook的(de)RoBERTa。

(3)之所以創建SuperGLUE Benchmark是因爲原始的(de)GLUE Benchmark變得(de)太容易了(le)。

 

BERT可(kě)以解決哪些問題?

我們人(rén)類很容易理(lǐ)解某些事情,包括搜索引擎在内,機器根本無法真正理(lǐ)解。

(1)言語問題

單詞的(de)問題在于它們無處不在。越來(lái)越多(duō)的(de)内容在那裏

單詞是有問題的(de),因爲很多(duō)單詞是模棱兩可(kě)的(de),多(duō)義的(de)和(hé)同義的(de)。

Bert旨在幫助解決含糊不清的(de)句子和(hé)短語,這(zhè)些句子和(hé)短語由許多(duō)具有多(duō)種含義的(de)單詞組成。

(2)歧義和(hé)一詞多(duō)義

英語中幾乎所有其他(tā)單詞都有多(duō)種含義。用(yòng)口語來(lái)說,由于同音(yīn)詞和(hé)韻律,情況更糟。

例如,對(duì)于帶有英語口音(yīn)的(de)人(rén),“四支蠟燭”和(hé)“叉子手柄”。另一個(gè)例子:喜劇演員(yuán)的(de)笑(xiào)話(huà)主要是基于單詞的(de)玩法,因爲單詞很容易被誤解。

對(duì)于我們人(rén)類來(lái)說,這(zhè)不是一個(gè)很大(dà)的(de)挑戰,因爲我們具有常識和(hé)上下(xià)文,因此我們可(kě)以理(lǐ)解圍繞情境或對(duì)話(huà)上下(xià)文的(de)所有其他(tā)單詞,但搜索引擎和(hé)機器則沒有。

對(duì)于未來(lái)的(de)對(duì)話(huà)式搜索而言,這(zhè)并不是一個(gè)好兆頭。

 

評論展示

參與評論
  • click

660

shares

 

在線客服

服務熱(rè)線:400-8817-968

QQ客服:425827996

周一至周五:8:30-18:00

掃碼加微信咨詢

業務微信

15815846676
長(cháng)按号碼加微信

在線留言

top