來(lái)自一位在谷歌工作15年的對(duì)話:如果非要問(wèn)我在谷歌工作的15年里學(xué)到了什么,那一定是這句話:人們的好奇心是永無(wú)止境的。我們每天都會(huì)看到數(shù)十億次的搜索,其中15%的查詢是我們以前從未見(jiàn)過(guò)的——所以我們建立了一些方法來(lái)展示這些無(wú)法預(yù)料的查詢。
當(dāng)這樣的人來(lái)搜索時(shí),我們并不總是很確定查詢的最佳方式。我們可能不知道如何使用正確的拼寫(xiě)單詞,或者如何拼寫(xiě)一些東西,因?yàn)楹芏鄷r(shí)候,我們來(lái)搜索是為了學(xué)習(xí)——我們不一定自身一開(kāi)始就有這些知識(shí)。
搜索的核心是理解語(yǔ)言。我們的工作是弄清楚你在搜索什么,并從網(wǎng)上找到有用的信息,無(wú)論你如何拼寫(xiě)或組合你的關(guān)鍵詞。雖然多年來(lái)我們不斷提高我們的語(yǔ)言理解能力,但有時(shí)我們?nèi)匀徊荒芎芎玫乩斫馑貏e是在處理復(fù)雜的或非正式的語(yǔ)言查詢時(shí)。事實(shí)上,這就是為什么人們經(jīng)常使用“關(guān)鍵字-ese”的原因之一,即鍵入他們認(rèn)為我們能理解的字符串,但并不是他們確切要問(wèn)的問(wèn)題。
我們的研究團(tuán)隊(duì)在語(yǔ)言理解科學(xué)方面取得了最新進(jìn)展:
機(jī)器學(xué)習(xí)使這一切成為可能——我們?cè)诶斫馑阉鞯姆绞缴先〉昧孙@著的進(jìn)步,這是過(guò)去五年里最大的飛躍,也是搜索歷史上最大的飛躍之一。
將BERT模型應(yīng)用于搜索:
去年,我們引入并開(kāi)源了一種基于神經(jīng)網(wǎng)絡(luò)的自然語(yǔ)言處理(NLP)預(yù)訓(xùn)練技術(shù),我們也稱之為:BERT。簡(jiǎn)潔的說(shuō),這項(xiàng)技術(shù)可以讓任何人建立自己的最先進(jìn)的自動(dòng)問(wèn)答系統(tǒng)。
這項(xiàng)突破性的成果是谷歌transformers模型研究結(jié)果,處理一個(gè)句子中所有單詞之間的關(guān)系,而不是一個(gè)接一個(gè)地處理。
因此,BERT模型可以通過(guò)查看上下文的所有單詞來(lái)考慮完整語(yǔ)義,這對(duì)于理解搜索查詢背后的意圖特別有用。
但使這一成果成為可能的不僅僅是軟件上的進(jìn)步:我們也需要新的硬件。我們可以用BERT構(gòu)建的一些非常復(fù)雜的模型,但是也挑戰(zhàn)了我們傳統(tǒng)硬件的極限,所以我們第一次使用最新的云計(jì)算cpu來(lái)提供搜索結(jié)果,并迅速為您提供更多相關(guān)信息。
破解你的搜索:
有很多技術(shù)細(xì)節(jié),但這對(duì)你來(lái)說(shuō)意味著什么呢?通過(guò)將BERT模型應(yīng)用于搜索中的排名和特色摘要,我們能夠更好地幫助你找到有用的信息。
事實(shí)上,當(dāng)涉及到排名結(jié)果時(shí),BERT將幫助搜索引擎更好地理解美國(guó)1/10的搜索,隨著時(shí)間的推移,我們將把這一點(diǎn)引入更多的語(yǔ)言和地區(qū)。
特別是對(duì)于較長(zhǎng)的、會(huì)話性較強(qiáng)的搜索,或者在“for”和“to”等介詞對(duì)意思很重要的情況下進(jìn)行搜索時(shí),搜索引擎將能夠理解查詢語(yǔ)句中的上下文。你可以用一種你覺(jué)得很自然的方式來(lái)進(jìn)行搜索。
為了啟動(dòng)這些改進(jìn),我們做了大量測(cè)試,以確保這些更改實(shí)際上更有幫助。這里有一些例子展示了我們的評(píng)估的過(guò)程,證明了BERT理解你搜索背后意圖的能力。
以下是“2019 brazil traveler to usa need a visa”的搜索結(jié)果。“to”這個(gè)詞以及它與查詢中的其他詞之間的關(guān)系對(duì)于理解語(yǔ)義非常重要。
這是關(guān)于一個(gè)巴西人去美國(guó)旅行的故事,而不是反過(guò)來(lái)。在此之前,我們的算法無(wú)法理解這種聯(lián)系的重要性,因此我們同樣也返回了美國(guó)公民前往巴西的結(jié)果。(andy老師備注:之前的算法中,介詞是無(wú)任何意義的)。
有了BERT, 搜索引擎能夠把握這種細(xì)微差別,并且知道非常常見(jiàn)的單詞“to”在這里實(shí)際上非常重要,我們可以為這個(gè)查詢提供更相關(guān)的結(jié)果。
讓我們來(lái)看看另一個(gè)問(wèn)題:“do estheticians stand a lot at work?”,以前,我們的系統(tǒng)采用的是匹配關(guān)鍵字的方法,將結(jié)果中的“stand-alone”與查詢中的“stand”匹配。但這不是“stand”這個(gè)詞在語(yǔ)境中的正確用法。另一方面,我們的BERT模型理解上下文,“stand與”work",這是一種肢體動(dòng)作,并給出了更有用的搜索結(jié)果。
這里有一些其他的例子,BERT幫助我們掌握了語(yǔ)言的細(xì)微差別,這些細(xì)微差別是計(jì)算機(jī)無(wú)法像人類那樣能夠完全理解的。
使用BERT模型,我們可以更好地理解“for someone”是這次搜索的重要部分,而以前搜索引擎會(huì)直接忽略了它的含義。
谷歌的算法進(jìn)一步優(yōu)化,我們?cè)谧龉雀鑣eo的策略也需要再次調(diào)整,另外祝大家在外貿(mào)路上越走越遠(yuǎn),能挖掘道更多的客戶,成交更多訂單。
AB客谷歌SEO團(tuán)隊(duì)均,擁有20位專業(yè)SEO精英組成的強(qiáng)大技術(shù)團(tuán)隊(duì),十年豐富的谷歌seo實(shí)戰(zhàn)經(jīng)驗(yàn),保證谷歌首頁(yè)排名,流量實(shí)時(shí)統(tǒng)計(jì),網(wǎng)站帶來(lái)的收益每天可見(jiàn)。