(ChinaZ.com) 12 月 19 日消息:由普林斯頓大學、佐治亞理工學院、艾倫人工智能研究所和 IIT 德里的研究人員團隊進行的最新研究發現了多種提高網站在人工智能(AI)搜索引擎中可見性的方法。研究顯示,這些優化方法成功使較小、排名較低的網站的可見性提高了 115%,使它們能夠超越通常在搜索結果頂部占據主導地位的大型企業網站。
研究團隊觀察到,他們的生成引擎優化(GEO)技術能夠普遍提高網站的可見性,最多可達 40%。
他們在多個知識領域(如法律、歷史、科學等)測試了九種優化技術,并發現了哪些方法有效,哪些方法無效,以及哪些方法實際上會使排名變差。
特別值得注意的是,某些技術在特定知識領域特別有效,而有三種技術在所有類型的網站上表現尤為突出。
研究人員強調了 GEO 作為民主化搜索結果頂部工具的能力,他們寫道:「這一發現強調了 GEO 作為數字空間民主化工具的潛力。重要的是,許多排名較低的網站通常是由小型內容創建者或獨立企業創建的,他們傳統上很難與在搜索引擎結果中占據最高排名的大公司競爭。」
在 Perplexity.AI 上進行測試
研究人員在 Perplexity.ai 搜索引擎和以 Bing Chat 的 AI 搜索引擎上進行了測試,發現結果與以 Bing Chat 為模型的引擎相似。
研究論文第 6 節中指出:「我們發現,與我們的生成引擎類似,引用增加在位置調整字數方面表現最佳,相對于基線有 22% 的改善。此外,在我們的生成引擎中表現良好的方法,如引用來源、統計數據增加,在兩個指標上顯示出高達 9% 和 37% 的提高。」
在以 Bing Chat 為模型的 AI 搜索上進行測試
研究人員在他們創建的生成搜索引擎上測試了他們的方法,該搜索引擎以 Bing Chat 工作流程為模型,并且還在人工智能搜索引擎 Perplexity.AI 上進行了測試。
他們寫道:「我們描述了一個生成引擎,其中包括幾個后端生成模型和一個用于源檢索的搜索引擎。
生成引擎 (GE) 將用戶查詢 qu 作為輸入并返回自然語言響應 r,其中 PU 表示個性化用戶信息,例如偏好和歷史記錄。
生成引擎由兩個關鍵組件組成:
a.) 一組生成模型 G = {G1, G2…Gn},每個模型都有特定的用途,例如查詢重構或總結,以及
b.) 給定查詢 q 的搜索引擎 SE 返回一組源 S = {s1, s2…sm}。
我們提出了一個具有代表性的工作流程......,在撰寫本文時,它與 BingChat 的設計非常相似。該工作流程將輸入查詢分解為一組更簡單的查詢,這些查詢更容易被搜索引擎使用。」」
用于測試的搜索查詢
研究人員為測試創建了一個基準,包含來自 9 個不同來源的 10,000 個搜索查詢,涵蓋多個知識領域和不同復雜度水平。例如,有些查詢需要推理才能解決答案。
研究論文解釋道:「...... 我們策劃了 GEO-BENCH,這是一個由多個來源的 10K 查詢組成的基準,為生成引擎重新定位,并附有合成生成的查詢。」
以下是 9 個搜索查詢來源的列表:
1. MS Macro
2. ORCAS-1
3. Natural Questions
4. AllSouls
5. LIMA
6. Davinci-Debtate
7. Perplexity.ai Discover
8. ELI-5
9. GPT-4 生成的查詢
測試的九種排名策略
研究人員測試了九種不同的網站優化方法,跟蹤了不同類型搜索(如法律與政府、商業、科學、人與社會、健康、歷史等主題)中不同方法的效果。
他們發現,每種類型的知識主題都對不同的優化策略有良好反應。
這九種測試策略包括:
權威性:改變寫作風格,使權威性聲明更具說服力
關鍵字優化:添加更多來自搜索查詢的關鍵字
統計數據添加:將現有內容更改為包含統計數據而非解釋性信息。
引用來源(引用可靠來源)
引用添加:添加高質量來源的引用和引文
易于理解:使內容更容易理解
流暢性優化:使內容更加清晰
獨特詞匯:添加使用較少的、罕見和獨特的詞匯,但不改變內容的含義
技術術語:在有意義的地方添加獨特和技術術語,而不改變內容的含義
引用來源
引用添加
統計數據添加
哪些方法效果最佳?
前三種優化策略是:
引用來源
引用添加
統計數據添加
這三種策略相對于基準取得了 30-40% 的相對改進。
研究人員寫道:「這些方法,包括添加相關統計數據(統計數據添加)、引入可信引用(引用添加)和包括可靠來源的引文(引用來源)在網站內容中,只需對實際內容本身進行最小改變。然而,它們顯著提高了網站在生成引擎響應中的可見性,從而提高了內容的可信度和豐富性。」
流暢性優化和易于理解方法也有助于提高 15-30% 的可見性。
這些結果被研究人員解釋為表明 AI 搜索引擎重視內容及其呈現方式。
哪些優化策略不起作用
研究人員驚訝地發現,在內容中使用說服性和權威性語氣通常不會提高 AI 搜索引擎中的排名,至少不如其他方法有效。
同樣,將更多來自搜索查詢的關鍵字添加到內容中的方法也沒有起作用。事實上,關鍵字優化的表現比基線還差 10%。
針對不同知識領域的優化效果不同
報告中的一個有趣發現是,哪種優化效果最佳取決于知識領域(法律、政府、科學、歷史等)。
他們發現,與歷史領域相關的內容在應用「權威性」優化時排名更好,使用更具說服力的語言。
用權威來源引用改進內容的引用優化,對事實搜索查詢效果最好。
統計數據對法律和政府相關問題效果良好。統計數據對「觀點」問題也很有效,即搜索者詢問 AI 對某事的看法。
研究人員觀察到:「這表明,在特定背景下,納入數據驅動的證據可以提高網站在特定環境下的可見性。」
添加引用對人與社會、解釋和歷史知識領域效果良好。研究人員將這些結果解釋為,AI 搜索引擎可能更喜歡這些問題的「真實性」和「深度」。
研究人員得出結論,進行特定領域的優化是最佳方法。
低排名網站通過 GEO 提高排名
這項研究的好消息是,通常排名較低的網站將從這些策略中受益,以優化 AI 搜索引擎。
他們總結道:「有趣的是,排名較低的網站,在 SERP 中通常難以獲得可見性,它們從 GEO 中獲得的好處遠遠超過排名較高的網站。」
SEO 的游戲規則改變者
這項研究顯示了 SEO 在面對基于 AI 的搜索引擎時的新路徑。那些聲稱 AI 搜索將擊敗 SEO 的人說得太早了。這項研究似乎表明,SEO 最終將演變為 GEO,以在下一代 AI 搜索引擎中競爭。
閱讀完整研究論文:
https://arxiv.org/abs/2311.09735