日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

作者:Gorkem Polat

編譯:ronghuaiyang

導讀

一些最常用的few shot learning的方案介紹及對比。

適用于少量數據的深度學習結構

 

傳統的CNNs (AlexNet, VGG, googleNet, ResNet, DenseNet…)在數據集中每個類樣本數量較多的情況下表現良好。不幸的是,當你擁有一個小數據集時,它們通常不能很好地工作。但是,在許多真實的場景中,收集數據是很有挑戰性的。例如,在人臉識別系統中,通常每個人的圖像都很少,或者在醫學領域中,一些罕見疾病的病例也很有限。

那么,當你的類別中只有5個樣本,甚至每個類別只有一個樣本時,深度學習能提供什么呢?這個問題被稱為few-shot learning。這是一個活躍的研究領域,有許多成功的方法可以采用。在本文中,我將只提到一些最有前途的體系結構。

這篇文章不會深入地解釋架構,因為這會使文章變得很長。相反,我將只介紹架構的主要思想,以便任何希望處理小數據集的人都可以對模型有一個大致的了解。

Siamese Neural Networks

適用于少量數據的深度學習結構

Siamese Neural Networks的結構

Siamese神經網絡以兩個樣本作為輸入,輸出給定輸入是否屬于同一類的概率(或損失)。輸入樣本通過相同的網絡(共享權值),它們的嵌入在損失函數中進行比較(通常使用基于嵌入的差異的度量)。在訓練過程中,“網絡”學會以更穩健的方式對輸入進行編碼。首先,在支持集(驗證步驟)上對模型進行訓練,以學習相同/不同的配對。然后,將測試樣本與訓練集中的每個樣本進行比較,得到基于學習的編碼后的測試樣本與每個類(one-shot task)的相似度。它是在few-shot學習領域中第一個成功的模型之一,并成為其他模型的基礎。

適用于少量數據的深度學習結構

Siamese Neural Networks的步驟

Triplet Network and Triplet Loss

適用于少量數據的深度學習結構

Triplet Networks

Triplet Network是對Siamese 網絡的擴展。Triplet網絡不使用兩個樣本,而是使用三個樣本作為輸入:positiveanchornegative樣本。Positive樣本和anchor樣本來自同一類,negative樣本來自不同類。Triplet損失的安排使得anchor的嵌入靠近positive而遠離negative。通過這種方式,網絡在提取嵌入信息時變得更加健壯。Triplet Networks已應用于人臉識別數據集,顯示出非常好的性能。

適用于少量數據的深度學習結構

 


適用于少量數據的深度學習結構

Triplet Loss

Matching Networks

適用于少量數據的深度學習結構

Matching Networks

匹配網絡將嵌入和分類相結合,形成端到端可微的最近鄰分類器。對于模型的預測,y?是標簽的加權和,y?是訓練集。權重是成對相似性函數a(?, x?),查詢(測試)樣本和支持(訓練)樣本之間的相似性。匹配網絡的關鍵是相似函數的可微性。

適用于少量數據的深度學習結構

 


適用于少量數據的深度學習結構

 

其中C代表了余弦相似度函數,k是在訓練集中的樣本總數,函數f* 和g是嵌入函數。總體而言,在測試樣本?的嵌入和訓練集樣本x?的嵌入之間計算相似性。這個工作的主要創新點就是對嵌入函數優化得到最大的分類精度。

Prototypical Networks

適用于少量數據的深度學習結構

Prototypical Networks

原型網絡不將測試樣本與所有訓練樣本進行比較,而是將測試樣本與類原型(或平均類嵌入)進行比較。其關鍵假設是對于每個類別,存在一個嵌入,簇樣本的表示是分布在這個原型的嵌入c?的周圍的。在他們的論文中,證明了它的性能優于匹配網絡。

Meta-Learning

適用于少量數據的深度學習結構

模型不可知Meta-Learning

元學習意味著學會學習。元學習試圖訓練模型的參數,使其通過一個或多個梯度步驟(像人類一樣)在新任務中表現最佳。模型的參數根據更新后的特定于任務的參數進行更新,使得任何任務在完成單一步驟后,其性能都是最高的。

與模型無關的元學習(MAML)的目的是學習一個通用的模型,這個模型可以很容易地對許多任務進行微調,只需要幾個迭代步驟。對于元批處理中的每個任務,使用基模型的權重初始化一個模型。采用隨機梯度下降(SGD)算法更新特定任務的權值。然后,使用更新后權重的損失總和來更新元學習者的權重。這里的目標是,對于幾個不同的任務,這些參數的損失將會很小。

適用于少量數據的深度學習結構

模型不可知Meta-Learning算法

Bonus: MetaFGNet

適用于少量數據的深度學習結構

MetaFGNet

除了目標任務網絡外,MetaFGNet還使用輔助數據訓練網絡。這兩個網絡共享初始層(基礎網絡)以學習一般信息。這種方法也被稱為多任務學習。將輔助數據(S)與目標數據(T)進行訓練,對目標訓練產生正則化效果。MetaFGNet還使用了一個名為sample selection的過程。輔助數據中的樣本通過網絡,對目標分類器的相似度打分,同時也計算源分類器。如果相似性高,得分也會高。只選擇得分閾值以上的樣本進行訓練。這里主要假設輔助數據S應該具有與目標集T類似的分布。結果表明,該過程提高了整體性能。使用元學習方法進行訓練效果有提升。

英文原文:https://medium.com/swlh/deep-learning-architectures-that-you-can-use-with-a-very-few-data-8e5b4fa1d5da

分享到:
標簽:深度 學習
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定