DA技術首先應用基于自組織特征映射的聚類技術:利用自組織特征映射神經(jīng)網(wǎng)絡對源域和目標域的樣本進行聚類,然后用兩級聚類映射方法來識別樣本分布相似性最高的目標-源簇。使用自動編碼策略將來自一組相似目標簇的樣本按照源域進行轉(zhuǎn)換,構建訓練集和測試集,最后基于人工神經(jīng)網(wǎng)絡分類器進行分類。
- ·領域自適應
在遙感應用中的主要挑戰(zhàn):目標域樣本與源域樣本的概率分布不同。然而,目標域分布必須使用僅來自源域的大量標記樣本來建模。
- ·解決方法
a.調(diào)整源分類器的參數(shù),對來自目標域的未標記樣本進行分類——存在噪聲、離群點和固有特性從源域傳播的問題。
b.將目標域特征合并到分類器的訓練集中
· 土地覆蓋分類領域自適應技術的發(fā)展趨勢
a.第一類強調(diào)樣本從兩個域直接轉(zhuǎn)化為一個可以抵消分布差異的全同子空間。
b.第二類是遷移學習,它使用來自源領域的樣本從目標領域中選擇信息量最大或最多樣化的樣本。
- 研究方法:
a. 兩級聚類映射:
在第一級,分別計算第t個目標簇和第s個源簇的特征的差異。然后,將第t個目標簇與第j個特征差異最小的源簇配對。除此之外,還對所有成對的目標-源簇對計算了一個置信度度量。在第二階段,采用半自動閾值選擇算法,分離出最相似配對的源-目標簇和不相似的源-目標簇,只保留最相似配對的目標-源簇;同時將剩余的配對排除為不相似簇。
具體為自動編碼器將來自最相似配對的目標簇的樣本按照相應的源簇轉(zhuǎn)換。對于不相似的目標簇,選取離簇中心最近的r個樣本作為標記代表(包含了最終訓練集中目標區(qū)域分布特征的信息),利用遷移學習過程進行標記。
二級聚類映射流程圖
b. 自組織特征映射(Self-organizing feature mApping-SOM )
自組織神經(jīng)網(wǎng)絡:輸入層模擬感知外界輸入信息的視網(wǎng)膜,輸出層模擬做出響應的大腦皮層。
主要用于完成的任務基本還是"分類"和"聚類",前者有監(jiān)督,后者無監(jiān)督。聚類的時候也可以看成將目標樣本分類,只是沒有任何先驗知識,目的是將相似的樣本聚合在一起,而不相似的樣本分離。
網(wǎng)絡的輸出神經(jīng)元之間相互競爭以求被激活,結(jié)果在每一時刻只有一個輸出神經(jīng)元被激活。這個被激活的神經(jīng)元稱為競爭獲勝神經(jīng)元,而其它神經(jīng)元的狀態(tài)被抑制
自組織特征映射結(jié)構
自組織特征映射步驟
(1)向量歸一化
(2)尋找獲勝神經(jīng)元 :當網(wǎng)絡得到一個輸入向量X時,輸出層的所有神經(jīng)元對應的權重向量均與其進行相似性比較,并將最相似的權重向量判為獲勝神經(jīng)元
(3)網(wǎng)絡輸出與權值調(diào)整 :以獲勝神經(jīng)元為中心設定一個鄰域半徑R,該半徑圈定的范圍稱為優(yōu)勝鄰域,優(yōu)勝鄰域內(nèi)的所有神經(jīng)元均按其離開獲勝神經(jīng)元的距離遠近不同程度地調(diào)整權值。
優(yōu)勝鄰域開始定得很大,但其大小隨著訓練次數(shù)的增加不斷收縮,最終收縮到半徑為零。
c. 基于ANNs的分類器
多層感知器(MLP)
MLP是一個具有一個或多個隱層的前饋神經(jīng)網(wǎng)絡, 通過最小化期望類標簽和預測類標簽之間的平方和誤差,調(diào)整連續(xù)層神經(jīng)元之間節(jié)點連接的權重。主要用到徑向基函數(shù)(RBF),橢圓基函數(shù)(EBF),RBF的拓展。
分類流程圖
d. 徑向基函數(shù)神經(jīng)網(wǎng)絡
優(yōu)點:逼近能力,分類能力和學習速度好,學習收斂速度快、能夠逼近任意非線性函數(shù),克服局部極小值問題。(原因在于其參數(shù)初始化具有一定的方法,并非隨機初始化。)
基本思想:用RBF作為隱單元的"基"構成隱藏層空間,隱藏層對輸入矢量進行變換,這樣就可以將輸入矢量直接(不通過權連接)映射到隱空間(將低維的模式輸入數(shù)據(jù)變換到高維空間內(nèi),使得在低維空間內(nèi)的線性不可分問題在高維空間內(nèi)線性可分)。隱含層空間到輸出空間的映射是線性的,即網(wǎng)絡輸出是隱單元輸出的線性加權和,此處的權即為網(wǎng)絡可調(diào)參數(shù)。
如有錯誤歡迎指出!
圖片來源于網(wǎng)絡,侵權請聯(lián)系刪除!