數學家和物理學家在研究網絡的時候,為了抓住本質,通常進行一定的抽象,表現在既不關心節點的特定物理位置、大小,也不在意邊的長短、曲直、相交與否,只關心節點和節點間是否相連。
例如,歐拉在解決哥尼斯堡七橋問題的時候,雖然1736年討論長短大小的幾何學是主流,而不考慮長短大小、不牽涉量計算的情形幾乎沒人研究,但他卻撇開研究對象的長短、大小、面積、體積等度量性質和數量關系,把2座小島和河的兩岸分別抽象成4個點,而把7座橋抽象這4個點之間的連線,開創了拓撲研究的先河。
當人們把網絡抽象成這種不依賴于節點的位置、大小和邊的具體形態,所得到的性質就成為網絡的拓撲性質,相應的結構稱作網絡的拓撲結構。
在自然界和人類社會中存在各種各樣的網絡,像作為基礎設施的鐵路、公路、航空等交織而成的交通網、電力網,近年來廣泛應用的技術網絡萬維網、對等傳輸(P2P)網絡、互聯網等。一個典型的網絡由許多節點和連接節點的邊組成,通常節點代表真實世界中的個體或組織,而它們間的關系用邊來表示。
例如,在互聯網中,可以用點來表示自治系統(AS autonomous system),邊來表示其間的連接關系,即形成自治系統級的網絡拓撲;如果把互聯網中的路由器看成節點,而路由器間的連接關系看成邊,這樣就形成了路由器級的互聯網拓撲。
網絡結構分析在社會網、技術網、生物網的研究和實踐中都已發揮了重要作用,互聯網就是一個典型的例子。作為一個真實網絡,互聯網從最初的4個節點,發展成為當今世界的信息基礎設施,其應用的深入發展和無處不在的廣泛性深刻地改變了人們的工作、生活和學習方式,己成為一個名副其實的具有復雜結構的巨大系統。
互聯網拓撲結構具有“健壯而又脆弱”(robustyet fragile)的雙重特性,在不同尺度上,其形成機理不同。在自治系統級層面上同時表現出對節點隨機失效的健壯性和在有意攻擊情況下,只要移除少數重要節點,全網就會招致癱瘓,即表現為十分脆弱。這種脆弱性,也被稱作阿基琉斯之踵(Achilles’heel),其根源在于度分布的不均勻性。
但在路由器級拓撲上,表現為互聯網可以有效容忍在設計時考慮到的不確定因素,具有健壯性,而對設計時未被考慮的不確定因素(如IP前綴劫持、分布式拒絕服務)變得非常脆弱。其雙重特性是由于考慮到網絡設計與優化等因素形成的,根源不在網絡的度分布。
近幾年隨著國內外互聯網行業發展迅速,許多人從中發現商機,有不法分子利用互聯網的脆弱性來攻擊網絡從中獲取利益,基于此種社會現狀,如何提高互聯網絡的抗攻擊性能成了關注的重點。早些年對互聯網拓撲的研究很少有,但是隨著互聯網結構越來越龐大,近幾年隨著對互聯網拓撲結構的研究也在不斷深入。
在今年3月22日發表的一篇文章中,加州大學圣迭戈分校(UCSD)的計算機科學家們,針對全球75個市場區域開展了一線全面的大規模研究。
研究一作、UCSD 計算機科學專業博士 Alexander Gamero Garrido 表示:“我們對互聯網的拓部結構開展了研究,以期找到基礎設施遭到破壞時的最薄弱環節”。結果發現,世界上約 1/4 的互聯網用戶都依賴于易受攻擊的基礎設施,遠超研究前的預估。從區域分布來看,許多面臨風險的市場區域都位于南半球,大致包括拉美、亞洲、非洲、以及大洋洲。
研究配圖 :影響因子
世界上不同地區的互聯網連接結構不盡相同,比如以美國為代表的諸多發達國家,就有大量互聯網接入服務提供商(ISP)競相為廣大用戶提供服務。
邊界網關協議(BGP)中未觀察到的路徑
這些網絡相互交織、支持直連交換內容(又稱直接對等互連),且所有ISP能夠直接接入全球性的互聯網基礎設施。
各地區前五 ASes 的 CTI 線框分布圖
然而在許多其它地區(大多為發展中國家),ISP都未采用直接對等的互聯網接入方式 —— 通常只有屈指可數的幾家服務提供商可選,且頭部效應明顯(某個大型ISP為絕大多數用戶提供服務)。
重疊條形圖展示了排名靠前的五大 ASes 的 CTI 值
不僅如此,這些提供商還依賴數量有限的“流量自治系統”(通常為國有),以訪問全球互聯網和其它國家或地圖的通信流量。
頭部AS的CTI值
研究人員指出,這種情況使得擁有此類互聯網基礎設施的地區特別容易受到攻擊,因為攻擊者只需削弱其盯上的少數流量自治系統。
本土/國有AS的CTI與部分區域 本土/國有AS的CTI與部分區域
在最糟糕的情況下,某些地區只有一套中轉自治系統為所有網民提供服務(比如古巴和塞拉利昂)。但在對私營ISP持較開放態度的地區,其流量自治系統就要相對寬裕得多(比如孟加拉國從2家增加到了 30多家)。
研究收集到的國有來源地址空間(橙條)/ CTIn(藍條)
此外研究人員驚訝地發現,許多海底互聯網光纜都為國有運營商所有,且南半球的互聯網拓補結構中遺留了不少殖民時代的影子 —— 比如法國運營商Orange在部分非洲國家有著強大的影響力。
國家級流量權重分布
據悉,研究人員借助邊界網關協議(BGP)數據追蹤了互聯網上自治系統之間的路由與可達信息交換。不過這些數據無法完整反映全球互聯網的全貌,因而本文分享的研究結果也只能作為一個大致的參考。
我們再來看一下擎天神的網絡拓撲圖,從擎天神中我們可以看到美、德、英等西方國家的AS域和IP地址比較多,網絡拓撲圖也較為復雜。
而亞洲、非洲國家的AS數量就較少,無法構成龐大的網絡拓撲關系,這也從另一個角度印證了Alexander Gamero-Garrido博士的部分結論,一些國家的網絡拓撲和互聯網基礎建設確實比較薄弱。
互聯網是網絡科學領域的一個典型的網絡實例,對其拓撲結構知識的深入研究與應用可以豐富網絡科學的內涵,推動網絡科學這個新興學科的發展。正如弄清事物的結構是人類認識一個事物和對其進行改造過程中首先面臨的基本問題一樣,對網絡結構的掌握也是認識和改進網絡的基礎。
互聯網拓撲結構是互聯網信息基礎設施最基本的內在屬性。對互聯網拓撲特征和知識的發現及其應用正在快速發展中。當前全球數字化建設的信息系統工程領域(如云計算、三網融合、智慧地球、社會計算、物聯網等)都離不開互聯網這個信息基礎設施。