日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

區塊鏈與分享型數據庫

錢衛寧, 金澈清, 邵奇峰, 周傲英

華東師范大學數據科學與工程學院,上海 200062

摘要區塊鏈可以實現無中心、高可信的賬本管理,成功支撐了比特幣等金融領域應用發展。區塊鏈的本質是在不完全可信環境中的可信數據管理,它具有去中心化、防篡改、強一致和完整性等特性。同時,區塊鏈也存在著數據管理功能弱、性能低等問題。通過對比區塊鏈和傳統數據管理技術,分析3個典型的金融領域以外的區塊鏈應用,探討區塊鏈上新的研究問題,并討論面向特定領域應用,研發分享型數據庫系統(即支持核心業務,支撐分享經濟業務模式,甚至本身也是以分享經濟的方式實現的數據庫)的必要性。

關鍵詞

區塊鏈與分享型數據庫

論文引用格式:

錢衛寧,%20金澈清,%20邵奇峰,%20周傲英. 區塊鏈與分享型數據庫.大數據[J],%202018,%204(1):36-45

QIAN%20W%20N,%20JIN%20C%20Q,%20SHAO%20Q%20F,%20ZHOU%20A%20Y.%20Blockchain%20and%20sharing%20database.Big%20Data%20Research[J],%202018,%204(1):%2036-45

1 區塊鏈

自2008年10月31日署名為“中本聰”的比特幣(Bitcoin)文章)發布以來,加密數字貨幣已經展示了構建一個大型、去中心的分布式賬本的可能性。2014年10月22日,%20在大英圖書館舉辦%20的盛寶銀行研討會中,多位發言人都認為在比特幣風潮的背后,區塊鏈(blockchain)是真正有趣的技術。幾乎同時,相對于比特幣的“區塊鏈1.0”技術,被認為是“區塊鏈2.0”技術代表的以太坊項目發布,而Hyperledger項目也隨后在2015年發布。時至今日,區塊鏈已成為一大批應用的支撐技術。

雖然區塊鏈技術發展迅速,區塊鏈系統、平臺、應用層出不窮,但是它們大都具備以下5個特點。

首先,它們都具有鏈式結構,如圖1所示。數據或交易信息被組織成區塊;一系列區塊構成鏈;通過對前趨區塊進行數字簽名,并將簽名放入后繼區塊,構造、維護區塊間的鏈接關系。區塊內交易信息的順序組織以及區塊間的鏈式結構能夠準確記錄交易流水,實現賬本的功能。

圖1 區塊鏈的鏈式結構

其次,區塊鏈是防篡改的。區塊內常用Merkle-tree或其變種生成區塊的摘要信息,用于區塊內容正確性校驗,而因為前趨區塊的簽名是后繼區塊的一部分,所以一個區塊其實包含了自鏈首開始的全部信息的摘要,可用于之前信息是否篡改的校驗。換言之,要修改一個已記錄在區塊鏈中的交易,需要修改其所在區塊后的所有區塊內容,這往往需要極大的計算量或系統中大量節點的配合,因此通常難以實現,從而實現了防篡改。

第三,區塊鏈的存儲是分布式、去中心的,不依賴于單一中心節點。區塊鏈被多副本地存放在多個節點上。區塊鏈的更新需保持副本的同步更新。根據需要,節點間的分布式共識協議可以采用工作量證明(proof of work,POW)、實用拜占庭容錯(practical Byzantine fault tolerance, PBFT)、拜占庭容錯Paxos或權益證明(proof of stake,POS)等。雖然去中心的架構擺脫了單點故障的問題,提升了系統的頑健性和防篡改的能力,但同時分布式共識協議也導致了較大的數據修改時延和很低的系統吞吐率。

第四,雖然支撐比特幣的區塊鏈只能支持簡單的交易記錄和查詢,但是新的區塊鏈平臺大都支持智能合約。智能合約指“以數字形式定義的承諾,包括合約參與方可以在上面執行這些承諾的協議”。它常用圖靈完備的通用編程語言或專用語言實現,用以定義區塊鏈平臺中復雜的商業邏輯。錯誤的智能合約實現可能引發嚴重的系統安全問題。

第五,當前區塊鏈技術和系統的另一個重要特點是它們常和金融應用(如加密貨幣、分布式賬本、單據管理、首次代幣發售和眾籌、慈善緊密關聯。區塊鏈技術以分布式、點對點的方式,提供了可信的賬本管理功能。

目前已有大量工作探索區塊鏈的基礎理論、實現方法、應用模型。本文試圖從數據管理的角度梳理區塊鏈技術,并從3個區塊鏈應用出發,討論區塊鏈技術研究的需求與挑戰。

 

2 數據管理的本質

在討論區塊鏈的數據管理問題之前,首先簡要介紹數據管理的核心問題。

廣義的數據管理包含數據的獲取、存儲、處理、利用等各個方面的問題。數據管理任務通常由 數據庫管理系統(database management system,DBMS)和相關工具承擔。自20世紀70年代關系數據庫理論誕生以來, 關系數據庫管理系統(relational database management system,RDBMS)由于其在各類數據管理應用,特別是“關鍵任務(missioncritical)”應用中表現出的良好易用性、通用性和性能,成為大量數據管理任務的首要甚至是唯一選擇。伴隨著RDBMS產業的壯大,數據庫理論以及存儲、索引、查詢執行、查詢優化、事務處理、并發控制等一系列數據庫技術發展迅速。

數據管理的核心問題包括數據及其處理方法的建模、數據管理任務實施和管理、系統性能優化及其實現、系統的運維等多個方面。

 

2.1 數據模型抽象

數據模型的管理是數據管理的重要任務。數據模型包括數據結構、數據操作以及數據的完整性約束。正是由于提供了數據模型的抽象,數據管理系統才能服務于不同應用,以統一的形式實現數據的增、刪、改、查功能。

應用最廣的數據模型是關系模型(relational model)。它將集合論和數理邏輯作為理論基礎,將被廣泛接受和使用的SQL語言用于數據定義、數據操縱、數據控制和事務控制。SQL語言是聲明型語言,與過程型的語言相比,簡化了開發者編寫數據庫應用的過程。

由于關系數據庫管理系統的巨大成功,很多時候,談論數據管理時就是指采用RDBMS進行數據管理。實際數據管理系統中采用的數據模型常是關系模型的擴展,如 對象—關系模型(object-relational model),它在關系模型的基礎上添加了用戶定義類型(UDT)、用戶定義函數(UDF)、觸發器(trigger)等功能。

 

2.2 數據處理抽象

數據模型是對數據的抽象,而事務則是對數據處理流程的抽象。在RDBMS中,事務同樣由SQL語言實現。事務需要滿足事務語義,即“ACID”性質,指事務的原子性(atomicity)、一致性(consistency)、隔離性(isolation)和持久性(durability)。正是由于有了事務處理,數據管理系統才可以實現以記賬和訂票為代表的關鍵任務應用中的數據管理,在充分利用系統硬件資源的同時,實現正確且高效(低時延、高通量)的數據處理。

為了實現事務處理,DBMS提供了并發控制和恢復機制,前者主要用以保障事務的一致性和隔離性,而后者則主要保障原子性和持久性。DBMS中常需要維護數據在系統內多個副本之間的一致性,如多個存儲節點之間或磁盤與緩存之間的一致性。這些副本存在于一個相對可信的系統環境內部,因此其一致性維護需求不同于區塊鏈中分布式共識機制面對的需求。

在恢復機制中,常采用數據庫日志記錄對數據進行的操作和事務的提交、終止操作。數據庫日志從形式上與區塊鏈中順序記錄的交易流水類似。它們的不同點在于, DBMS中的日志存儲介質是可信的,一般并不采用簽名對整個日志序列進行防篡改保護。另外,DBMS中的日志通常只在數據庫恢復時使用,而在很多區塊鏈平臺中,交易流水記錄是唯一的數據,因此也是數據查詢的對象。

DBMS提供多種形式的事務接口。存儲過程是一種常用的事務形式,它是預先編寫好的事務程序,存儲于服務器,被客戶端調用后執行,并在執行結束后將執行結果返回給客戶端。

為了解決客戶端用過程型語言編寫的程序和數據庫服務器聲明型語言的集合數據訪問之間的“阻抗失配(impedance mismatch)”問題,DBMS通常提供游標(cursor)功能,供客戶端程序以逐行記錄為單位與數據庫服務器進行交互。

 

2.3 獨立性與透明性

DBMS提供的接口是聲明型的,其由系統自身實現。在實現時,系統提供了三層視圖和兩層映射,即視圖(外模式)—概念模式(模式)—物理模式(內模式)三者之間的映射,如圖2所示。這樣,當數據的存儲組織變化或應用需求變化時,只需要修改相應的模式映射關系,不用修改系統的其他部分,從而節約了系統和應用的開發和維護成本。

區塊鏈與分享型數據庫

圖2 數據管理的三層視圖、兩層映射

 

2.4 性能

提供數據管理獨立性與透明性的同時, DBMS將應用開發者隔離在查詢執行和事務執行的具體細節之外,承擔了大部分的性能優化問題。而性能是DBMS數據管理的關鍵問題。最早的RDBMS——S ystem R的主要開發者之一Bruce Lindsay認為數據庫世界最重要的事情就是系統性能。現代DBMS通過緩存、索引、查詢執行、查詢優化、并發控制等技術,實現查詢和事務的計劃優化和執行優化,如圖3所示。近年來,隨著大容量內存、高速網絡、多核/眾核處理機技術的快速進步,現代DBMS也常通過內存數據庫、分布式數據存儲、查詢和事務的并行執行等技術提升系統性能。

區塊鏈與分享型數據庫

圖3 數據管理系統功能體系結構概覽

 

2.5 工具與編程接口

除數據模式管理、查詢和事務處理以外,DBMS的管理、運維工具也是數據管理中的重要方面。1998年圖靈獎獲得者Jim Gray認為,易用、易管理是數據管理系統要實現的重要目標。此外,隨著近年來互聯網技術的發展,應用的規模越來越大,涉及的子系統、數據源數目也逐步增加,因此數據集成也是數據管理的重要方面,需要專門的工具配合DBMS使用。

 

3 作為數據管理系統的區塊鏈

從數據管理角度看,區塊鏈是一個構建在對等網絡上、采用鏈式存儲的可信數據管理系統。將區塊鏈與傳統的數據管理系統進行對比,有助于發現區塊鏈數據管理系統的基礎理論、實現方法的新研究問題,也有助于為這種新的數據管理系統尋找新應用,為改造現有的技術和系統、適配新型應用提供啟發。

 

3.1 技術對比

表1列舉了區塊鏈與傳統RDBMS的主要相似點和區別。首先,兩者都有順序組織的鏈式結構,區別只在于其作用不同,區塊鏈的鏈式結構就是數據的存儲組織形式,而RDBMS的日志則主要用于數據恢復。區塊鏈中并不單獨存儲數據庫的當前狀態,而數據庫的快照是RDBMS中支撐索引、查詢等優化技術的基礎。

區塊鏈與分享型數據庫

其次,RDBMS通常只提供一定程度的硬件容錯,但并不支持防篡改。防篡改是區塊鏈在對等網絡中確保數據可信的最重要特性。

第三,區塊鏈,特別是公有鏈,是完全去中心化的,構建于對等網絡。即使是聯盟鏈,雖然有些系統采用主鏈—支鏈的形式組織節點,但是區塊鏈的各項實現機制都假設無中心節點存在。與之相反,傳統數據管理系統都是強中心的,且認為中心節點是可信的。這直接導致了在確保數據一致性時,區塊鏈系統采用的分布式共識算法通常只在分布式數據庫管理系統中用以維護元數據。這是兩者性能差異巨大的最主要原因。

第四,當前的主要區塊鏈平臺并不提供所管理數據的模式管理。因此數據訪問方式也相應地只提供過程型的應用程序編程接口(Application programming interface,AP I)。缺乏聲明型的接口為復雜數據管理任務應用的開發制造了困難,也成了區塊鏈系統與現有數據管理系統交互和銜接的屏障。

此外,智能合約與RDBMS中的觸發器和存儲過程具有相似性。值得注意的是,在很多大型的關鍵任務應用中,為了保持高性能以及遺留代碼的可維護性,常避免采用觸發器和存儲過程。

最后,區塊鏈和傳統RDBMS面向的應用不同,區塊鏈正在承擔越來越多的金融領域跨部門、跨機構、跨組織甚至跨行業的可信數據管理任務。

區塊鏈和RDBMS的區別不僅體現在架構、功能和實現技術上,還體現在性能上。當前性能較好的區塊鏈平臺的數據訪問吞吐率見表2[16]。而根據 事務處理性能委員會(TPC)的數據,在TPC-C基準評測下,吞吐率能達到近5萬 TPS(transaction per second)。需要注意的是,TPC-C的負載復雜度遠遠超出當前區塊鏈平臺能支持的查詢和事務處理復雜度。和RDBMS相比,區塊鏈的性能劣勢限制了它在很多需要承受高負載壓力的關鍵任務應用中的推廣和使用。

區塊鏈與分享型數據庫

 

3.2 面向領域的數據管理系統

傳統數據管理系統的設計、實施、應用開發邏輯是“一體適用(one-size-fitsall)”的,即DBMS是通用的,適用于任何領域的任何(結構化)數據管理任務。關系數據庫管理系統產業的興起和發展也依賴于這一指導思想。2005年,Stonebraker M對這一指導思想提出了疑問。10年以后,獲得2014年度圖靈獎的Stonebraker M則很明確地宣告傳統DBMS不再適用于任何應用場合。這既是由于新硬件的快速發展顛覆了傳統DBMS研發時基于的假設,也是因為應用的多樣性導致一個系統優化、平衡所有功能和性能指標是不可能的。

隨后,另一位重要的數據庫學者Carey M提出了更具建設性的指導思想,即“分類適用(one size fits a bunch)”,針對一個特定領域的特定需求,設計專用的數據管理系統,例如高通量事務處理需要NewSQL系統、聯機分析處理(online analytical processing,OLAP)需要列存儲的數據庫、文本搜索需要檢索系統、海量和流數據處理需要流數據處理系統、信息網絡的數據管理和處理需要圖數據庫,不一而足。

區塊鏈正是滿足加密貨幣應用的可信記賬需求而生的專用數據管理系統。于是,有兩個問題:區塊鏈是否也適用于其他可信數據管理任務?如何借鑒區塊鏈技術解決更廣泛或其他領域的可信數據管理問題?

 

4 應用與討論

 

4.1 應用1:基于區塊鏈的智能倉單管理系統

2016年,針對鋼鐵商品倉單抵押常見的虛假倉單、重復抵押等問題,研發了基于區塊鏈的智能倉單管理系統,提供倉單生成、流通、交易等各環節的可信管理,其應用架構如圖4所示。這是一個典型的聯盟鏈應用,相互協作的多個節點(機構)通過區塊鏈共同管理倉單數據和倉單的交易、流通信息。與比特幣不同,鏈上的節點對信息的操作和使用方式不同。鏈上有倉單的擁有者(貨主)、管理者(倉庫)、監管者(監管公司)、查詢者(金融機構)以及倉單抵押、流通、交易過程中涉及的扮演各種角色的節點。

區塊鏈與分享型數據庫

圖4 區塊鏈的智能倉單管理系統應用架構

針對倉單數據的結構化特點,系統實現了數據模式管理。參與單位常需要同時對鏈上的倉單信息和本地數據庫信息進行關聯,進而進行分析處理。系統在區塊鏈的基礎上,實現了鏈上、鏈下數據的一體化查詢處理。

 

4.2 應用2:數據流通

安全屋是上 海優刻得信息科技有限公司的數據流通云服務平臺。數據在安全屋內共享,進行分析處理。在安全屋內,一切數據訪問、數據處理行為都被監管與審計,只有數據處理結果可被“帶出”安全屋。系統中進出的數據與處理過程都使用區塊鏈進行記錄,供后續審計和分析使用。

當前的區塊鏈技術不足以支撐安全屋的所有記錄和監管需求。一方面,數據分析包含大量機器學習和人工智能算法處理,比單純的交易記錄和事務處理要復雜很多,數據處理的記錄方式以及后續的審計方法都需要進一步探索。另一方面,安全屋內數據處理流程審計的本質是對數據項處理過程的回溯查詢,當前的區塊鏈平臺對于回溯查詢支持仍較弱。

 

4.3 應用3:政府治理

政府擁有大量高質量的數據。依賴這些數據,可進行精確、及時的政府治理。近年來,在我國的一些大中型城市,已經出現一批利用交通監控、社交媒體、行人騎行等各種數據進行城市規劃、城市管理的成功案例。

政府治理不僅依賴自身各職能部門的數據,也使用來自于企業和社會的數據。這些數據的分享、使用需要在一個統一、有監管的平臺上進行,區塊鏈是實現平臺的自然選擇。與加密貨幣的去中心化不同,政府治理可能是多中心或者弱中心的,節點在一定程度上可被認為是可信的。區塊鏈的架構、共識機制設計,乃至數據的存儲方式、模型管理、查詢和事務處理技術都需要面向政府治理進行裁剪和定制。

 

4.4 討論

秉持“分類適用”的思想,可以看到,當前面向金融應用的區塊鏈系統并非適用于所有領域。筆者認為,區塊鏈技術在以下3方面值得進一步深入探索。

首先,面向弱可信的弱中心或多中心的應用環境,可信數據管理系統架構是一個重要問題。很多關鍵任務應用都處在這樣的環境中,且社會的組織架構本身以及政府職能部門監管要求,共同決定了絕對的去中心化系統的適用范圍并不大。這就需要重新審視區塊鏈本身的結構,研發更適合場景的系統。

在多中心的架構下,華盛頓大學研發的對等網絡上的數據管理原型系統Piazza是一個有益的參考。Piazza系統中,每個節點維護自身的數據;節點間數據模式可能不同;節點與鄰居節點的數據庫間維護著數據模式的映射;一個節點上的查詢利用模式映射翻譯后可在對等網絡上傳播,從而訪問其他節點的數據。這一組織方式比當前區塊鏈的節點數據全量備份更靈活。當然, Piazza的數據管理機制欠缺對于防篡改和事務處理的支持也很薄弱,還有大量工作值得探索和嘗試。

其次是系統的性能。無論是分布式共識機制、事務處理,還是數據的存儲組織、索引、查詢乃至分析處理,區塊鏈系統都有極大的性能優化和提升空間。而且幾乎所有應用都對區塊鏈的性能有較高的要求。

最后,鏈式結構天然地保留了數據的歷史記錄,然而當前的區塊鏈系統對回溯查詢的支持仍然薄弱,而回溯查詢對于審計、監管等區塊鏈應用而言又是必需的。因此,筆者認為實現高效、靈活的回溯查詢機制對于拓展區塊鏈應用場景具有重要意義。此時,回溯不僅指對交易歷史記錄的回溯,也包括對機器學習等數據分析處理過程的回溯。

 

5 分享型數據庫

區塊鏈部分地解決了金融應用中無中心的信任問題。在更廣泛的應用場景中,如何在不依賴信用的前提下建立信任,是重要的研究問題。

隨著互聯網技術的發展,越來越多的領域首先通過線上(online)數據共享,進而實現線下(offline)虛擬或物質物品的分享,以實現資源的合理利用和價值提升。這一過程在共享單車的迅速崛起并隨之暴露大量的企業管理、政府治理、用戶行為問題的歷程中得到了充分的體現。共享單車等互聯網應用的蓬勃發展說明我國在商業模式創新方面已經走到了世界的前沿,商業模式的創新能否轉化為科技創新的驅動力則是一個國家創新能力的標志。需要發展新的數據管理技術來為企業的日常運營、城市的有效治理提供有力的支撐。

能支撐新的數 據管 理需求的系統可以稱為“分享型數據庫(sharing database)”,它應能支持核心業務(mission-critical application),支撐分享經濟業務模式(business model),甚至本身也是以分享經濟的方式實現的分享經濟時代的數據庫。區塊鏈已經展示了面向特定領域應用,設計實現這樣的系統的可能性。但在更多的領域,需要類似區塊鏈的分享型數據庫系統解決可信數據管理的問題。

分享型數據庫應秉承“分類適用”的理念,與領域和應用緊密結合。與傳統的數據管理系統不同,分享型數據庫的系統形態將是多樣的:對于涉及“人—財—物”的應用,提供完善的事務處理機制以及一體化的數據獲取和管理;對于復雜數據的管理,提供結構化數據模型和模式的管理;對于涉及數據分析的應用,提供豐富的時序和回溯查詢支持;對于涉及數據處理審計的應用,則在日志的基礎上,實現事務、統計乃至機器學習算法處理流程和結果的理解和記錄;分享型數據庫的架構也與應用相對應,可能是去中心的,也可能是弱中心或者多中心的。

信息化是業務發展和改革的基礎,很多時候也是改革的先鋒,甚至引領應用創新。筆者相信,與區塊鏈促進了金融技術(FinTech)的演進一樣,分享型數據庫將伴隨分享經濟而快速發展。

作者簡介

錢衛寧(1976-),男,華東師范大學數據科學與工程學院教授、博士生導師,主要研究方向為互聯網環境下的數據管理、大數據管理系統評測基準、社交媒體數據分析、知識圖譜構建與應用等。

金澈清(1977-),男,華東師范大學數據科學與工程學院教授、博士生導師,主要研究方向為基于位置的服務、數據質量、不確定數據管理、區塊鏈等。

邵奇峰(1976-),男,中原工學院軟件學院副教授,華東師范大學數據科學與工程學院訪問學者,主要研究方向為大數據、區塊鏈

周傲英(1965-),男,華東師范大學長江學者特聘教授、副校長,數據科學與工程學院院長,主要研究方向為Web數據管理、數據密集型計算、內存集群計算、分布事務處理、大數據基準測試和性能優化。

《大數據》期刊

《大數據(Big Data Research,BDR)》雙月刊是由中華人民共和國工業和信息化部主管,人民郵電出版社主辦,中國計算機學會大數據專家委員會學術指導,北京信通傳媒有限責任公司出版的中文科技核心期刊。

分享到:
標簽:區塊
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定