物聯網產生大量的數據,包括流數據、時間序列數據、RFID數據、傳感數據等。要有效地管理這些數據,就需要使用數據庫。物聯網數據的本質需要一種不同類型的數據庫。以下是一些數據庫,當與物聯網一起使用時,會給出非常好的結果。
物聯網可以看作是一個網絡,在這個網絡中,各種事物通過一個共同的平臺相互連接。只是想象一個場景,在該場景中,每一個設備在家里和工作場所的連接,和一個世界,空調在房間外面的溫度上升時自動降低其溫度,當在任何公共集會的人數很容易知道,當一個人的健康可以每天監控參數。這就是物聯網可能帶來的影響。
物聯網目前的狀態是非常零散的。有不同的公司和組織正在為他們的客戶或他們的個人需求建立自己的平臺。但是,目前還沒有一種通用的平臺,可以讓所有設備(無論它們是哪家公司的)通過用戶友好的界面相互連接。
據估計,未來5年,物聯網設備的數量將達數萬億。
物聯網需要數據庫嗎?
物聯網帶來了許多繁瑣的挑戰,尤其是在數據庫管理系統領域,比如實時整合海量數據、處理流中的事件以及處理數據的安全性。例如,應用于智能城市的基于物聯網的交通傳感器可以實時生成大量的交通數據。
數據庫在充分處理物聯網數據方面扮演著非常重要的角色。因此,適當的數據庫與適當的平臺同等重要。由于物聯網在世界上不同的環境中運行,選擇合適的數據庫變得非常具有挑戰性。
在為物聯網應用選擇數據庫之前應該考慮的因素是:
- 大小、規模和索引
- 處理海量數據的有效性
- 用戶友好的模式
- 可移植性
- 查詢語言
- 流程建模和事務
- 異構性和集成
- 時間序列聚合
- 歸檔
- 安全和成本
物聯網中的數據類型有:
- RFID:射頻識別
- 地址/惟一標識符
- 過程、系統和對象的描述性數據
- 普適環境數據和位置數據
- 傳感器數據:多維時間序列數據
- 歷史數據
- 物理模型:作為現實模板的模型
- 執行器狀態及控制命令數據
適合物聯網的數據庫
InfluxDB
InfluxDB:流感數據庫首次發布于2013年,是最近的數據庫之一。該數據庫完全基于鍵值數據庫LevelDB,采用Go編程語言進行開發。InfluxDB是一個時間序列數據庫,用于優化和處理時間序列數據。時間序列數據最早由Kdb在2000年發布,但隨著物聯網的興起,隨著NoSQL、NewSQL和大量增長的數據的出現,InfluxDB變得流行起來。
對物聯網數據使用InfluxDB的優點包括:
- 允許對序列進行索引
- 它有一個類似sql的查詢語言
- 對缺失數據提供內置的線性插值
- 支持數據自動降采樣
- 支持連續查詢計算聚合
CrateDB
CrateDB: CrateDB是一個分布式SQL數據庫管理系統。它是開源的,用JAVA編寫的,包含了來自Facebook Presto、Apache Lucene、Elasticsearch和Netty的組件——因此它是為高可伸縮性而設計的。CrateDB是為使物聯網數據工作而設計的。從工業互聯網、聯網汽車到可穿戴設備,CrateDB是新型物聯網解決方案創新者的首選數據庫。
將CrateDB用于物聯網數據的優點包括:
- 每秒百萬個數據點:快速、線性可擴展的數據攝取
- 實時查詢:柱狀索引和字段緩存提供內存中的SQL性能
- 動態模式:動態添加和查詢新的傳感器數據結構
- 物聯網分析:快速、健壯的時間序列、人工智能、地理空間、文本搜索、連接、聚合
- Always on:內置的數據復制和集群再平衡確保不間斷的性能
- ANSI SQL:無鎖定,易于任何開發人員使用和集成
- 內置的MQTT代理:直接將設備與數據庫集成
- 物聯網生態系統:使用Kafka、Grafana、NodeRED等流行的物聯網棧軟件
- 可以在任何地方運行,以便在邊緣或云中進行高效處理
MongoDB
MongoDB: MongoDB是一個免費的、開源的、跨平臺的、面向文檔的數據庫程序。它被歸類為一個NoSQL數據庫程序。MongoDB使用具有模式的類似json的文檔。它是物聯網組織的首選,因為它可以讓他們存儲來自任何上下文的數據,可以實時分析,也可以在他們進行時改變模式。
MongoDB用于物聯網數據的優點包括:
- 強大的數據庫
- 面向文檔的
- 具有一般用途
- 作為一個NoSQL數據庫,它使用類似JSON的帶有模式的文檔
RethinkDB
RethinkDB:在開放源碼數據庫列表中,RethinkDB位于頂部。它是一個可伸縮的實時Web JSON數據庫,是從頭開始構建的。RethinkDB通過改變傳統數據庫架構引入了一種令人興奮的新訪問模型。當開發人員向它發出命令時,它可以不斷地將更新后的查詢結果實時推送到應用程序。這是一個被開發人員稱為change feed的特性。RethinkDB充當數據庫、實時存儲庫和系統狀態的消息代理,這是change feed允許的。它的實時推送架構大大減少了構建可伸縮實時應用程序所需的時間和精力。
對物聯網傳感器數據使用RethinkDB的優點包括:
- RethinkDB有一個可適應的查詢語言來檢查API,非常容易設置和學習。
- 如果主服務器出現故障,命令會自動轉移到新服務器上。
- 節點實時即插即用功能,無需停機一秒,方便添加節點。
- 在Ruby和Tornado中通過Eventmachine提供異步查詢,提供異步應用程序編程接口。
- 它提供SSL訪問,只是為了通過公共互聯網安全訪問RethinkDB。
- Floor, ceil和round是RethinkDB提供的各種數學運算符。
SQLite
SQLite數據庫引擎是一個進程庫,它提供了一個無服務器的(自包含的)事務性SQL數據庫引擎。由于其可移植性和較小的內存占用,它對游戲和移動應用程序開發產生了重大影響。
SQLite適用于不需要任何人工支持的設備,因為數據庫不需要管理權限。它非常適合用于手機、機頂盒、電視、游戲機、相機、手表、廚房電器、恒溫器、汽車、機床、飛機、遠程傳感器、無人機、醫療設備和機器人,以及物聯網。
客戶端/服務器數據庫引擎被設計為駐留在網絡核心的數據中心內。SQLite也在那里工作,但SQLite也在網絡的邊緣蓬勃發展,在為自己提供快速可靠的數據服務的同時,為那些連接不可靠的應用程序提供服務。
對物聯網數據使用SQLite的優點包括:
- 內存占用小
- 它是真實的
- 使用前無需設置
- 沒有依賴性
Cassandra
Apache Cassandra: Apache Cassandra是一個免費的開源分布式NoSQL數據庫管理系統,最初發布于2008年。它旨在通過許多商用服務器處理大量數據,提供沒有單點故障的高可用性。
在物聯網中,由于連接的設備數量巨大,通過各種網絡產生、跟蹤和共享數據的規模非常大。Cassandra非常擅長利用大量的時間序列數據,這些數據直接來自于設備、用戶、傳感器以及存在于不同地理位置的類似機制。
在物聯網中使用Apache Cassandra的優點
數據包括:
- 容錯
- 展示了高性能
- 去中心化:集群中的每個節點都是相同的
- 可伸縮
- 持久性
- 確保可控:每次更新都可以選擇同步復制和異步復制
- 彈性:讀寫都是實時執行的,任何應用都不存在停機
- 專業支持:加強第三方提供的合同和服務。