近期,由數據中心聯盟組織實施的“DCA大數據產品能力評測”正式公布了第七批大數據產品能力評測成果。該評測的評審委員會由中國信息通信研究院、清華大學、中國科學院等單位,以及所有參與評測產品企業專家組成,截至目前,通過DCA大數據產品能力評測的產品數量累計達到134款/次,涵蓋了分布式批處理平臺、分布式分析型數據庫、分布式事務數據庫、時序數據庫、用戶行為分析解決方案、數據挖掘工具、數據集成工具、數據管理平臺,以及商務智能(BI)分析工具。據了解,本屆大數據產品評測吸引了眾多企業的參與,除了大數據技術標準委員會中120家會員之外,還吸引了很多非會員類企業的參與,其中即包括銀行、政府、央企等對甲方客戶,還包括專注于大數據產品的垂直企業。其中,國雙以5款大數據和人工智能產品通過7個能力評測,成為該評測有史以來一次性通過評測數量最多的企業。
提升數據資產質量,推動大數據產業規范化發展
這是一個大數據爆炸的時代,數據無處不在,誰掌握了數據,誰就能夠把握成功。大數據產業發展到今天,雖然在技術能力上取得了巨大的進步,但由于企業對于數據資產管理的重要性和能力尚缺乏共識,業內仍然沒有形成統一的產品能力評定標準。如何能夠高效管理數據資產、如何形成統一判斷大數據產品能力的標準,對于整個行業生態的建立至關重要。
中國信息通信研究院云計算與大數據研究所所長何寶宏表示,大數據產品能力測評是標準的落地環節,旨在促進大數據相關技術工具的成熟,幫助用戶選擇合適的產品,通過技術工具的普及提升數據資產質量、提高數據資產價值挖掘的效率。無論標準還是評測都是推動大數據產業規范化發展的重要部分,能夠有效釋放技術型企業的活力,為技術深入各行各業保駕護航,讓大數據真正成為推動經濟轉型發展的新動力。
以場景應用為重點,助力大數據應用落地
作為本次評測項目的主要負責人之一,中國信通院云計算與大數據研究所主任魏凱介紹,今年的評測新增加了商務智能和數據挖掘這兩個平臺,一個是做報表的,另一個是做機器學習建模的,特別貼近客戶應用層,稍微進行簡單的培訓,就能上手。魏主任表示,Hadoop要用Java寫MapReduce程序,可是很多企業根本沒有IT人員,怎么編程序?這就大大增加了企業的使用門檻。如果將一個圖形化的大數據軟件交付給用戶,只需要拖拖拽拽的操作即能夠實現大數據能力,那么企業就可以將更多的精力用到產品的技術研發上,從而減少運營實施的壓力。筆者觀察發現,今年參評的大數據的產品大都提供了可視化的管理界面,例如國雙參測的5款大數據產品,全部提供可視化的管理平臺,大大減少了用戶的使用成本。
除了新增加的兩個平臺之外,今年數據規模也變得越來越大。據了解,今年的大數據產品評測不但測試了管理上萬臺機器的能力,而且數據量最高也達到了100TB,已經達到了世界頂級的水平。以國雙并行數據倉庫系統 (Gridsum ZETA PDW)為例,這個唯一一個通過分布式分析型數據庫性能評測的產品,在Hadoop性能測試中,TB級數據量下部分SQL執行時間可低于10秒鐘,海量數據檢索速度也比較領先,為此奪得了SQL性能測試第一名。
國雙CTO劉激揚
作為科技創新驅動的大數據和人工智能企業,國雙通過此批DCA大數據能力評測意義重大。國雙CTO劉激揚表示,對于行業而言,說明中國在大數據行業的整體技術實力正在持續提高,對于國雙而言,是長期深耕大數據行業的成果,印證了國雙在大數據、人工智能這個領域中領先的技術優勢,特別是擁有分析型數據庫、數據智能、用戶行為分析等在產業互聯網領域中都需要用到核心能力和技術。未來,國雙還將持續為數字營銷、司法、電子政務、工業互聯網、數據智能等多領域客戶挖掘數據價值,為企業數字化、智能化轉型賦能。
“數據管理是一個非常復雜的過程,不可能一籌而就。下一步,中國信息通信研究院作為標準制定和評測的牽頭單位,以中國通信標準化協會為平臺,與學術界、產業界和領域用戶緊密合作,不斷完善大數據產品技術標準評測基準,推動我國大數據產品技術水平不斷提升,為數據強國提供強有力的基礎支撐。魏主任如是說。