“大數據時代真的來了,大數據帶來了大機會,同時也存在大忽悠和大危險。但挖掘數據離不開其他人文學科相關專業的基礎知識支撐,商業應用中的數據挖掘如果忽視人性,精準挖掘就成了精準騷擾,大數據則會淪為大忽悠。”北京大學新聞與傳播學院,新媒體研究副院長、教授劉德寰在8月14日舉辦的2014夏季騰訊思享會上講到。
在題為《大數據開啟時代轉型》的主題演講中,劉德寰指出,大數據時代洶涌來臨,給各行各業都帶來了大機會,電子商務、信息產業、公共衛生、醫療、教育各個產業都在突飛猛進的運用大數據,尤其是零售業,在大數據應用情況下,可以發現更多“啤酒與紙尿褲”的搭售規律,讓商家更懂得消費者。
不過他認為,由于當前的運算技術有限,大數據搜集也存在斷裂和封閉現象,數據太多太大也導致了數據失真,加之人們急功近利等原因,出現了很多假規律、假相關和虛假運算結果,很多運算變成了自我高潮,導致大數據變成“大忽悠”。
他分析道,如果大數據忽視了抽樣的調查,在沒有總結整體規律的基礎上預測和理解眾多的個體,簡單粗暴,不一定實用。一個模型代替不了所有個體,忽視了個體的大數據就是空中樓閣,只見到數據不見人的時候是非常危險的。
劉德寰總結到:算法依賴于人們對該領域知識的理解深度,不是數學技能和IT能力,忽視基礎知識的大數據應用永遠不能成功。數據挖掘的商業本質要簡單不能再簡單,但是過程非常復雜。不是簡單的CRM、ERP跑一圈兒就給你推送,那是從精準營銷蛻變為精準騷擾。所以,數據挖掘不是黑箱,不是一個調動數據的方法,也不是整理數據的方法。它實際上需要在思想的基礎上做。真正進行跟人相關的大數據挖掘的時候一定要關注人性。
“22年前,我選了‘數據分析’這門課,當時非常之冷,但現在非常之熱,熱到受不了。大數據其實相當于給了大家一個新算盤,一個各個領域都能用的新工具,希望大家在實際應用中抓住大機會,規避掉忽悠和風險。”劉德寰表示