科技創新服務是迭代最快的領域,數據科學會創造一個分工更明確的社會。
在科技巨頭公司已經領導開發大數據算法、人工智能技術的時候,我們依然可以看到科技獨角獸公司層出不窮。
今天,科技前哨要與你分享的是大數據分析預警公司Dataminr創建于2009年,主要幫助商業機構和政府組織從社交媒體中提取他們想要的信息,并預測后續發展,幫助識別假消息,找到可能的輿論風險,甚至能幫你發現投資機會,
如今,從政府部門到全球組織、從跨國公司到新聞傳播集團,全球100多個國家和地區的各種組織都依賴于Dataminr的實時信息技術。根據今年3月弗雷斯特市場咨詢(Forrester Consulting) 發布的研究顯示,借助Dataminr的服務,企業可以有效避免業務安全問題,其客戶可以在三年內實現421%的投資回報率,投資回報周期不到6個月。
1. 泰德·貝利與Dataminr
創始人泰德·貝利(Ted·Bailey)大學時就對信息技術傳播產生了濃厚的興趣,他研究了實時信息技術歷史,驚嘆于電報、廣播以及電視等信息技術對社會的改變。
9/11事件深刻的沖擊了泰德·貝利,技術缺口導致了巨大的實時信息差,世貿中心2號樓倒塌時1號樓內的人員并沒有及時得知外面發生的一切,錯過了最佳逃生時機。
他意識到如果有一項技術可以供人們實時取得關鍵信息,彌補信息差,在危險到來的時刻發出警報,也許就可以避免像9/11這樣的悲劇再次發生。
2009年6月1日,世界上第一個實時信息監控平臺Dataminr在美國創立。
就如它名字一樣,Dataminr是數據淘金者。泰德·貝利的實時信息技術被用于挖掘公開數據并進行風險檢測,他也被公認為實時信息監控技術的領導者。
2. Dataminr的核心技術
如果要做比喻的話,Dataminr就是21世紀的“地動儀”。
Dataminr的強大算法能將社交平臺上的數十億個公開數據轉變成實時的消息警告,全天候的檢測實時信息流,使世界各地的安全、運營、財務和通信專業人員能夠隨著事態的發展而獲取必要信息。該公司就曾根據推文在恐怖組織(ISIS)正式公開信息前預測輿論傳播與石油價格的聯系。
眾所周知,社交媒體平臺的內容大多都是文本、圖像、視頻、音頻的結合產物,格式多樣且呈現出碎片化的特征,算法處理過程中難免會出現遺漏、重復和誤判。
Dataminr的首席科學家和AI高級副總裁亞歷克斯·海梅斯(Alex Jaimes)解釋了Dataminr的一項核心技術——多模態AI融合模型。
這套模型結合人工智能領域的圖像識別、語義理解等技術,會對給定的文本、圖像等進行交叉關聯的深度學習。
也就是說,在分析圖文內容時,AI會整合多條消息中相似的內容,利用當下最火熱的注意力機制,交叉對比圖文內容,這個機制顯著的提高了檢測的準確性。
我們在公眾號文稿里放上了它的技術細節展示,你有空的話可以打開看一看。
簡單說,一條社交媒體的消息會被拆分為圖像和文本分別進入各自的流程中提取信息,由不同的AI分別從圖像和文本提取關鍵信息進行交叉分析。
最后通過隨機共享模型(SSE),一種能為不同關鍵詞提供個性化分析的人工智能框架,提高分析的精度,避免過度擬合。
這個交叉分析加隨機共享模型的大框架,就是多模態AI融合模型的核心,有了這個框架不但可以用來比較圖文,視頻、音頻都能讓AI進行獨立檢測。
例如,當AI在社交媒體信息中發現了一條飛機事故的信息線索后,并不會立刻給出警報,只有當事故附近的目擊者上傳現場照片時,有足夠多的證據進入模型,才會給出飛機失事的警報。
相比于傳統的AI,這套多模態融合模型并不會因為一兩條“假消息”就發出警報,而是根據文字、圖片、視頻、音頻乃至定位做出綜合判斷,當關鍵詞都指向危險時,它就會立刻提醒相關用戶,減少假預警,也讓判斷的依據更好理解。
3. 加速拓展業務
2014年時,美國有線電視新聞網(CNN)、推特(Twitter)聯合Dataminr,打造了新聞線索發掘工具Dataminr For News,該工具每天可實時搜索數億條推文,追蹤照片或視頻的原始來源,分析新聞線索的價值,幫助記者快捷地找到突發新聞和有價值的新聞。
泰德·貝利曾說:“新聞挖掘(DataminrForNews)將分析推文以發現和揭示重大新聞,而這個技術仍處于萌芽階段。”
如今Dataminr被估值為41億美元,是紐約頂級私營科技公司之一,連續五年入選福布斯云100強,并于2019年被評為福布斯人工智能最具潛力的50家公司。
隨著世界公共數字數據的指數級增長,Dataminr代表了實時信息技術歷史上的重大飛躍——與電報、廣播和電視技術一樣重要。2021年,Dataminr的業務逐漸擴展到全球各地的組織,這也從根本上改變了21世紀數據和實時信息的運作方式。
4. 對初創者的啟示
如果從高處俯瞰科技企業的發展,你會看到科技創業的兩條路徑,一種是“從大到強”利用新技術快速打開市場,再不斷引入其他技術增強實力;另一種是“從強到大”,利用新技術在一個領域深耕,從垂直技術工具逐步拓寬覆蓋面,一步步將技術實力轉化為市場優勢。
Dataminr就是后者的一個代表,先開發核心技術、創建數據分析模型,進一步發展業務。目前不少AI企業都在嘗試這條發展道路,Iris AI在科研領域、Deep Genomics在生物領域、Cloudmoyo在云服務領域,都在從一個業務發起,逐步擴張。
在AI+大數據的應用上,初創公司仍有大把的機會,只要你發現了一個行業中的缺口,尋找到滿足該需求的技術方案,一個初具雛形的公司就誕生了。
當然這類科技初創公司的前期一定是艱苦而緩慢的,需要在技術上持續深耕,在服務上打造差異化的體驗。
你有思考過自己熟知的領域的技術缺口嗎?如果讓你做選擇,你會選擇科技巨頭已經搭建好的模型,還是自行克服技術問題以建成核心技術模型呢?