AI視覺進入“大模型時代”不僅“看得見”還“看得懂”
智慧安防領域需求旺盛 更強調個人隱私權保護
第十九屆中國國際社會公共安全博覽會現場。
智慧安防更注重隱私保護。
近日,第十九屆中國國際社會公共安全博覽會(以下簡稱“CPSE安博會”)和全球數字城市產業博覽會在深圳會展中心落幕。在6萬平方米的數字城市產業展區中,隨處可見AI攝像頭和AI綜合數據分析圖,而行業大模型在展會上也出現得更多了。
記者采訪了解到,AI大模型如今已成為“兵家必爭之地”,而安防行業則成為AI的“第一著陸點”,豐富的感知設備和數據維度,讓這一領域更加成為AI大模型等前沿技術的試驗田。而中國企業在智能安防領域的“領跑式發展”,也為安防產品“出海”奠定基礎,在AI技術的加持下,安防行業又迎來了一輪革新,將成為民眾更好的“隱形守護者”。
文、圖/廣州日報全媒體記者 馮秋瑜
數字孿生、視覺分析:
智慧安防營造安全、舒適社區
記者在現場采訪發現,大到天地傳感,小到社區“最后一公里”,在新技術的助力下,我們所居住的城市正在加速向“智慧城市”轉變,計算機視覺(CV)作為人工智能領域最大的應用領域,在人臉識別、視頻監控、門禁卡、防盜報警等智慧安防領域率先實現了商業化。
“相比于傳統的社區管理模式,‘智慧社區’更加以人為本,以不斷滿足居民的幸福感和滿意度為核心,為居民提供更便捷、安全的社區環境,讓孩子茁壯成長,讓老人盡享天倫。”英特爾中國區物聯網及渠道數據中心事業部總經理郭威告訴記者,之前的攝像頭只是“看得見”,而智能視頻分析系統可以“看得懂”。
據了解,智能視覺分析通過對采集社區中的人、車、公共設施等管理對象的視覺數據進行智慧化的數據洞察,實現“入侵”“攀高”“自行車/電動自行車違停”“亂丟垃圾”“高空拋物”“水域入侵”“占道堆物”等方面的識別需求,在事件發生后,系統能夠在3秒內通過AI應用對圖像進行識別并判斷該事件是否違規,并在5分鐘內處置完成,從而營造更智能、安全、舒適的社區和公共環境。
“地面沉陷、暴雨成災、交通擁堵等是城市發展中遇到的共性問題,利用時空大數據建設好基于數字孿生的智慧城市,可以推動城市升級發展。”中國科學院院士、中國工程院院士李德仁向記者介紹了基于天地傳感網的數字孿生技術在災害智能管理方面的應用:“今年5月21日,國際首顆遙感成像、氣象探測和水利應用一體化衛星‘珞珈二號’在酒泉衛星發射中心發射,能滿足目標識別級的遙感感知的高分辨率、視頻等多種探測需求。在今年夏天京津冀地區的防汛工作中,‘珞珈二號’觀測到堤防決口的影像,第一時間發布預警,幫6300余名群眾當天完成轉移。”
動態監測老人、賽事、施工
“AI視覺行為分析”實時告知
“攝像頭我們已經用很多年了,最大的感觸就是無法事前報警。比如說,有的老人在起居室里摔倒了,或者小孩爬到沒有關閉窗戶的危險地帶,原來的攝像頭可能會認出來有老人有小孩,但它不能理解畫面的語義;但當攝像頭有了一個‘認知性大腦’,看到這些場景時,自然就會聯想到這個人可能處在危險之中,從而實現事中的監測和預警。”上海趨視科技總裁徐飆向記者介紹了其最新的“AI視覺行為分析”技術:“采用TOF(Time-of-Flight) 傳感器采集數據,并通過‘智能分析儀’進行AI推理,可以精準地識別老人跌倒、久坐不起等風險因素,通過App實時將信息發送至家人或社區服務人員手機端。”
徐飆介紹:“比如,某街道違章停車、渣土車違規行駛、無證攤販臨時擺攤、商鋪占道經營、亂倒垃圾等社區問題頻現,對于人員缺乏的社區管理隊伍而言,會出現如問題發現不及時,協調成本高,管理缺少數據支撐等現象;而智能視頻行為分析技術給街道每一部攝像機都裝上‘AI 大腦’,實時分析街面情況,對違規行為自動且及時地上報。當偵測到指定區域內出現違規行為,系統會生成提醒信號,實時推送到管理人員隨身設備中,實現社區問題處理敏捷化。”
高新興科技集團首席技術官陳利軍對記者介紹,在即將于12月24日于廣州舉行的黃埔馬拉松比賽中,通過在沿路高聳的樓宇部署的AI視頻監控和無人機,可以做到賽事的全程管控。“無論隊伍到哪里,整個隊伍都是在可視范圍內。比如說哪里發生擁擠或是有什么異常,AI視覺分析可以協助管理人員快速掌握全局。”
記者采訪發現,通過“AI視覺行為分析”,在馬路上,攝像頭可以識別車牌、追蹤違規行為;在工地上,可以識別工人是否佩戴工作手套、絕緣鞋、護目鏡等,為工人施工建立安全屏障;在校園里,有了“AI校園防欺凌終端”,可以針對“救命、打架、110”等異常詞匯進行采集;而在食堂,“明亮灶廚算法”能讓攝像頭識別廚師有沒有戴廚師帽和口罩,還有各種用具的擺放合不合規,食堂夠不夠衛生、有沒有老鼠等;在家門口,可視門鈴能夠識別來訪是你的家人、朋友還是陌生人。
視覺大模型被“引爆”
多模態AI學人類“感知”世界
在本次CPSE安博會上,至少有六家頭部企業推出了通用或行業大模型,或是展示大模型應用。郭威認為,視頻大模型已成為繼自然語言處理(NLP)之后AI技術的下一個引爆點。“大模型最大的意義是讓我們從判別式AI走向深層次判別式的AI,前者主要從數據和信號中去提取特征進行識別,完成像人臉識別語音識別、圖像識別這樣的任務;而后者可以在海量數據訓練的基礎上生成文字、語言、圖片、視頻代碼甚至算法,完成各類專業人士的工作,在生產力的提升上更為直接。”
計算機視覺已經邁入“大模型時代”,在許多領域都展現出了巨大潛力和價值,安防領域也不例外。記者采訪了解到,目前安防產業鏈上的各細分領域企業也推出了自己的大模型,如大華的“星漢”以視覺解析為核心;宇視科技的“梧桐”集CV行業、NLP行業等于一身,能夠滿足多樣化的任務和場景需求;云從科技的大模型“從容”應用于視頻監控、入侵檢測、人臉識別等過程中的數據分析,“行人基礎大模型”覆蓋了人體全局屬性(性別、年齡)、局部屬性(穿戴風格、配飾)、攜帶屬性(手機、刀棍、手提包等)、人-物交互HOI(抽煙,持刀棍,手機拍屏幕)等,廣泛應用于礦山、建筑工地以及特殊場所的安全布控,監控作業人員穿戴合規,姿態行為等異常和違規行為。
熵基科技首席科學家陳書楷介紹:“我們人類的智慧體現在我們可以通過感知、思考和行動來改變世界。現在機器也擁有了‘感知’和‘思考’的能力,伴隨AI的發展,機器必須通過視覺來理解周圍的環境,做出決策。”該企業自研的BioCV大模型可以實現園區運行安全“一屏統覽”。陳書楷表示,多模態AI結合了更多的感官模式,它模仿了人類感知世界的方式,能夠為多樣化場景下的智能個性化應用開創全新可能。
明年有望大范圍落地
智慧社區更關注隱私保護
國際數據公司(IDC)數據顯示,自2023年開始,隨著大模型、生成式AI的盛行,智慧城市人工智能市場迎來新的機遇。IDC預計,未來5年人工智能將進入大規模落地應用關鍵期。
一位業內專家在接受記者采訪時談到,隨著AI和大模型一日千里的發展,智能視覺技術將在所有垂直行業得到更廣泛的應用。“在大模型實施之后,因其更好的理解能力和更高的訓練效率,我們可以用相對少的數據就達到非常高的準確度。針對不同的場景,大模型的泛化能力也比傳統AI有非常大的提高。”
郭威認為:“大模型現在各個行業都在試,我覺得明年在很多行業,特別是在很多智慧社區,大模型能夠有效落地,形成商業閉環。”
智慧社區對于人工智能有著旺盛的需求,也是能夠實現規模化發展、可復制性強的場景。記者發現,在此次CPSE安博會上,“個人隱私保護”也被多位專家和業內人士著重強調。“視覺分析系統涉及采集并分析一些日常生活畫面,需要平衡監控與隱私保護之間的關系,確保合理使用和保護個人隱私權。”據了解,針對智慧社區場景的特點,趨視科技、精華隆智慧感知等企業采用了可以“脫敏”的采集技術,不是通過視頻監控,而是通過僅可見“影子”的深度圖像,反映景內物體的距離和角度值,不直接包含面部、身體或其他私人信息,大大降低了隱私泄露的風險。
記者采訪發現,目前部分智能安防產品和現有的基礎大模型還沒有掛鉤,但徐飆介紹,未來,相關安防設備可以和目前一些成熟的語音大模型對接,感知方式從視覺延伸到紅外、雷達、光纖、聲紋等更多維度,隨著TOF類雷達傳感器的不斷應用,除了語音和圖像外,第三維深度數據感知越來越豐富,基于深度數據的大模型必將把機器“認知”世界的能力帶到一個新高度。(廣州日報)