2020年4月,國務院安委會印發了《全國安全生產專項整治三年行動計劃》,主要聚焦在風險高隱患多、事故易發多發的的煤礦、非煤礦山、危險化學品、消防、道路運輸、民航鐵路等交通運輸、工業園區、城市建設、危險廢物等9個行業領域,組織開展安全整治。全國安全生產專項整治三年行動于2020年4月1日啟動,至2022年12月結束,分為動員部署、排查整治、集中攻堅和鞏固提升四個階段,明確了2個專題實施方案、9個專項整治實施方案。
這次專項整治行動有兩個特點:時間長、領域廣,這也體現了黨中央國務院對安全生產工作的高度重視,通過三年整治進一步把安全生產基礎打牢,使人民群眾的幸福感、獲得感、安全感更加持續、更有保障。各地區各有關部門也先后成立了相應的工作領導機構來推動專項整治工作各項措施的落實。
在過去的一年時間里,睿企科技通過自然語言處理(NLP)技術,協助政府有關部門,以警情、政務熱線等數據為切入點,充分發揮這些數據源作為感知風向標的指示作用,探索并落地符合業務場景和實戰需求的安全監管風險預警模型,讓人工智能技術對基層基礎工作的支撐作用落到實處。
01 知識體系建立
通過對過去十年國家應急管理部發布的特別重大事故調查報告的研讀和梳理,睿企科技從數十份報告中建立道路交通車輛、道路交通要素、消防隱患、危險品、危險管理等若干知識體系,從理論上結合安全生產監管和風險管理理論以及其他相關學科理論,通過分析安全生產監管的復雜特征,對海量警情文本進行語義分析。結合命名實體識別、關系識別與關鍵詞識別模型前沿技術,針對警情文本研判要素識別的安全監管場景加以調整和改進,重新開發實現了公安安全監管場景的命名實體識別、精準關系分類和業務關鍵詞挖掘模型,端到端完成了對警情文本的處理,具體來說有以下三個步驟:
一是數據治理,對接入的文本數據進行清洗,過濾重復、無效信息與臟數據,輸出高質量的文本數據內容;
二是語義理解,構建安全生產數據命名實體識別、精準關系分類和業務關鍵詞挖掘三個模型,解析文本中可供研判的命名實體、實體關系和業務關鍵詞,為安全監管提供更充分的研判要素,擴展文本數據價值密度,提高數據治理與文本數據的整合度;
三是構建知識詞庫,按照使用場景對識別研判要素進行自底向上進行分層組織,形成安全監管、執法監督、服務民生等條線的要素知識庫,挖掘不為政府機關所掌握的隱患特征,以數據服務的方式為安全監管部門各應用系統提供知識服務支撐,充分釋放文本數據的應用效能,加深條線應用深度,進一步拓寬數據賦能場景。
02隱患識別與業務落地
睿企科技以“定位相關信息源”,“歸類潛在風險”,“落實具體地址、人、車”為目標,對數據文本內容進行語言理解,從數據中的“群租房”、“消防隱患”和“道路交通”三個場景入手,進行安全監管方面的潛藏隱患識別。以地級市為例,平均100萬起警情中可發現安全監管相關的警情數量約占2萬起,由此獲得的相關地址、車輛和人員的有效信息5000起左右,這極大填補了過去政務工作中通文本內容對安全隱患進行感知和識別的空白。
以“群租房“為例,圍繞治安管理中的群租房問題,基于NLP技術對相關警情進行挖
從中分析潛在的群租房信息,通過“一址多人、多次噪音、以人括址”等方向,對群租房問題進行定位,并通過系統從以下三個維度開展分析,報警地址本身為群租房地址、警情內容中某門牌號或樓上(樓下)某門牌號為群租房地址、警情內容中僅提及相對位置,示例結果如下表:
今年是《全國安全生產專項整治三年行動計劃》實施的第二個年頭,睿企科技通過一年的技術探索與應用落地,充分利用自然語言理解等前沿科技,幫助政府基層管理者構建起安全監管預警系統,及時發現群租房、消防,道路安全等隱患,助力推進安全生產專項整治三年行動,為預防、保障公民人身財產安全盡一份睿企力量!
Rich AI睿企科技是一家專注于自然語言處理與決策引擎的認知智能高科技公司,以持續為客戶創造價值為使命,以創新自然語言處理、知識圖譜等AI認知智能技術為宗旨,為客戶提供基于大數據驅動的認知決策系統和服務。
公司專注大規模文本數據分析與價值挖掘,通過技術與業務的深度融合,為政府提供決策支持,為企業提供商機信息。