什么是鐵路貨車車號?
鐵路貨車車號是鐵路貨車車身上的一串號碼,相當于車輛的“有效身份證”。它是鐵路信息化管理的關鍵,是快速準確判斷車輛位置和使用情況的重要依據。一旦出錯,將直接影響行車調度指揮、列車運行、貨車實時追蹤管理、貨車占用費清算等環節,不僅會降低鐵路貨車整體運轉效率,嚴重情況下還會導致行車事故發生,后果不堪設想。
(圖1:鐵路貨車車號示例)
繁重易錯的車號核對工作
為了保持車輛的性能、減少風險隱患、延長車輛的使用壽命,鐵路貨車要定期進行檢修。在貨車檢修的傳統人工作業中,有一項重復、枯燥且極易出現錯漏的工作,那就是為車輛重新噴涂與核對車號。噴漆完成后,作業者需要去現場拍下“落成車”,即所有工序檢修完成的車14個部位的照片,然后存檔到車間電腦里。存檔時,須按當日計劃中的車號,新建以車號命名的文件夾,再逐車整理并核查,每輛車需核對4張車號照片。
僅中國鐵路武漢局集團有限公司襄陽車輛段,每年需要人工維修并重新噴涂車號的鐵路貨車一萬多輛。若按每天30輛計算,一天就需要分類存檔420張照片、核對車號120次,工作量和出錯率可想而知。
(圖2:需拍照核驗部分眾多)
技術者的神奇魔力
因為做過物聯網還參與過比賽,襄陽車輛段不少同事知道一線職工李桑郁有技術基礎。有一天,李桑郁突然收到了同事的請求:“油漆班組的工長專門找到我,說每年都會出現車號噴錯的情況,有時質檢驗收也發現不了。問我能不能像汽車車牌識別一樣,做一個鐵路貨車車號識別的設備,讓機器代替人工,減少人為錯誤。”
李桑郁知道車號核對失誤問題不容忽視,于是便開始嘗試學習計算機識別相關的技術。“各大地下停車場的汽車車牌識別設備使用的大多是傳統圖像識別技術——字符分割,但我在大學接觸過OpenCV,知道字符分割不太適合有光線干擾的現場人工拍照,正確率受曝光影響過大;也考慮過OCR識別,但它的準確率也不高,經常識別不出或出錯。所以我開始嘗試使用深度學習框架。”
(圖3:通用OCR識別效果)
飛槳助力——快速開發、直接落地
“多維度對比后,最終我們選擇用百度飛槳。因為飛槳的AI Studio實訓平臺上有很多中文實操案例可以參考,對新手來說不僅大大降低了技術門檻,還能少踩坑,將更多精力投入在產品上。”在國內首個開源開放、功能完備的產業級深度學習平臺飛槳(PaddlePaddle)上,李桑郁使用了目標檢測算法(PP-YOLO),對車號區域進行檢測定位,對車號字符逐個匹配;將字符定位和匹配結合起來計算出車號,整個識別過程快速且精準。
“就目前使用飛槳的目標檢測算法對單個數字的識別效果來看,既不會錯誤地把車型識別進來,也不會過多受拍攝角度的影響。通過測試、驗證,識別準確率高達97%。”李桑郁的識別系統已成功部署并開始幫助車間作業,基本解決了傳統人工識別易出錯、耗精力等問題,極大提高了審核效率。
此次“鐵路貨車車身字符及標識自動檢測”項目,李桑郁僅憑一人完成,從制作數據集到訓練再到導出模型,一套流程非常順利,這背后也離不開百度飛槳的助力。除了容易上手、應用效果好等特點,飛槳還為開發者們建立了QQ群,用于在線交流分享,同時,還有專業技術人員幫助大家答疑解惑,助力每一位開發者項目順利部署。
(圖4:使用飛槳目標檢測算法開發的模型識別情況)
不久前,在深度學習技術及應用國家工程實驗室與百度聯合主辦的WAVE SUMMIT+2020深度學習開發者峰會中,包括李桑郁開發的“鐵路貨車車身字符及標識自動檢測”項目在內的十余個項目獲得飛槳“產業應用創新獎”。而在飛槳平臺的助力下,越來越多的開發者們攻克了項目難題,完成著由數字化到自動化、智能化的高速演進,加速產業智能化的整個進程。
(圖5:飛槳產業應用創新獎獎牌與證書)
截至目前,百度飛槳已經凝聚了265萬開發者,服務了超過10萬家企業,平臺上擁有超過34萬個模型,覆蓋通信、電力、城市管理、民生、工業、農業、林業、公益等眾多行業和領域。正如百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峰所說,以深度學習為代表的人工智能發展浪潮中,產業界已經成為驅動開源開放的重要力量。同時,開源軟件已經深入到企業信息化、智能化的方方面面,從大數據、云計算、人工智能、深度學習平臺,到各種智能應用,開源軟件的品類極大豐富,成熟性和可靠性進一步提升,推動企業應用技術的效率和創新的效率得到大幅提升。