ICDAR(International Conference on Document Analysis and Recognition,國際文檔分析與識別會議)是文檔圖像分析領域最重要的國際會議之一。今年ICDAR設立了十余項競賽,吸引了來自谷歌、亞馬遜、百度、阿里、騰訊、北京大學、清華大學等諸多國內外頂級科技公司和知名高校參加。
國際頂級賽事,包攬多項佳績
此次大賽中,視源股份團隊在BDVT-QA的端到端視頻文字識別任務中獲得第一名(V-DA)。
在CROHME手寫公式識別賽事的三項任務——在線公式識別(On-line recognition)、離線公式識別(Off-line recognition)、雙模態公式識別(Bimodal recognition)均獲得第二名(YP_OCR)。
文字識別與公式識別的競賽任務與視源股份在教育領域布局的業務技術息息相關,據悉當前這些技術已廣泛應用在seewo學習機的作業批改、口算計算等產品中。隨著底層技術。的成熟和優化,視源股份旗下品牌的產品性能和用戶體驗有極大提升贏得良好的口碑。
多領域開花,技術實力顯現
當前大眾對于視源股份的印象仍然停留在售賣“顯示器”階段,其實視源股份一直在積極組建自己的技術團隊,并在多年前成立中央研究院。
中央研究院創立之初旨在為視源股份技術促增長戰略提供強力支撐,當前中央研究院博士學歷研究人員占比25%,主要圍繞視覺計算、語音信號信息處理、觸覺技術、空間感知、自然語言處理、醫學信號處理、數據挖掘等領域進行研究,目前團隊已有來自UCLA、清華、中科院、Apple等海內外高層次人才。
今年視源股份中央研究院數據挖掘團隊(CVTEDMer)還參與了華為因果推理挑戰賽(PCIC),經過線上篩選和決賽答辯最終取得線上第1名、決賽答辯總成績第2名的好成績。
從2018年開始,視源股份中央研究院各個研究團隊開始參與各類技術比賽,雄厚實力斬獲多項殊榮。
以下為視源股份中央研究院團隊部分獲獎經歷:
全國知識圖譜與語義計算大會 評測任務:面向音樂領域的命令理解任務(第3名,2018)
阿里天池:“數智教育”數據可視化創新大賽(第1名,2019)
ACM MM Challenge AI Meets Beauty(第3名,2019)
阿里天池:第二屆海南大數據創新應用大賽-智能算法-簡歷解析賽(第5名,2020)
2021 年訊飛 AI 開發者大賽-試題標簽預測挑戰賽(第2名,2021)
CCL 2022漢語學習者文本糾錯競賽(賽道一第3名、賽道四第2名,2022)……
著眼大局,積極布局多模態感知和交互
視源股份中央研究院的研究方向覆蓋領域廣泛,縱觀技術的發展趨勢,結合團隊的優勢研究領域,當前他們正在深耕研發、積極布局多模態感知和交互技術。
隨著互聯網技術以及電商潮流的興起,AR技術在虛擬試衣的應用越來越火爆。針對當前網絡購物無法體驗衣物材質的痛點和消費者對未來網購的消費期望,視源股份提前布局并深耕紋理反饋技術,并由此延伸,挖掘紋理反饋更多的應用場景。
近些年來手勢控制依靠自然、高效、便捷的優勢不斷出現在各類操作應用中,消費者們尤其贊賞手勢隔空操作、不直接接觸物體的安全特性。視源股份依靠研究優勢對手勢交互進行深度研發,力求應用在更多場景、領域、設備中,刷新人們對于多模態的交互體驗。
視覺是人類的重要知覺——定位、識別物體、了解環境甚至是辨別面部表情等都是其承載的功能,視源股份中央研究院以“看清世界 看懂世界”為方針,在醫學影像、3D場景感知、虛擬人、情感智能等垂直領域進行深度探索,致力打造更加多元化的視覺研究和應用。
在白熱化的語音交互賽道,視源結合業務場景對拾音模塊進行深入研究,顯著提升了課堂和會議場景下的音頻拾音質量;通過對語音識別和語義理解方向的研究實現了技術方案平臺化,可為各類智能終端設備提供更便捷且睿智的語音交互。
依托于中央研究院對于基礎技術及應用技術的深層次研究和實踐經驗,視源股份當前已在多個新興領域進行戰略孵化。視源股份始終在積極營造進取、包容和開放的科研環境,緊跟前沿技術的趨勢,大力推進研究成果在未來教育、企業服務、智能硬件、健康醫療等領域的落地轉化,期待充分實現技術的產業價值和社會價值,繼續通過科技創新將夢想變成現實。