近期,中國計算機學會計算機視覺專委會(CCF-CV))年度學術研討會RACV(Recent Advances on Computer Vision)在大連成功召開。本次會議開幕式由專委會副主任、上海科技大學虞晶怡教授主持,中國計算機學會秘書長唐衛清研究員和大連理工大學盧湖川教授致開幕辭,來自清華大學、北京大學、上海交通大學、中科院等高校、學術機構的研究者們與百度、華為、微軟亞洲研究院、航天宏圖、合合信息等科技企業的技術專家受邀參與討論。
RACV2022與會嘉賓合影
中國計算機學會計算機視覺專委會 (下稱“專委會”)是直屬于中國計算機學會的計算機視覺領域的專業分支機構,其目標是基于計算機視覺學科的專業內容,更好地開展學術/技術交流、發展戰略研究,促進國內學者間的了解與合作,推動國內計算機視覺學科發展,提升我國計算機視覺研究在國際領域的影響力。RACV定位為國內計算機視覺領域的小規模精品研討會,旨在通過務實、開放與平等的對話與討論,深入發掘相關研究領域潛在的問題,為廣大的科研人員提供觀察問題的新視角與新觀點。
根據專委常委會前期的討論票選,本次會議設置了3項核心研討主題。在主題一“視覺基礎模型”研討會上,與會嘉賓對掩碼圖像建模、自監督表征預訓練、語言對視覺基礎模型的作用等問題進行了探索;主題二“三維重建和沉浸式渲染”則重點關注神經網絡渲染和生成技術、三維重建和沉浸式渲染的學術前沿和發展方向、元宇宙背景下的商業前景和潛在風險;主題三為“具身視覺”,主要討論具身智能的核心科學問題及在計算機視覺領域的角色、技術路線、評價標準、如何推動智能機器人落地等議題。
主題研討環節中,各位專家學者就上述主題展開深度交流,合合信息自然語言算法研發總監丁凱博士、圖像算法研發總監郭豐俊博士也針對“視覺基礎模型”、“三維重建和沉浸式渲染”兩個議題發表觀點,提出視覺基礎模型在與其他模態進行融合時,可關注如何與現有的結構化的知識進行融合,提升視覺基礎模型的理解能力。此外,三維重建、沉浸式渲染等技術目前在元宇宙的背景下更聚焦于視覺重建。這些技術如何更好地與人類的常識和知識相結合,以實現虛擬世界人與人之間順利溝通、互動的愿景,將成為未來商業化前景的新增量。
合合信息是一家人工智能及大數據科技企業,從2006年創立至今,在智能文字識別應用領域有著十余年研究積淀。據悉,合合信息專注于智能文檔圖像處理、復雜場景文檔識別、手寫字跡擦除等技術,近三年來先后在ICDAR、ICPR等15項人工智能國際競賽中斬獲冠軍,學術成果發表于CVPR、AAAI、ACL等頂會。合合信息運用多項創新技術,顯著提升復雜場景下文字識別與理解的性能和效果,相關項目曾獲中國圖象圖形學學會(CSIG)科技進步獎二等獎,并被應用于C端、B端產品以及行業解決方案,為全球百余個國家和地區的億級用戶提供數字化、智能化服務。