12月23日,2020中國教育科技大會于北京召開。本屆教育科技大會以“新業態·新動能·新教育”為主題,圍繞中國教育進行深度剖析,并以最新、最全、最優的視角,全方位深入教育本質,聚焦業態發展。作業幫智能技術實驗室負責人王巖出席會議,并進行了《創新科技助力作業幫在線教育》主題演講,對教育科技的應用和創新發表前瞻性觀點。
據了解,中國教育科技大會由中國計算機用戶協會指導,iTechClub(互聯網技術精英俱樂部)教育專委會主辦,是國內互聯網技術領域最專業、最具影響力的大型教育科技類行業盛會,通過站在行業前沿角度,以演講、分享、討論、交流等不同的方式,深耕教育科技本源,促進中國教育行業的創新發展。
王巖表示,目前在線教育已經進入了新的發展階段,不僅需要對優質內容進行嚴格把控,同時還必須深耕用戶體驗。為此,作業幫持續更迭OCR技術進階拍搜體系,以多線性思路兜底知識索取,同時發力AI技術在直播課中的深度應用,打造強交互和場景化在線課堂。
作業幫拍搜技術向上突破,承接全國中小學生釋疑需求
近年來,作業幫拍照搜題成為全國中小學生快速獲取知識的重要工具。據王巖介紹,早期經過研發和探索,作業幫拍搜系統在后臺開發及測試階段已經能達到較高的準確率。“簡單來看,初級的文字識別基本框架僅分為前處理、文本行分割、文本識別和結果輸出四個部分。對于一位熟悉計算機視覺和深度學習的研究生而言,利用公開的資源和數據集,以及現成的深度學習框架,也許兩周內就可以搭建出一個系統,并能有效識別清晰圖片。”
然而在實際上線之后,系統在識別過程中遇到難題。隨著用戶體量日益擴大,用戶使用設備、拍照習慣、題目呈現效果存在顯著差異性,從而產生模糊、傾斜、低像素、干擾等現象,使得實際識別準確率下降。
為解決拍搜系統遇到的一系列問題,作業幫發力OCR識別技術,自研拍搜架構。王巖介紹,這套系統是作業幫通過持續5年的自主研發和數據積累,不斷進行功能迭代的重要成果。在完整的文字識別流水線中,超過30種不同的神經網絡各司其職,每做一次拍搜文字識別,將運行260個以上神經網絡的預測。而如此復雜的算法,則通過大規模的并行化、集群化的服務器,實現200ms內完成的極高效率,甚至可以對整張試卷進行快速識別。
依托于自研的拍搜架構,作業能夠有效擊破用戶識別場景多元而衍生的系列問題,提升識別精準性,幫助用戶實現提問與釋疑的無縫銜接,優化知識獲取效率。
精準識別+完整視頻講解+即時在線問答,作業幫搜題體系全面進化
在快和準上進行極致化探索僅僅是拍照搜題功能升級的第一關,將重心置于教學思路的講解和輸出,才是契合教育本質的發展方向。
以教育普惠為核心理念作業幫早已孵化出完備的拍搜業務線,用戶在精準匹配到題目之后,還能夠獲取詳細的解析過程以便于思考和歸納。同時,針對書面講解不夠直觀易懂的痛點,作業幫錄制了大量解題視頻,實現圖文并茂、細致解說。據了解,目前五成以上的搜索結果均配備講解視頻。此外,為全面兜底搜題需求,作業幫還設置真人老師在線答題,能夠針對學生疑問進行進一步解答,幫助用戶對題目考察內容產生深入、透徹的理解,真正掌握知識點。
王巖介紹道,結構化的拍搜體系不再是一項簡單的輔助型工具,而是穿透整個教研的重要力量。據了解,目前作業幫拍搜系統每分鐘可以處理100萬次的完整識別流水線,識別完成后,內容立刻被傳送至搜索引擎,匯聚成包含超3億題目的海量題庫。基于題庫,作業幫還運用大數據算法深入洞察全網學習動態,智能分析熱門知識點分布及難點,賦能自身及全國各地教研體系。
在拍搜系統、大數據和龐大用戶體量的多重加持下,作業幫教研團隊可以快速明確某地區某時間甚至某學校中,最困擾學生的知識點、最容易錯的題目。此技術或將有效幫助教育部門制定教學計劃,提高教學效率,發揮在線教育的社會價值。
音視頻AI嵌入直播課架構,作業幫開啟學習場景化全面探索
不限于拍照搜題,作業幫還將直播課作為輸出優質教育資源的關鍵抓手,通過發力AI技術,瞄準線下教育特性,深入探索場景化學習,匹配用戶對于課堂體驗的多重訴求。
具體而言,作業幫運用RTC協議自研音視頻互動直播技術架構,完整支持1對1輔導、一對多大班課、1對6小班互動課、多對多互動大班課等等各類班型。王巖介紹,這一套系統基于遍布全國的節點,可以為老師和學生提供足夠好的音視頻互動交互。其中,視覺AI的運用則能夠在直播課中實現監測上課狀態、優化課堂效果的雙向效果,拉齊線下課程面對面的教育價值,輻射全國孩子的學習圈,帶來在線教育的高位運行。
就課堂效果而言,作業幫面向低年級孩子推出自研課堂手勢交互功能,通過本地AI能力進行準確的手勢識別,規避了點選參與感不足的問題,提升課堂趣味性。語音彈幕功能則使用自研語音識別能力,避免打字互動時鍵盤遮擋影響教學效果的情況。
演講中,王巖分享了語音功能升級帶來的強互動性。“在語言課程的拼讀環節中,可以給每一個學生都提供評價功能,在答題環節,老師能請學生直接用語音彈幕回答,回答內容將會被迅速識別,并在教師端進行匯總。”在作業幫的直播課堂上,沒有一個孩子被“隱身”,每位學生都有公平互動和表達的機會,老師也可以掌握臺下所有學生的回答情況。
在對學生上課狀態的把握上,作業幫則利用部署在用戶終端的神經網絡搭配云端集群,對學生進行智能識別,包括是否在座位、是否有家人陪同上課、是否專心聽課、離屏幕的距離是否過近或過遠。而主講老師通過學生狀態采集、課中實時匯總、課后分析報告,反哺老師教學能力,輔導老師則能夠運用專注力匯總,近距離與學生互動,全面感知學生個體。
基于近五年對于OCR、AI等教育技術的深耕,作業幫實現了在線教育效率化、實感化,化解了與線下教育的顯著區隔,并將彌補傳統課程的諸多壁壘,輻射多元學習場景。對于下一個五年的愿景,王巖表示,作業幫仍在對在線教育進行更加深入的研究,今后也將持續聚焦教育科技,以成熟化的新技術強化學習場景感官,推動新教育行業的更大變革。