近年來,大數據、5G、AI技術應用快速發展,助力我國教育信息化水平不斷提升,并催生大量在線教育新場景、新模式、新業態,有效滿足人們多樣化學習需求。
5月13日,在北京師范大學珠海校區,作業幫首席算法專家宋旸受邀和該校統計學院應用統計專業碩士生進行了分享。宋旸就統計學在具體場景下的實踐、泛AI技術在產品業務中發揮的作用等方面進行了講解。
宋旸同時受聘為北京師范大學統計學院應用統計專業碩士兼職導師。
分享現場
數據思維貫穿研發迭代全過程
據了解,作業幫旗下產品日活超5000萬,月活突破1.7億,擁有3億的大數據題庫,每天都在源源不斷地產生海量數據。如何把數據轉化成工作中的生產力,變成企業的競爭力,是日常研發與產品迭代中都面臨的課題。
宋旸介紹,將數據思維貫穿在作業幫產品實驗、分析、優化過程,有助于作業幫完善產品功能。例如,作業幫的海量知識點重要性均是根據學生搜題頻次等多項數據而定。
此外,作業幫對于數據細節處理十分重視,宋旸認為不同的理解和認知,不同的處理經驗和技巧,都會對最終結果產生重要影響。以拍照搜題為例,為了更好地對拍照搜題每天產生的過億張圖片進行隨機抽取處理,作業幫對多種算法進行深入比較,全面分析利弊,最終找出全新算法策略。宋旸表示,“在統計算法加持下,任何小問題都會變得優雅且高效。”
數據分析帶來精準洞察泛AI技術激發產品潛力
數據分析為作業幫具體業務帶來了精準洞察。為了讓用戶擁有更好地體驗,作業幫會基于數據的分析進行改進。
統計學也為產品帶來了算法利益,泛AI技術的應用則進一步激發了作業幫產品的潛力。據了解,目前,圖像、計算推理、檢索及NLP、語音、基礎數據挖掘等基礎技術,已成熟應用在口算批改、拍照搜題、智能客服等多項產品中。
以拍照搜題為例,在日常應用中存在光照不均、異常模糊、傾斜扭曲等難點,作業幫利用圖像與OCR技術完整識別流水線,包含超過30種神經網絡,針對上述難點專項解決。文字的一次識別需要260次以上神經網絡預測,平均耗時僅需200ms,每分鐘響應高達100萬次搜題請求。
與此同時,語音技術、自然語言處理技術、機器學習技術等AI技術也廣泛應用在作業幫的教學實踐中。在課堂語音彈幕應用中,語音技術能夠成功識別老師的語音,并據此匹配特殊顏色等互動內容,有效吸引學生注意力,調動課堂互動積極性。
宋旸表示,從數據分析到數據洞察,作業幫讓數據在每一個細節上發揮重大作用,并指導產品的最終決策。在統計學與AI技術應用的雙驅動下,作業幫產品不斷趨于完善,持續刷新用戶使用體驗。