“哪里不會點(diǎn)哪里,媽媽再也不擔(dān)心我的學(xué)習(xí)了,so easy!”
當(dāng)年這段廣告詞可謂洗腦神句傳遍大江南北,點(diǎn)讀機(jī)作為教育場景的典型電子產(chǎn)品,也一度風(fēng)靡市場。
隨著AI技術(shù)在教育場景的廣泛應(yīng)用,特別是語音交互技術(shù)豐富了學(xué)生上課體驗(yàn)形式。以點(diǎn)讀機(jī)、學(xué)習(xí)機(jī)、甚至AI虛擬老師等為代表的教學(xué)方式也越來越普及。讓在線教育更加智能化、個(gè)性化,有效解決了學(xué)生們差異化的學(xué)習(xí)需求。
目前,語音合成已經(jīng)進(jìn)入較為成熟的發(fā)展階段,在教學(xué)內(nèi)容生產(chǎn)方面,可以增加配課、點(diǎn)讀等有聲教學(xué)素材,甚至可以取代部分真人對話的教育內(nèi)容,大大降低教學(xué)配音的成本和周期。
例如,在語文、英語等語言學(xué)習(xí)科目中,AI虛擬老師可以通過教學(xué)視頻和語音合成,生成虛擬教學(xué)內(nèi)容,緩解線下教師的工作壓力;學(xué)生則借助智能學(xué)習(xí)設(shè)備,掃描自己想要學(xué)習(xí)的文字或短語,聽取正確的發(fā)音和語調(diào),跟著模仿發(fā)音。
但是在數(shù)理化等科目里涉及到公式的讀法時(shí),大部分語音合成軟件存在一定的難度。對于較為簡單的,如數(shù)學(xué)中的加減乘除、開方、指數(shù)、三角函數(shù)等,一般語音合成軟件通??梢越o出正確的讀法。而對于復(fù)雜的如物理、化學(xué)等領(lǐng)域的公式,由于這些公式中可能包含大量的特殊符號、單位和上下文信息等,需要逐字進(jìn)行轉(zhuǎn)換,耗費(fèi)時(shí)間且準(zhǔn)確率較低。
為了完善AI教育應(yīng)用場景,標(biāo)貝科技通過語音合成前端語言模型優(yōu)化,實(shí)現(xiàn)了語音合成技術(shù)對Latex數(shù)理化公式朗讀的支持,提供更好的教學(xué)體驗(yàn)。
什么是Latex?
LaTeX是一種基于TeX的排版系統(tǒng),由美國計(jì)算機(jī)科學(xué)家萊斯利·蘭伯特在20世紀(jì)80年代初期開發(fā)。 MathJax是一個(gè)跨瀏覽器的JavaScript庫,它使用MathML、LaTeX和ASCIIMathML標(biāo)記在Web瀏覽器中顯示數(shù)學(xué)符號。
舉例↓:
latex公式:
實(shí)際頁面展示的公式:
標(biāo)貝科技基于LaTeX公式的基本組成單元和語法規(guī)則,依托精確的詞法分析和深入的句法分析技術(shù),將復(fù)雜的LaTeX公式拆解為最細(xì)粒度的詞法單元,然后將這些單元映射為能準(zhǔn)確反映LaTeX公式層次結(jié)構(gòu)的抽象語法樹(AST)。
接著再建立一套規(guī)則,用于將LaTeX公式中的符號、元素和命令翻譯成自然語言。通過在AST上進(jìn)行遍歷并應(yīng)用這些翻譯規(guī)則,最終成功實(shí)現(xiàn)從LaTeX公式到自然語言的轉(zhuǎn)換。
目前,標(biāo)貝科技語音合成技術(shù)能夠以通俗易懂的方式朗讀 LaTeX 公式,覆蓋從小學(xué)到初中12年教科書中涉及到的數(shù)學(xué)、物理、化學(xué)公式。同時(shí)標(biāo)貝科技還可以根據(jù)客戶具體需求,定制高中及其他復(fù)雜數(shù)據(jù)符號的科目。
標(biāo)貝科技前端語言模型優(yōu)化定制方案
在語音合成技術(shù)中,前端語言模型主要負(fù)責(zé)對輸入到語音合成系統(tǒng)的文本進(jìn)行分析,并提取發(fā)聲和韻律特征,以便聲學(xué)模型根據(jù)這些特征生成對應(yīng)的語音信號,是處理和生成語音信號的重要環(huán)節(jié)之一。
前端語言模型通常有一些通用方案,但是在不同的業(yè)務(wù)任務(wù)和數(shù)據(jù)特點(diǎn)下,通用方案無法直接將文本轉(zhuǎn)化為可合成的語音信號時(shí),就需要對前端語言模型進(jìn)行改進(jìn)和優(yōu)化。
標(biāo)貝科技可以提供前端語言模型優(yōu)化定制方案,將文本中復(fù)雜的數(shù)字、符號、縮寫等轉(zhuǎn)換成語言文字,客戶無需做二次轉(zhuǎn)換,即可獲得準(zhǔn)確的發(fā)音,提高模型的性能和效果。
例如,除了支持以上LaTeX 公式類的朗讀外,標(biāo)貝科技還可以通過前端語言模型優(yōu)化定制方案,輸出對手機(jī)型號或者各類機(jī)器設(shè)備型號的正確讀法。歡迎新老用戶咨詢體驗(yàn)!