聽說新疆又上熱搜了。
當然,這次還是因為傳說中神秘的“喀納斯水怪”。
雖然最后景區(qū)工作人員回應了水中黑影是哲羅鮭,否認了“水怪”的說法。但是并不妨礙人們對于神秘、美麗的新疆喀納斯的向往。
近年來,隨著“一帶一路”發(fā)展戰(zhàn)略的推進,擁有極其豐富資源的新疆作為“絲綢之路經濟帶”核心地區(qū),已經成為我國西部地區(qū)經濟增長重要支點,與其他民族之間的交融與日俱增,越來越多的人開始了解新疆。
新疆作為我國少數民族自治區(qū),近50%的人口是維吾爾族,以維吾爾語為其主要使用語言,其中有很大一部分人不懂得漢語。
隨著AI的飛速發(fā)展,應用場景不斷擴展,智能語音設備無處不在,對于方言語音識別的需求也在日漸增加。為了讓維吾爾族民眾也能夠享受人工智能、大數據、云計算等新技術為工作生活所帶來的便利,標貝科技基于深度學習平臺以及維吾爾語大量詞匯,推出維吾爾語語音識別服務,助力維漢之間商業(yè)文化的交流,推動當地經濟社會全面發(fā)展。
標貝維語語音識別能力
語音識別是解決讓機器聽得懂的問題,但是受復雜的外部因素影響,如環(huán)境噪聲、多人對話、方言口音等,都會對識別結果造成一定干擾,一旦識別錯誤,就可能影響溝通雙方對信息的理解。
標貝科技基于自研的深度神經網絡訓練聲學模型,并采用大量維語語料數據進行模型和系統的迭代調優(yōu),最終輸出可以商業(yè)化的維語語音識別服務能力,整體識別速度和準確率可以滿足多種語音交互場景的個性化需求。
例如,在智能客服領域,針對人工坐席與客戶的通話錄音進行智能話務質檢,幫助客服提升服務質量;在政務應用方面,可以為新疆地區(qū)公安、司法等機構提供智能會議語音轉寫方案,為法院提供智能庭審實時語音轉寫系統,讓信息溝通變得順暢,有效提升政法機構業(yè)務效率;在線教育場景中,精準識別維語學習者的口語發(fā)音、表達能力并進行分析,快速提高口語能力。
標貝維語語音數據庫
眾所周知,基于機器學習的各種技術,往往都離不開算法和數據的積累。而想要提高語音識別的準確率,就需要大量的優(yōu)質語音數據作為模型訓練支撐。
維吾爾語是新疆維吾爾自治區(qū)的官方語言之一,目前我國境內使用人口約有1,500萬。由于其黏著性語言的特征,利用豐富的詞綴可以產生超大詞匯,讓維吾爾語語音在采集、標注上的難度高于國內其他語言,導致維語的語音識別訓練語料始終稀缺,給語音識別帶來很大困難。
面對以上難題,標貝科技在上線維語語音識別服務前,就已經推出800小時、1000多人參與錄音的成人維語朗讀及自由交談數據庫,已經完成標注,數據質量達到商業(yè)化的要求。
成人維吾爾語朗讀數據庫
數據庫特點:朗讀類語音
錄音環(huán)境:安靜室內
數據時長:600 h
錄音人數:605人
錄音語料:通用
文件格式:WAV
語音參數:16kHz/16bits
錄音設備:手機
適用領域:可應用于智能客服、智能家居等語音識別場景
成人維語自由交談數據庫
數據庫特點:自由交談類語音
錄音環(huán)境:安靜室內
數據時長:200 h
錄音人數:450人
錄音語料:通用
文件格式:WAV
語音參數:16kHz/16bits
錄音設備:手機
適用領域:可應用于智能會議系統、輸入法、社交等語音識別場景
歡迎對以上數據集感興趣的行業(yè)伙伴聯系我們~
伴隨此次維語語音識別能力的上線,當前標貝科技可以支持中文、英文、粵語、維語四種語言的語音識別,廣泛應用于工作、生活、學習多種場景。未來,標貝科技將在技術創(chuàng)新和數據服務的基礎上,持續(xù)為AI產業(yè)打造更準確、更高效的語音識別服務。