在剛剛結束的Voice Conversion Challenge2020 國際音色轉換大賽中,科大訊飛與中科大語音及語言信息處理國家工程實驗室聯合提交的系統,在「同語種轉換」與「跨語種轉換」兩項任務上,摘下8項指標7項第一,成功衛冕。這個系統也是本次比賽在「相似度」和「自然度」上,受日語、英語兩組測聽人共同認可、唯一一家超過4.0MOS分的系統,即達到真人說話水平。
今年的比賽由日本國立情報學研究所(NII)發起,吸引了東京大學、名古屋大學、中國科學技術大學等學界、業界上百家單位報名。與以往不同,本次比賽除了傳統的同語種轉換任務,還第一次包含了跨語種轉換的任務。同語種轉換是機器通過語料訓練,模擬出發聲人的聲音特點和神韻,達到所謂的“變聲”效果;而跨語種轉換可以說將難度提升了不止一個臺階,簡單來說是機器通過非平行的語料訓練,模擬出發聲人“說”其他國家語言的聲音,是“變聲”的更高階展示。針對本次比賽的不同任務,科大訊飛專門研發了不同的技術路線,以保證系統優勢,均取得了優異成績。
據悉,這項“聲音復刻”技術可以用在變聲、多語種虛擬主播、虛擬偶像等各個領域。
無獨有偶,在國際比賽摘得桂冠的科大訊飛,最近提出的A.I.數據質量國際標準項目《人工智能-分析和機器學習的數據質量-第4部分:數據質量過程框架》順利通過ISO/IEC國際標準化組織立項,將助力人工智能數據標準化建設,提升人工智能數據質量,推動全球人工智能產業高質量發展。這也是中國首個ISO/IEC人工智能國際標準項目獲批立項。
該標準將由科大訊飛專家作為項目負責人與全球各國專家共同制定,這也是中國首個牽頭制定的ISO/IEC人工智能國際標準項目。此前,由ISO/IEC批復立項,科大訊飛專家任項目負責人的中國首個牽頭制定的ISO/IEC人工智能國際標準技術報告ISO/IEC TR 24372《人工智能-人工智能系統計算方法概述》也正在制定中。
此次科大訊飛提出的ISO/IEC 5259-4《人工智能-分析和機器學習的數據質量-第4部分:數據質量過程框架》經過與各國專家近一年半的研討交流和歷時三個月的國家成員體投票,成功成為ISO/IEC人工智能數據質量標準體系中的一部分,將聯合德國、美國、日本、韓國等國家共同為全球人工智能產業打造數據質量的標準依據。
人工智能的落地與進階在于深入行業,而行業大數據作為直接影響A.I.模型和系統的因素,其質量在很大程度上也決定了人工智能發展的質量。當前,數據已經被認為是新一代人工智能,特別是基于深度學習的人工智能系統中最重要和最關鍵的基礎要素之一。對于不同學習方法和不同應用領域,在構建、訓練、評估和迭代人工智能系統的過程中,數據質量將是人工智能開發者、使用者、評估者和監管者首要考慮的問題之一。
未來,A.I.賦能各行各業并深刻改變世界的生產和生活方式的條件之一,是需要源頭技術、行業大數據和產業生態的融合,這對于面向A.I.的數據質量提出了更高的要求。一直以來,科大訊飛在A.I.技術創新和應用落地過程中,堅持將高質量數據作為大規模應用的重要驅動之一,促進A.I.產品和服務更可用、更可靠、更可信,為社會創造更多價值。