由垂直領(lǐng)域頭部企業(yè)主辦的各類論壇已成為每屆世界人工智能大會(WAIC)的重要組成部分, 7月7日,在WAIC開幕的第二天,由語言智能科技企業(yè)蜜度主辦的“語言智能與內(nèi)容生成高峰論壇”,在上海浦東世博展覽館拉開帷幕。論壇由國家語委中國語言智能研究中心、中國人工智能學會多語種智能信息處理專委會、哈爾濱工業(yè)大學計算學部協(xié)辦,上海市人工智能行業(yè)協(xié)會支持。多位業(yè)內(nèi)知名專家學者、行業(yè)企業(yè)技術(shù)專家齊聚現(xiàn)場,交流分享語言智能與內(nèi)容生成領(lǐng)域的技術(shù)創(chuàng)新與應(yīng)用實踐。論壇現(xiàn)場,蜜度發(fā)布了自研的國內(nèi)頭個專為智能校對領(lǐng)域打造的垂直大語言模型——蜜度文修。
蜜度文修重磅發(fā)布特定任務(wù)表現(xiàn)優(yōu)于通用大模型ChatGPT
在語言智能與內(nèi)容生成高峰論壇上,蜜度文修正式發(fā)布。唐宋八大家之一的歐陽修曾任館閣校勘,校對亦有修文之意,“蜜度文修”便取名于此。蜜度文修專為校對這一垂直專業(yè)領(lǐng)域打造,在中文拼寫勘誤、語法糾正任務(wù)上的表現(xiàn)顯著優(yōu)于通用大模型ChatGPT。
蜜度文修發(fā)布儀式
蜜度文修以大語言模型(LLM)為技術(shù)底座,通過運用高質(zhì)量數(shù)據(jù)學習多種特色子任務(wù),大幅度提升中文校對和潤色能力的智能化程度。截至目前,在公開測試語料評測結(jié)果中,蜜度文修實現(xiàn)各類校對項目F1值(模型比較準確率與召回率的調(diào)和平均數(shù),用以闡述模型完成指定任務(wù)的質(zhì)量)的全面SOTA(state-of-the-art,指模型在指定任務(wù)中的表現(xiàn)為當前業(yè)界特出)。蜜度文修以卓越的實力,不僅輔助專業(yè)用戶提高校對質(zhì)量、提升校對速度、降低差錯率,也為新聞出版、媒體稿件、政務(wù)公文等專業(yè)領(lǐng)域帶來革命性的工作模式迭代與效率提升,為新時代語言文字工作高質(zhì)量發(fā)展注智賦能。
其實,早在2020年,蜜度就推出了智能文本檢測服務(wù),并以深度學習模型為方向,嘗試智能化地解決基礎(chǔ)校對問題。蜜度還成立了多語言校對檢測實驗室,圍繞“文字標點差錯”、“知識性差錯”、“內(nèi)容導(dǎo)向風險識別”三個主要能力開展建設(shè)。在2022年的WAIC上,蜜度發(fā)布了支持本地化部署的蜜度校對通AI-Box,而這也是頭個通過華為昇騰AI生態(tài)認證的自然語言處理智能文本校對應(yīng)用解決方案。2023年初,蜜度智能校對系統(tǒng)成功地入選國家新聞出版署2022年出版業(yè)科技與示范創(chuàng)新項目“科技創(chuàng)新成果”。
今年4月,蜜度智能校對多語言版正式上線,除了漢字、英文之外,還覆蓋了蒙古文、藏文、維吾爾文、朝鮮文、壯文、哈薩克文、傣文、烏孜別克文、柯爾克孜文、俄羅斯文、彝文、傈僳文共計12種少數(shù)民族語言文字。6月,蜜度正式推出中文潤色服務(wù),重點解決用詞不當、句式雜糅等措辭與表述問題。
一個月后,在2023年的WAIC現(xiàn)場,蜜度推出全新的蜜度文修,讓大模型時代的全新工作范式走入校對場景,除了刷新多類校對任務(wù)的理想效果之外,完善了過去較為薄弱的易混詞細微語義辨析難題,同時在尊重原意表達的基礎(chǔ)上,更好地修正句式雜糅、邏輯錯亂等問題,使句子表達更流暢,實現(xiàn)對句子的潤色功能。蜜度文修的發(fā)布,可以視為蜜度在大模型時代,采用與時俱進的前沿科技積極賦能垂直辦公場景的一次實踐。
論壇現(xiàn)場還舉行了科大訊飛與蜜度的合作簽約儀式,科大訊飛開放平臺總經(jīng)理張斌與蜜度首席執(zhí)行官翟光景簽署合作協(xié)議。未來,雙方將深化各自技術(shù)優(yōu)勢,攜手推進智能校對產(chǎn)業(yè)的進階,共同賦能行業(yè)生態(tài),為更多企業(yè)及機構(gòu)提供高質(zhì)量的智能化校對服務(wù)。
科大訊飛與蜜度合作簽約儀式
語言智能與內(nèi)容生成高峰論壇:未來更可期
除了蜜度文修大模型的重磅發(fā)布之外,論壇現(xiàn)場匯集了行業(yè)洞見思考及先驅(qū)科研討論。論壇由哈爾濱工業(yè)大學計算學部長聘教授、人工智能研究院副院長車萬翔主持,微博COO、新浪移動CEO、新浪AI媒體研究院院長王巍致辭。
隨后,業(yè)內(nèi)重量級專家學者進行了主旨演講。硅谷人工智能研究院(SVAIRI)創(chuàng)始人、《硅谷百年史》與《人類2.0》的作者皮埃羅·斯加魯菲帶來在《Transformer模型——新型內(nèi)容生成計算機架構(gòu)》的主旨演講。國務(wù)院國有資產(chǎn)監(jiān)督管理委員會新聞中心副主任、《國資報告》雜志社總編輯閆永則以《AIGC時代全媒體傳播內(nèi)容的供給側(cè)改革》為題進行主題分享;國家語委中國語言智能研究中心主任、中國人工智能學會語言智能專委會主任周建設(shè)分享了語言智能與智性工具革命間的內(nèi)容;哈爾濱工業(yè)大學計算學部教授、自然語言處理研究所副所長秦兵則發(fā)表了題為《大語言模型之安全性檢測及人類價值觀對齊》的主旨演講,關(guān)注人工智能發(fā)展征程中繞不開的安全與倫理議題;中國人民大學信息資源管理學院副教授夏天以《智能校對領(lǐng)域大語言模型的探索與實踐》為題,回顧了校對場景下AI能力的幾次里程碑式躍升,也對大模型時代的智能校對產(chǎn)品提出了新的希冀。
隨后,來自不同領(lǐng)域的學者專家共同探討了技術(shù)變革帶來的機遇和挑戰(zhàn)。蜜度首席技術(shù)官劉益東主持討論,中國信息通信研究院云計算與大數(shù)據(jù)研究所內(nèi)容科技部主任石霖,復(fù)旦大學新聞學院教授、副院長周葆華,人民中科(北京)智能技術(shù)有限公司總裁余昊楠,中國科學院信息工程研究所副研究員周薇與科大訊飛AI云產(chǎn)品總監(jiān)張林芳帶來精彩見解。
蜜度于WAIC盛會期間主辦語言智能與內(nèi)容生成高峰論壇,交流分享語言智能與內(nèi)容生成領(lǐng)域的技術(shù)創(chuàng)新與應(yīng)用實踐,用創(chuàng)新助推大模型的演進,持續(xù)以優(yōu) 秀的模型能力,解決真實場景中的用戶需求,為數(shù)字政府、數(shù)字營銷、數(shù)字媒體、數(shù)字城市的建設(shè)提供全方位的智能應(yīng)用解決方案,深度賦能政府與企業(yè)辦公場景的數(shù)字化、智能化轉(zhuǎn)型升級,為千行百業(yè)的革新發(fā)展提供動力。
(推廣)