前言
通用AI是一種能夠像人類一樣進行思考、學習和推理的人工智能系統。與特定領域的人工智能不同,通用AI可以處理各種類型的任務,包括自然語言處理、圖像識別、機器學習等,具有廣泛的適用性和高度的靈活性。
通用AI的應用前景非常廣闊,它可以在醫療、交通、金融、教育、娛樂等各個領域發揮作用,為人類帶來更好的生活體驗和更高效的工作方式。
通用AI的應用場景
通用AI所涉及的應用場景十分廣泛,由于它不需要人工進行相關的訓練,而且還可以從以往的經驗中不斷學習和改進,所以可以幫助加快許多行業的發展速度,并且在其中發揮著非比尋常的作用,通用AI在熱門行業領域中的應用如下:
互聯網行業
人證核身 IVS 可用于游戲/直播/婚戀交友平臺用戶實名認證,響應國家監管要求,防止出現業務風險。
內容審核可用于涉黃、涉政暴恐、涉政敏感人物審核,監控范圍覆蓋用戶昵稱、聊天圖片、音視頻,發布內容等。
語音交互 SIS 可用于游戲互動場景,將語音轉成文字信息;或游戲配音時,將腳本信息轉化為近似的真人發聲。
金融服務
文字識別OCR可以用于銀行、證券、保險等金融機構的身份證、銀行卡、合同等的識別和驗證。
人證核身IVS和人臉識別FRS可以用于銀行、證券、保險等金融機構人臉識別、身份驗證等場景,提高安全性和客戶體驗。
語音交互SIS可以用于銀行、證券、保險等金融機構的語音客服、自助服務等場景,提高客戶體驗和服務效率。
對話機器人CBS可以幫助銀行、保險等機構處理客戶的咨詢、理賠等事項。
交通運輸
文字識別 OCR 可用于智慧停車、交通監管的車牌識別場景。
文字識別 OCR 和人證核身 IVS 可用于網絡貨運/網約車/代駕的司機身份認證場景,保障實際承運人和注冊人保持一致。
文字識別 OCR 可用于物流快遞的快遞分揀、包裹派件場景,自動識別物流面單信息。
教育
文字識別OCR可以用于學校的考試卷、試題、論文等的處理和評分。
人證核身IVS和人臉識別FRS可以用于學校的考勤、門禁管理、預防考生代考等場景,提高學校管理效率和安全性。
語音交互SIS可以用于學校的語音教育、智能評測等場景,提高教育效果和教育質量。
對話機器人CBS可以幫助學生進行題目練習、知識點講解等。
電商零售
文字識別OCR可以用于商場、超市的商品條碼、價格標簽等的掃描和識別。
人證核身IVS和人臉識別FRS可以用于商場、超市的人臉識別、客流分析等場景,提高營銷和客戶體驗。
對話機器人CBS可以幫助電商平臺、零售店鋪等提供智能客服服務,提高售后服務質量。
內容審核 Moderation 可用于稽核產品宣傳是否違反廣告法,是否違規,防止出現業務風險。
華為云解決方案
華為云通用AI七件套定位為企業AI生產力工具,將算法專家的積累和行業專家的知識沉淀在相應的套件和“行業工作流”(Workflow)中,幫助企業快速使用AI技術,實現內容的自動化處理。
文字識別 OCR:文字識別(Optical Character Recognition,簡稱 OCR)提供在線文字識別服務,將圖片、掃描件或 PDF、OFD 文檔中的文字識別成可編輯的文本。支持通用類識別、證件類識別、票據類識別、行業類識別、自定義定制模板識別等。
人臉識別服務 FRS:人臉識別服務(Face Recognition Service),能夠在圖像中快速檢測人臉、分析人臉關鍵點信息、獲取人臉屬性、實現人臉的精確比對和檢索。該服務可應用于身份驗證、電子考勤、客流分析等場景。
人證核身解決方案 IVS:將用戶本人與身份證信息關聯起來,應用人臉識別與文字識別等技術,對接權威數據庫,支持基于二要素(姓名、身份證)認證或三要素(人臉、 姓名、身份證)認證,實現對身份真實性的精準核驗。
實時語音識別 RASR:實時語音識別(Real-time ASR),將連續的音頻流實時轉換成文本,語音識別更快。可應用于直播實時字幕、會議實時記錄、即時文本生成等場景。
圖像識別 Image :圖像識別(Image Recognition),基于深度學習技術,可準確識別圖像中的視覺內容,提供多種物體、場景和概念標簽,具備目標檢測和屬性識別等能力,幫助客戶準確識別和理解圖像內容。
內容審核 Moderation:內容審核(Content Moderation),基于圖像、文本、音頻、 視頻檢測技術,可自動進行涉黃、廣告、涉暴等內容檢測,幫助客戶降低業務違規風險。
視頻編輯 VCP:視頻編輯(Video Content Processing)服務,基于對視頻的整體分析,提供封面、拆條、摘要等能力。
通用AI服務以公有云服務為主,同時支持私有化部署,可選擇部署在本地服務器。華為云不僅提供 AI 原子能力,幫助客戶快速集成和應用落地,同時也接受客戶定制化需求。客戶可提供需求文檔、交付時間和交付標準,由華為云評估進行定制開發。
解決方案核心亮點
超高性能
識別率業界領先:語音交互服務基于深度學習技術,對特定領域場景的語音識別進行優化,識別率達到業界領先。
檢測范圍多場景覆蓋:圖像識別服務中圖片內容審核覆蓋涉黃、低俗、廣告、涉政涉暴、涉政敏感人物和不良場景等多種違規風險的智能審核。
定制化識別,效果更精準:實時語音識別針對客戶的特定場景需求,定制垂直領域的語音識別模型,識別效果更精確。
實戰演練,穩定可靠:內容審核服務成功應用于各類場景,基于華為等企業客戶的長期實踐,經受過復雜場景考驗。
簡單易用
簡單上手,便捷高效:人臉識別服務提供的應用程序接口功能明確。
簡單易用:配套文檔描述詳細,調用服務方式包含API和SDK兩種,方便客戶使用與集成。
增值服務全套配齊:人證核身解決方案配套人臉識別 FRS、文字識別 OCR 等多種增值服務可供訂閱使用。
降本增效
減少人力,節省成本:幫助客戶減少人力成本,節省業務支出。
按需計費,經濟劃算:以調用次數/調用時長計費。
安全可信
服務環境更安全:華為云承諾不保存服務過程數據和用戶隱私數據 。
權威數據更可靠:人證核身解決方案服務數據來源自國家權威機構公安第一研究所和全國身份證信息查詢中心。
BSI 權威認證更可信:華為云 OCR 服務通過德國 BSI AIC4 可信標準審計認證。
華為云通用AI體驗
華為云通用AI是華為云推出的一款人工智能服務,它可以為企業提供豐富的AI能力,包括圖像識別、語音識別、自然語言處理等多種領域。華為云通用AI的目的是讓企業快速、便捷地實現數字化轉型,提升業務效率和用戶體驗。
下面結合應用場景對文字識別OCR、人證核身IVS、人臉識別FRS、語音交互SIS、對話機器人CBS等產品進行測評。
文字識別OCR
文字識別OCR可以用于銀行、證券、保險等金融機構的身份證、銀行卡、合同等的識別和驗證;醫院的病歷、影像、處方等的識別和管理;學校的考試卷、試題、論文等的處理和評分;商場、超市的商品條碼、價格標簽等的掃描和識別。
開通服務
這里我開通了智能分類識別、通用文字識別、車牌識別、身份證識別、發票驗真、增值稅發票識別五個熱門服務,調用服務有SDK和API兩種方式,下面以API調用身份證識別服務為例演示一遍。
產品體驗
首先下載Postman配置文件下載地址
在API工具上導入配置文件
Token認證鑒權
傳入參數,這里傳入圖片的base64編碼,發送后會返回識別到的信息
產品優勢
識別準確率高達 99.9%。采用先進的自研深度學習算法,結合億萬級海量標注數據樣本訓練,針對各種業務場景優化。
推出業內第一款智能分類超級 API,只需要調用 1 個API,即可同時識別各類票據、卡證類圖片,調用更簡單,且識別準確率業內領先。
支持用戶自定義模板,對于版式固定的各種票據和卡證,均可通過可視化界面操作,指定需要識別的關鍵字段。識別準確率和操作便捷性,均領先于友商。
人臉識別FRS
人臉識別FRS可以用于銀行、證券、保險等金融機構人臉識別、身份驗證等場景,提高安全性和客戶體驗;醫院的門診、住院管理等場景,提高醫療服務效率和安全性;學校的考勤、門禁管理等場景,提高學校管理效率和安全性;商場、超市的人臉識別、客流分析等場景,提高營銷和客戶體驗。
開通服務
華為云人臉識別服務 FRS有以下四大功能。
人臉檢測:可快速檢測圖像中是否有人臉,并返回所有人臉位置。
人臉比對:對比兩張圖像中的人臉信息,分析面部特征,判斷是否為同一人。
人臉搜索:搜索圖庫并返回與輸入人臉最相似的N張人臉圖像。
活體檢測:提供兩種檢測方法,判斷圖片、視頻中人物是否為真人活體。
這里演示一遍調用人臉對比服務API,調用方法可參考用戶指南。
產品體驗
傳入兩張照片,可以傳入base64編碼也可以直接傳入路徑或者選擇文件。發送后會返回照片的基本信息以及相似度,一般情況下超過0.93即可認為是同一個人。
產品優勢
識別準確:準確檢測人臉,為多場景提供有力支撐,人臉比對在 LFW 公開測試集上的準確率為 99.6%+。
服務豐富:已開放人臉檢測、比對和搜索服務,即將開放動態人像、年齡識別、 特征點定位等服務。
穩定可靠:在海量圖片特征庫中進行人臉搜索等功能經華為企業客戶的長期實踐,功能穩定,時延可控。
簡單高效:服務提供的應用程序接口功能明確,簡單易用;配套文檔描述詳細, 方便客戶使用與集成。
人證核身IVS
華為云人證核身IVS有以下兩個版本:
? 人證核身標準版(三要素):適用于通用的身份核驗場景用戶上傳本人照片(可進行活體檢測,確保由真人操作,抵御照片攻擊)和身份證照片,使用華為云文字識別服務識別證件內容(如姓名、身份證號等),及人臉識別服務確認操作者為證件主人,并對接公安部權威數據庫進行實名認證。
? 人證核身證件版(二要素):適用于僅需實名認證身份證信息,無需人像識別的核驗場景用戶上傳本人身份證照片,使用華為云文字識別服務識別證件內容(如姓名、證件號等),并對接公安部權威數據庫進行實名認證。
兩個版本的本質就是調用文字識別OCR和人臉識別FRS服務獲取信息,然后對接公安部權威數據庫進行實名認證。
開通服務
兩個版本調用API接口使用服務的流程一樣,這里以人證核身證件版(二要素)為例演示一遍,具體操作可參考用戶指南。
產品體驗
傳入參數,這里傳入圖片的base64編碼,發送后會返回識別到的信息。
產品優勢
權威可信:服務數據來源自國家權威機構公安第一研究所和全國身份證信息查詢 中心。
配套豐富:配套人臉識別 FRS、文字識別 OCR 等多種增值服務可供訂閱使用。
超高性能:低延時、高吞吐、迅速響應拓容需求。
安全可信:華為云承諾不保存服務過程數據和用戶隱私數據。
語音交互SIS
語音交互SIS可以用于銀行、證券、保險等金融機構的語音客服、自助服務等場景,提高客戶體驗和服務效率;醫院的語音診斷、智能問診等場景,提高醫療服務效率和醫療質量;學校的語音教育、智能評測等場景,提高教育效果和教育質量。
開通服務
華為云語音交互SIS包含以下四種服務:
實時語音識別:將連續的音頻流實時轉換成文本,語音識別更快。可應用于直播實時字幕、會議實時記錄、即時文本生成等場景。
一句話識別:一句話識別將口述音頻轉換為文本,通過API調用識別不超過一分鐘的不同音頻源發來的音頻流或音頻文件。適用于語音搜索、人機交互等語音交互識別場景。
錄音文件識別:錄音文件識別,基于深度學習技術,可以實現5小時以內的音頻到文字的轉換。支持垂直領域定制,對應領域轉換效果更佳。
語音合成四種服務:語音合成服務提供在線語音合成能力,支持將文本信息實時轉化為近似的真人發聲,支持多語言多音色語音在線合成。支持客戶的個性化語音定制化需求。
產品體驗
通過語音合成,實現高品質的機器人發聲,使得人機交互更加自然。語音合成精品發音人,50個字符內(含50個)記為1次計費調用;普通發音人,100個字符內(含100個)記為1次計費調用。
產品優勢
識別準確率高:采用最新一代語音識別技術,基于深度神經網絡(Deep Neural Networks,簡稱 DNN)技術,大大提高了抗噪性能,使識別準確率顯著提升。
識別速度快:把語言模型、詞典和聲學模型統一集成為一個大的神經網絡,同時在工程上進行了大量的優化,大幅提升解碼速度,使識別速度在業內處于領先地位。
多種識別模式:支持多種實時語音識別模式,如流式識別、連續識別和實時識別模式,靈活適應不同應用場景。
定制化服務:可定制特定垂直領域的語言層模型,可識別更多專有詞匯和行業術語,進一步提高識別準確率。
總結
通用AI的意義在于它可以應用于各個行業領域,幫助人們更高效、更準確地完成各種任務。可以通過自動化、智能化等方式提高生產效率、降低成本、提高質量、提高客戶滿意度等,從而推動各個行業的發展。因此,通用AI的發展具有重要的戰略意義和經濟價值。
當下正值開年企業采購旺季。為在采購高峰更好服務企業客戶,華為云發起開年采購季活動,旨在讓廣大中小企業享受到更多優質產品、更大福利優惠,一鍵省心上云,實現穩定持續增長。
據悉,華為云開年采購季推出包含通用 AI 在內的多款熱門產品及解決方案,以最大誠意幫助中小企業輕松上云。同時,活動還將同步開啟華為云企業快成長直播間,以技術和資源賦能,讓企業省心上云,數智升級快人一步。