文 | AI國際站 唐恩
編 | 艾娃
本文由AI國際站 原創(chuàng)出品,未經(jīng)許可,任何渠道、平臺(tái)請勿轉(zhuǎn)載,違者必究。
預(yù)測機(jī)器為人工智能業(yè)務(wù)提供了直觀且急需的介紹,新事物與有效的事物之間存在區(qū)別。您只需要看一下在拉斯維加斯舉行的年度消費(fèi)電子展(CES),就可以發(fā)現(xiàn)我們創(chuàng)造的技術(shù)中有多少?zèng)]有被削減,而是因?yàn)檎也坏接行У纳虡I(yè)模式而被扔進(jìn)了創(chuàng)新的垃圾箱。
哪里人工智能將焉附?機(jī)器學(xué)習(xí)的最新進(jìn)展無疑給人工智能帶來了很多興奮和恐懼。超越人類冠軍的游戲機(jī)器人。一種可在短短幾秒鐘內(nèi)撰寫文章的生成文本的AI??梢蕴崆皫啄隀z測出癌癥的醫(yī)學(xué)成像算法。這些技術(shù)進(jìn)步中有多少實(shí)際上已成為主流?其中有多少是不必要的炒作?人工智能將如何影響工作?機(jī)器學(xué)習(xí)如何改變公司的商業(yè)模式?
Ajay Agrawal,Joshua Gans和Avi Goldfarb教授在其《預(yù)測機(jī)器:人工智能的簡單經(jīng)濟(jì)學(xué)》一書中回答了這些問題以及許多其他問題,并非常真實(shí)地描繪了機(jī)器學(xué)習(xí)如何適應(yīng)當(dāng)今的經(jīng)濟(jì)。
Prediction machines提供了有關(guān)機(jī)器學(xué)習(xí)以及AI算法提供的預(yù)測的功能和限制的非常易于訪問的高級(jí)概述。這本書是商業(yè)領(lǐng)袖和高管必讀的書。對于想了解創(chuàng)新成果以及他們?nèi)绾蝿?chuàng)造技術(shù)融入更大經(jīng)濟(jì)的工程師和科學(xué)家來說,這也是一項(xiàng)非常有價(jià)值的研究。
這本書包含了大量詳細(xì)而有用的信息,以及有關(guān)機(jī)器學(xué)習(xí)如何改變我們做事方式的示例。
預(yù)測機(jī)的力量
關(guān)于人工智能,機(jī)器學(xué)習(xí)和其他相關(guān)術(shù)語的含義和差異存在許多誤解。關(guān)于AI在人類層面的思維和理解方面的進(jìn)步以及奇異點(diǎn)是否可以達(dá)到的問題,也有許多科學(xué)討論。但是Prediction Machines的作者將AI的當(dāng)前狀態(tài)分解為一個(gè)非常簡單的概念,盡管沒有令人興奮的概念:預(yù)測。他們寫道:“人工智能的新浪潮實(shí)際上并沒有為我們帶來情報(bào),而是情報(bào)的關(guān)鍵組成部分-預(yù)測。”
機(jī)器學(xué)習(xí)算法的預(yù)測能力仍然是本書的核心概念,并有助于我們了解其在各個(gè)層次上的影響。
預(yù)測機(jī)器:人工智能的簡單經(jīng)濟(jì)學(xué)
什么是預(yù)測?Prediction Machine的作者再次簡化:“預(yù)測是填充缺失信息的過程。預(yù)測會(huì)獲取您擁有的信息(通常稱為“數(shù)據(jù)”),并使用它來生成您沒有的信息。”
即使在最高級(jí)的水平上,大多數(shù)機(jī)器學(xué)習(xí)算法都是可以預(yù)測結(jié)果的數(shù)學(xué)模型:圖像屬于哪一類?將來股票的價(jià)值是多少?貸款申請人違約的可能性是多少?某個(gè)電子郵件的可能答案是什么?
隨著這些預(yù)測變得更加細(xì)化和精確,它們可以為以前不可能或極其困難的應(yīng)用提供支持,例如創(chuàng)建從未存在的人的真實(shí)照片或開發(fā)用于危險(xiǎn)疾病的藥物。
您會(huì)在媒體上聽到很多東西,那就是機(jī)器學(xué)習(xí)及其流行的子集深度學(xué)習(xí)已經(jīng)存在了數(shù)十年。但是,為什么今天機(jī)器學(xué)習(xí)的預(yù)測能力變得如此重要呢?大多數(shù)專家會(huì)告訴您數(shù)據(jù)的可用性,更強(qiáng)大,更便宜的計(jì)算資源在過去幾年中推動(dòng)了深度學(xué)習(xí)的發(fā)展。
預(yù)測機(jī)器的作者將這兩個(gè)前提推得更遠(yuǎn)。“當(dāng)某物的價(jià)格下跌時(shí),我們會(huì)更多地使用它。他們寫道:“這很簡單,而且現(xiàn)在正在AI中發(fā)生。”正如他們在書中進(jìn)一步解釋的那樣,這是計(jì)算和技術(shù)歷史上一直存在的趨勢。計(jì)算機(jī)降低了算術(shù)的價(jià)格?;ヂ?lián)網(wǎng)減少了分發(fā),通信和搜索的成本。機(jī)器學(xué)習(xí)降低了預(yù)測的成本,而以前這需要大量的人類認(rèn)知工作和專業(yè)知識(shí)。
Prediction Machines的作者寫道:“將某物減少到純成本的方式可以避免大肆宣傳,盡管這無助于使最新最好的技術(shù)看起來令人興奮。”因此,就當(dāng)今的AI而言,作者寫道:“計(jì)算機(jī)仍然無法思考,因此思想不會(huì)變得便宜。”但是預(yù)測變得非常便宜,這本身就是一個(gè)大問題。
機(jī)器學(xué)習(xí)將如何改變業(yè)務(wù)
廉價(jià)的預(yù)測將通過兩種主要方式改變組織的工作方式。“低級(jí)別的預(yù)測機(jī)器可以減輕人們的預(yù)測任務(wù),從而節(jié)省成本,”預(yù)測機(jī)器的作者寫道。這意味著放射線醫(yī)生會(huì)在人工神經(jīng)網(wǎng)絡(luò)的幫助下檢查更多的X射線片,幫助臺(tái)操作員使用自然語言處理算法來響應(yīng)更多的客戶查詢,并且借助機(jī)器學(xué)習(xí)算法預(yù)測庫存時(shí)間和庫存量,庫存管理系統(tǒng)可以更有效地工作。 。
作者寫道:“但是在某個(gè)時(shí)候,預(yù)測機(jī)器可能變得如此準(zhǔn)確和可靠,以至于改變了組織的工作方式。”這是一個(gè)示例:Amazon當(dāng)前使用機(jī)器學(xué)習(xí)算法來提出銷售建議。例如,當(dāng)搜索Prediction Machines時(shí),這家電子商務(wù)巨頭的平臺(tái)使用聚類機(jī)器學(xué)習(xí)算法來顯示我可能會(huì)感興趣的其他書籍的列表。
亞馬遜使用機(jī)器學(xué)習(xí)來提出建議。
希望(對于亞馬遜),這些建議可以說服我購買一本書而不是兩本書。需要明確的是,亞馬遜的建議非常不錯(cuò)。實(shí)際上,我經(jīng)常在亞馬遜上搜索舊書以發(fā)現(xiàn)新的相關(guān)書名。
但是在某些時(shí)候,預(yù)測將變得如此精確,以至于將導(dǎo)致公司業(yè)務(wù)模式的重大轉(zhuǎn)變。目前,亞馬遜使用先購物后發(fā)貨的模式。您在amazon上購買商品,公司會(huì)盡力將購買的商品盡快送到您的家中。
先買后買是另一種商業(yè)模式:亞馬遜使用機(jī)器學(xué)習(xí)來預(yù)測您的需求,然后將其運(yùn)送到您的家中。如果需要這些物品,則購買它們,如果不需要,則由公司承擔(dān)退還費(fèi)用。僅當(dāng)預(yù)測準(zhǔn)確性超過某個(gè)閾值以使其對亞馬遜有利時(shí),該模型才有效。
機(jī)器學(xué)習(xí)和數(shù)據(jù)的價(jià)值
在學(xué)術(shù)界,大多數(shù)AI研究都專注于創(chuàng)建可以對已建立的數(shù)據(jù)集(例如ImageNet,CLEVR或SQUAD)執(zhí)行任務(wù)的算法。但是在實(shí)際應(yīng)用中,獲得正確的數(shù)據(jù)以訓(xùn)練和維護(hù)機(jī)器學(xué)習(xí)算法時(shí),還有許多其他細(xì)微差別。
Prediction Machines的作者做了出色的工作,為機(jī)器學(xué)習(xí)算法處理數(shù)據(jù)的經(jīng)濟(jì)學(xué)帶來了神秘化。預(yù)測機(jī)器依賴于數(shù)據(jù)。更多更好的數(shù)據(jù)可以帶來更好的預(yù)測。從經(jīng)濟(jì)角度來講,數(shù)據(jù)是預(yù)測的關(guān)鍵補(bǔ)充。隨著預(yù)測變得越來越便宜,它變得越來越有價(jià)值。
但是他們還強(qiáng)調(diào),收集質(zhì)量數(shù)據(jù)既昂貴又費(fèi)時(shí),并且經(jīng)營一家AI公司需要在獲取更多數(shù)據(jù)的利益和獲取數(shù)據(jù)的成本之間進(jìn)行權(quán)衡。統(tǒng)計(jì)學(xué)家和機(jī)器學(xué)習(xí)從業(yè)者都知道,數(shù)據(jù)的規(guī)模收益遞減。當(dāng)您在更多數(shù)據(jù)上訓(xùn)練機(jī)器學(xué)習(xí)算法時(shí),準(zhǔn)確性提高的速度會(huì)變慢。第三個(gè)數(shù)據(jù)點(diǎn)提供的信息比百分之一百多,后者又比百分之一有用。
作者提醒我們,但是當(dāng)您使用機(jī)器學(xué)習(xí)來開展業(yè)務(wù)時(shí),情況會(huì)有所不同,因?yàn)閺慕?jīng)濟(jì)角度來看,重要的是從預(yù)測中獲得的價(jià)值。因此,如果更多的數(shù)據(jù)可以改善您的機(jī)器學(xué)習(xí)算法,從而使您在競爭者中脫穎而出(想一想從購物然后運(yùn)輸?shù)竭\(yùn)輸然后購物的轉(zhuǎn)變),那么可能值得投資。
這就是為什么我們看到Facebook和google等技術(shù)巨頭進(jìn)行軍備競賽,以收集可以增強(qiáng)其AI算法的數(shù)據(jù)。商業(yè)領(lǐng)導(dǎo)者還必須了解,本身擁有大量數(shù)據(jù)并不一定會(huì)讓您處于開發(fā)強(qiáng)大的機(jī)器學(xué)習(xí)算法的正確位置。數(shù)據(jù)分為三類:訓(xùn)練,輸入和反饋。您需要全部三個(gè)來為您的業(yè)務(wù)開發(fā)和維護(hù)高效的機(jī)器學(xué)習(xí)模型。
例如,擁有大量歷史銷售記錄可能會(huì)為預(yù)測銷售數(shù)字的機(jī)器學(xué)習(xí)模型構(gòu)成一個(gè)很好的培訓(xùn)數(shù)據(jù)集。但是,要不斷提高模型的性能,還需要獲取新數(shù)據(jù)(輸入)并將新的預(yù)測與實(shí)際客戶行為(反饋)進(jìn)行比較的方法。除了技術(shù)創(chuàng)新外,這還需要一種業(yè)務(wù)策略。
數(shù)據(jù)和預(yù)測機(jī)器是補(bǔ)充。因此,除非有足夠的數(shù)據(jù)來采購或開發(fā)AI,否則其價(jià)值有限。”作者寫道。“如果這些數(shù)據(jù)與其他人在一起,則需要一種策略來獲取它。如果數(shù)據(jù)駐留在獨(dú)家或壟斷提供商的手中,那么您可能會(huì)面臨使該提供商占用您AI的全部價(jià)值的風(fēng)險(xiǎn)。如果數(shù)據(jù)歸競爭對手所有,則可能沒有任何策略值得從競爭對手那里獲取。如果數(shù)據(jù)歸消費(fèi)者所有,則可以交換數(shù)據(jù)以換取更好的產(chǎn)品或更高質(zhì)量的服務(wù)。”
預(yù)測與判斷之間的區(qū)別
Prediction Machines中討論的另一個(gè)關(guān)鍵主題是,在預(yù)測和判斷之間劃清界限,在AI和人類之間分工。預(yù)測不是決定。做出決定需要先對預(yù)測做出判斷,然后采取行動(dòng)。我認(rèn)為這是至關(guān)重要的一點(diǎn)。對于每個(gè)業(yè)務(wù)領(lǐng)導(dǎo)者來說,重要的是要了解機(jī)器學(xué)習(xí)算法的潛力,同時(shí)也要認(rèn)識(shí)到它們的缺點(diǎn)以及需要依靠人工智慧和決策的地方。
隨著機(jī)器預(yù)測逐漸取代人類做出的預(yù)測,人類預(yù)測的價(jià)值將下降。但是關(guān)鍵是,盡管預(yù)測是任何決策的關(guān)鍵組成部分,但它并不是唯一的組成部分。決策的其他要素(判斷,數(shù)據(jù)和行動(dòng))目前仍牢牢地存在于人類領(lǐng)域。它們是對預(yù)測的補(bǔ)充,這意味著隨著預(yù)測變得便宜,它們的價(jià)值也會(huì)增加。
判斷是一項(xiàng)復(fù)雜的任務(wù),通常需要常識(shí)和對世界的了解,這是機(jī)器學(xué)習(xí)算法當(dāng)前奮斗的兩個(gè)領(lǐng)域。在許多情況下,人類必須判斷和決定跨越短期和長期的多個(gè)目標(biāo)。他們必須評(píng)估動(dòng)態(tài)情況并評(píng)估權(quán)衡。但是,在不太復(fù)雜的環(huán)境中,可以通過獎(jiǎng)勵(lì)功能工程或硬編碼規(guī)則的實(shí)施來自動(dòng)進(jìn)行判斷和決策。這些是AI分支(例如強(qiáng)化學(xué)習(xí))可以完全自動(dòng)化任務(wù)的領(lǐng)域。
了解機(jī)器學(xué)習(xí)業(yè)務(wù)模型
如果Prediction Machines強(qiáng)調(diào)了一件事情,那就是運(yùn)營AI業(yè)務(wù)的根本差異和挑戰(zhàn)。許多公司和業(yè)務(wù)領(lǐng)導(dǎo)者都具有經(jīng)典軟件開發(fā)和業(yè)務(wù)的背景。他們需要適應(yīng)管理機(jī)器學(xué)習(xí)模型的開發(fā)和維護(hù)的規(guī)則,并管理隨之而來的獨(dú)特風(fēng)險(xiǎn)。那些適應(yīng)人工智能業(yè)務(wù)的人必將獲得豐厚的回報(bào)。