當人類優渥于一種狀態,總有想象力沖破平衡。
1905年,愛因斯坦否定了絕對時空,引發物理世界三大革命。楊振寧曾說過,“愛因斯坦沒有錯失重點,是因為他對時空有著更自由的眼光。而要有自由的眼光,必須能夠同時近觀和遠觀同一課題。”
2021,阿里云視頻云全景創新峰會,努力嘗試站在近景和遠景之處,全景觀察這個時代的超視頻化課題。
這是個怎樣的時代?
這是超視頻化時代。
視頻讓流淌的文字和圖像演化成時代語言,視頻把情緒、立場、眼界、思維立體化封裝。視頻在時間域和空間域,不斷地破維和延伸。
視頻化是一場博物學,包羅文字、影音,包羅空間、引力,包羅人文、情感,它呈現沒有邊界的世界圖景,它表達自由和創造新自由。
在超視頻化時代,視頻衍生了更多新形態,構建了全新的內容鏈條,所謂超內容;視頻化逐漸演變成以人為中心的交互,承載了多維感官、甚至超越時空的體驗,所謂超交互;視頻化讓萬物皆媒,人與人、人與物、人與自然,感應式鏈接,產生一種超社交能力和現象,所謂超鏈接。
視頻成為全新的時代語言,視頻化成為新世紀的新文化運動;而超未來的另一端,現實世界與虛擬世界的物理感知界限將模糊化,最終實現全場景的數字孿生。
當然,5G是這個時代演進的助推器,讓萬物互聯。而“云+視頻“是場景革新的催化劑,讓虛實融合。
隨之,一切內容和交互,都將在這個時代發生聚變。
內容和交互的盡頭在哪?
先談內容。
技術,各式各樣的技術,首先是在呈現一個意義的世界。
技術制造意義并傳遞情感。是這樣的,就像當帶寬承載有限時,人們聚焦信息的傳遞;當帶寬承載高增時,人們通過多維形態信息傳遞的,是情感。喬布斯在2001年的訪談中,已經開始期望通過互聯網更多來傳遞情感,今天,視頻云的技術可以實現。
如果技術助力內容傳遞情感,那回顧內容的演進,可以看到清晰的脈絡:從一行文字、一幅畫、到一部影像,一直發展到今天的直播、短視頻滿溢,再到資訊和知識的視頻化呈現,直至全場景內容的逐漸視頻化,最終演變到以三維化、可交互為主的沉浸式內容形態。而在這一演進過程中,凸顯了更大密度、更多維度、更多感官、拓撲空間的生長力。
如今,我們能提前預感到沉浸式的學習場域,通過5G、XR、全息投影、數字孿生和云化網絡等技術的充分融合,將抽象的知識可視化、具象化,打造線上線下無邊界課堂。能把閱讀新聞演化成體驗“空間新聞“,利用有限虛擬、超高清技術、3D和 360 全景技術,讓人獲得置身感與參與感,使新聞行業面臨極大顛覆。更常見的是沉浸式文博,以文旅IP結合虛擬/增強現實、全息投影、智能交互,形成萬物沉浸、互動敘事的產業雛形。
在國外,沉浸式演唱會將搬上舞臺,索尼與Verizon合作,將于今年冬天推出”麥迪遜·比爾沉浸式VR演唱會“。據說該體驗結合3D動捕、容積捕捉和3D重建技術,利用游戲引擎開發而成。同時,松下也宣布和Illuminariums娛樂公司合作打造了一個大型沉浸式娛樂中心,場內內置46臺4K投影,結合LiDAR傳感器進行交互,還將融合空間音頻,具備高度定制化。
仔細品味,沉浸式內容的形態無限想象。在內容形態中,我們能縱覽到從實體沉浸、虛擬沉浸、虛擬混合沉浸,再到泛在智能沉浸的線性生長路線,而盡頭的內容形態將會通過全域交互的形式重構體驗,帶來千人千面的獨特內容。
再看交互。
《科學的歷程》中提到,“近代思想的一個革命性的變化,就在于從有限封閉的世界走向無限的宇宙。“ 仔細反觀交互的推演,也正是如此。
從線下到線上,一切場景都在試圖騰挪空間,創造無界?;诳萍己蜕虡I的推動,人們的交互在慢慢轉向全場景線上化,而最終的形態也將是沉浸式的交互關系。不難發現,多端鏈接、多人共享、打破空間、虛實無縫結合,正是這一演進的趨向。而在能看到的終點,人機交互、腦機接口都是探索重點。
如果縱覽交互發展的60年,可以分成三個主要發展時代,而未來十年將核心聚焦在人機交互、傳感器、在線社交通信、腦機接口和特征識別。
資料來源:International Journal of Human–Computer Interaction《Mapping Human–Computer Interaction Research Themes and Trends from Its Existence to Today: A Topic Modeling-Based Review of past 60 Years》
從交互的視角,信息將從一個交互對象自然地傳遞到另一個交互對象,而數字將與物理共存并增強。從學術上,交互可分為:物理和數字連續體的交互、隱式交互、感官環境與感知交互、公共空間的交互,虛擬現實與增強現實交互。而這終極的沉浸式交互,核心在探索更自然的交互方式,希望釋放人的立體視覺、觸覺、本體感知等能力,讓交互不再局限于二維視覺通道與視覺反饋。
在新交互體察上,最新的2021CES給我們展示了Pollen Robotics的遠程VR操控方案、CareOS的智能鏡AR美容美發系統,還有全息技術公司IKIN公布的全息配件,可將智能手機或電腦屏幕變成裸眼3D效果。當然還有Fackbook一直布局的VR社交,試圖在虛擬世界中,嘗試另一種人生。
日前三星公司發布的《6G時代遠景報告》曾提到,高度沉浸XR與高質量移動式全息體驗,將是10年后的普遍場景。
內容和交互的盡頭大概就是沉浸式場域的綜合體,而智能化已經讓我們逐步“浸入”到了一個虛實融合的泛沉浸式時代。它不是未來,它正在發生。
生態的供給與AI的拿捏
從未來和時代演進穿越回來,放平視線,落在現有內容生態和技術支持層面。
深入視頻化趨勢,來看視頻內容全圖譜視角,整個產業鏈涵蓋了內容生產、營銷傳播、分發平臺、播放終端以及技術支持,而云計算、音視頻技術強力支撐了視頻內容全產業鏈發展。
在新的視頻文化消費驅動下,新的技術在演進、在應用,新的生產方式和內容形態在誕生。
我們知道,視頻的新文化消費的擴需,一方面需要數字化的短視頻供應系統,一方面需要超高清視頻的生產能力,從而把大眾帶入數字化內容浪潮中、帶入到真正的8K時代。
超高清視頻是視頻技術繼模擬、標清、高清后的新一輪代際演進,與5G、人工智能等同為當今新一代信息技術的重要發展方向。而當前內容生產處于超高清生產最短板,內容服務層的推進發展對超高清商用落地起到決定性作用。
AI在這當中可以發揮關鍵價值,我們可以這樣思考,把視覺理解成生物和物理兩個層面,生物世界是人的視覺感知,而從物理現象是對光的各種感應,包括光的亮度、細節描述,以及與時間相關的信息。
對此, AI發揮的作用主要分成兩部分,第一也是最基礎的,是對于視頻或者圖像的理解,包括我們常見的分類、打標、檢測、分割等等這些,這也是跟人相關的,因為人一開始是先理解世界的。第二是與生產相關的,比如我們生產、編輯、加工、擦除、擦入等等,還有與底層視覺相關的,就是增強相關,而怎么能夠在底層視覺上對視頻用AI技術賦能,也是其中關鍵。
從AI賦予的超高清能力來講,對于視覺,一個非常重要的結果就是全新的視聽體驗,而體驗與很多東西相關。第一是更豐富的細節,比如看一個東西,如果分辨率非常低或本身信息量體驗非常差的東西,怎么豐富細節,尤其在8K即將到來的今天。第二個是更生動的色彩,在色深、色域、亮度層面,這也是體驗非常重要的地方。第三是更沉浸式的體驗,所謂大視角、全景視角、立體聲環繞。此外還要包括在各行各業更廣泛的應用。
AI驅動高清往前走,智能是最基本的,而能不能在不同場景自適應去做事情,AI技術并沒有所謂的普適性的能力,所以在卡通、新聞人物、傳記不同場景中,能夠有很好的系統,而不是單一的模型、萬能的模型去處理,所以能夠自適應的針對不同場景采用最優質的算法,這是很重要的。由此,自適應、高質量、自評估的智能化AI技術驅動,正是達摩院著力的關鍵。
在超高清之外,AI對超內容消費的效率提升,也在強力賦能。
當前用戶碎片化消費時間不斷增加,短視頻的消費用戶規模已超7.73億人,短視頻的市場規模超過2000億元。但我們都了解,在內容供給側,制作一個較高水準的視頻面臨著創意生產困難、工具實現困難的問題,高效的規模化產出則更加困難。就此,阿里大文娛Media AI平臺通過AI研發可以實現五大功能:動態素材提取、模版視頻生產、智能剪輯技術、智能素材加工、互動特效。
結合自身業務特點,大文娛希望能夠在平臺側,提效率促分發,為行業創造更多更好的產品和工具;在消費側為用戶提供更多的新消費形態和視頻的消費互動新體驗;在行業側,能與更多B端的PGC或者MCN進行合作。
如今,基于技術和生態的聯動,阿里云視頻云也正將整個媒體生產的模式提升到一個新的時代——云端一體的智能生產架構。這一架構包含了內容創意、素材管理、剪輯包裝、渲染與合成四大核心環節,具有云導播、云剪輯、AI處理生產等豐富的功能。因此,在云端一體的架構和AI能力的加持下,傳媒行業的內容生產將會賦予更多可能性。這種生產化的模式將會極大地重塑內容行業,讓真正的內容創作者從繁復的重復化勞動中釋放出來,創造出更豐富的內容、形態、模式。
視頻力改變了商業邏輯
時代的演進、技術的加持、生態的聯動,更多是降落在商業落點上。
以往,講互聯網整體的價值的時候,常規去用的就是流量價值,從移動端來講最簡單就是在每個月、每周覆蓋多少設備,但現在我們要用時間數來看。在短短3年之內用戶在整個視頻細分產品的花費時間,從一萬六千億分鐘變成四萬八千億分鐘。數字是驚人的。
面對現象背后的巨大商業空間,該怎么配合驅動和創新更多,是我們必須思考的。
我們在講視頻傳播時,它的本源是一個信息傳播的載體,信息傳播本身要去分類的話,分為一對一進行交流或傳播,和一對多或者多對多,而另外一個維度上又分為延時和實時。
視頻的承載能力可以與眾多行業來做結合。所以,以前看視頻,我們基本會說視頻行業、視頻賽道,而現階段,我們更會認為所有領域都會如此結合視頻的情況下,它就像云計算一樣,不再更多的看成一個行業的概念,而是一個互聯網新經濟底層的基礎能力。借此能力,各個行業可以去做一些創新的事,基于云、基于視頻,基于視頻云。
而視頻云,將會成為行業視頻化的必選項、成為大視頻產業的技術底座。
作為一種數智化基礎設施的存在,視頻云不僅大幅降低了視頻應用的準入門檻,更通過促進產業效率提升,不斷推動大視頻產業的繁榮。
從需求端思考,視頻云能夠為企業提供視頻能力或把產品視頻化,可以運用更多生產、處理、傳輸、消費增值能力。比如直播電商是最早深刻感受到的,整個電商主體在發生變化,原來能看到僅僅是幾個大的直播電商,但視頻化賦予了平臺電商化的轉型能力,讓現在的很多內容平臺甚至創業公司都有非常大流量的中心位置,主播可以是電商的中心,而在過去,它是不存在的。
另外在線教育領域,在線教育摸索很多年都沒有辦法進行完整變現,后來直播的出現讓行業解決了一定的沉浸感問題,學生可以跟老師有更多的互動,可以解決一些學習效率的問題。本質上,視頻化確實解決了一部分教育的沉浸感和效果問題,以致在線教育在過去幾年終于找到它變現的邏輯。對電商和教育領域,艾瑞研究院副總經理徐樊磊的分析是很精準的。
除了目前視頻化滲透率最高的電商和教育,廣閾的互聯網娛樂、傳媒行業的數智化轉型、企業的移動協同辦公,亦是視頻云技術應用的重點場域?;谝曨l云技術,新的商業場景還在不斷被打開,從新電商、新教育、新社交、新金融、新醫療,乃至更多產業、更多行業的轉型鋪面到來。
時代的演進、視頻的滲透、交互的變革,讓行業的變現邏輯、流量方向、組織形式都在發生巨大的格局變化。
就此,阿里云視頻云也聯合艾瑞咨詢共同研究,發布《2021中國視頻云場景應用洞察白皮書》,以云上創新為視角,全面展現視頻化應用的全場景、全鏈路,針對空間、盲點、機會、案例深度剖析,著力為視頻云賽道的商業市場奠定重要的實踐價值。
賽事和開源,是社會想象力的放大器
超視頻化的時代,視頻云的想象力遠不止步于商業場景,更多的是普惠全民、創造多元化的社會價值。
就在今年2月,阿里云聯手英特爾主辦、與優酷戰略技術合作的全球視頻云創新挑戰賽啟動,這屆大賽是全球首個聚焦于視頻云技術在全行業的應用與創新領域的比賽,由天池平臺和阿里云視頻云承辦,初賽啟動便吸引了來自全球高校的4600支參賽戰隊。賽程中,能看到不斷涌現的創新項目,充滿社會向價值和全新生命力,如視覺算法實現的安全停車項目、老人看護項目。
值得一提的是,大賽通過與優酷平臺聯手,提供了一個大規模高精度視頻分割數據集,供參賽選手訓練模型,并最終打磨成視頻分割領域的權威數據集,非常稀有。該數據集具備夯實的數據量級,包攬18萬幀以及高達30萬的最多視頻目標數據集,在標注精度和內容廣度上均為行業領先。同時,內容類型高度貼合真實場景且場景多元,對于視頻產業具有極高的探索意義。
數據作為信息時代重要的生產要素,被譽為新的動力能源,是人工智能技術發展的重要基礎。
通過與阿里巴巴集團內部的淘寶、天貓、阿里云、優酷、AE等業務團隊,以及清華大學、上海交通大學、中國科學院國家天文臺、中國計算機學會、中國中文信息學會、協和醫院、瑞金醫院等外部權威科研機構合作,天池大賽平臺開放了包括電商、金融、物流、醫療、能源等60多個有真實業務場景的產業稀缺數據集,為全球計算機視覺的人才培養做出卓越貢獻,為更多技術開發者創造更廣域的空間。
不得不說,激發澎湃能量的技術創新大賽和大規模的權威的開源數據集,為更多維的社會想象賦能,在此基礎上的技術綻放,很讓人期待。
若你也曼妙于沉浸想象里
歸根結底,無論技術、商業、生態、資源,一切都是為了人的情感和體驗。
科技不斷在和眾多領域發生互滲性,而藝術大概是我們最想觸摸的特別性場域,也是最接近人類內心軟糯情感的神經線。
7.10的“Imagine”阿里云視頻云全景創新峰會,從主辦方角度,真切地從想象出發,試圖以一種視覺通道的沉浸感,拉進人與空間的距離。
當然,從科技跨界藝術的角度,我們深度關注的,是數字時代的審美創作實現。
我們發現,當代藝術創作者也在不斷憑借其想象力和跨學科能力,致力科技與藝術的融合創作。在數字交互時代,創作、傳播的藝術行為在全面出新,進而在藝術審美的感覺、體驗和思維方面也在產生深刻變革。審美驅動技術,技術反哺審美。
在數字交互時代,極致的審美追求,是對專業的追求,而專業的背后蘊藏著創作效率、創作能力。技術無疑是幫助創意多感官、多維度實現的重要工具,而基于深度學習的AI工具在協助這樣的過程,為創意大腦插上翅膀。
與此,數智化能力對視覺交互的重構,也是非常重要的體驗演進,峰會上以“跨界智造“為內核,嘗試呈現一些內容和交互的新體驗裝置,如基于生成對抗網絡及遷移學習技術的卡通智繪、打造實時渲染屏幕的虛擬拍攝、通過面部和動作捕捉技術的虛擬偶像,一切都在探尋基于藝術、基于人的科技新體驗。
以上,便是阿里云視頻云在新時代窺見的有限視野,而無限的內容還待想象。
超視頻化時代,視頻云無處不在
視頻云是交叉學科的新領域
是云端一體的數智化能力
視頻云是人類未來的想象力
正在開啟一個全新的、無限的、自由的世界
有想象的地方,就有視頻云。