數(shù)字經(jīng)濟時代,每個個體和組織機構(gòu)都已經(jīng)成為海量數(shù)據(jù)的生產(chǎn)者和消費者,基于數(shù)據(jù)智能的產(chǎn)品優(yōu)化與迭代也已經(jīng)成為智能化進程中企業(yè)創(chuàng)新、發(fā)展的關(guān)鍵能力。3月20日,百度技術(shù)沙龍第90期于線上召開,沙龍圍繞“數(shù)讀城市:百度時空大數(shù)據(jù)分析與預(yù)測技術(shù)”為主題,邀請了來自百度研究院的多位資深研發(fā)工程師,就異地POI推薦、機器學(xué)習(xí)在時空大數(shù)據(jù)上的應(yīng)用、群體感知、百度數(shù)據(jù)聯(lián)邦平臺等話題為觀眾分享了數(shù)據(jù)智能方向的技術(shù)應(yīng)用經(jīng)驗,同時也為企業(yè)數(shù)據(jù)智能化的發(fā)展及應(yīng)用提供參考、指引方向。
百度技術(shù)沙龍自舉辦以來,在9年內(nèi)面向超過9100名與會受眾舉辦了共90期活動,邀請了159位行業(yè)技術(shù)大牛、206位百度技術(shù)專家,內(nèi)容覆蓋軟件開發(fā)、大數(shù)據(jù)、深度學(xué)習(xí)等當(dāng)下熱門的技術(shù)話題,旨在為開發(fā)者、技術(shù)人員提供一個自由的技術(shù)交流和分享平臺。本期沙龍是百度技術(shù)沙龍升級2.0后的首期活動,內(nèi)容除了兼顧分享的前沿性,更全面考慮了如何讓受眾更精準(zhǔn),傳播更有溫度,并通過與技術(shù)社區(qū)的共同行動、定向邀約,希望讓對技術(shù)感興趣、有需求的人能夠收獲一場“知趣合一”的技術(shù)宴會。
沙龍活動中,百度資深研發(fā)工程師首先圍繞著“異地場景POI推薦”和背后的“冷啟動問題”出發(fā),為大家?guī)砹送扑]系統(tǒng)中新的解決方案。相較于傳統(tǒng)的推薦模式,這個方案利用圖神經(jīng)網(wǎng)絡(luò)挖掘歷史用戶的本地行為偏好和異地簽到行為,從而表征用戶的本地偏好以及異地的空間地理信息約束,在聚合通用出行意圖與用戶個體偏好后,通過多層感知機對本地偏好與異地偏好的遷移進行刻畫。該方法的有效性,也通過真實物理世界的跨城出行記錄數(shù)據(jù)實驗進行了驗證。
另一位百度高工從機器學(xué)習(xí)技術(shù)在時空大數(shù)據(jù)以及新冠疫情防控中的應(yīng)用方向,介紹了新冠肺炎高風(fēng)險小區(qū)預(yù)警框架C-Watcher。C-Watcher能夠通過其具有創(chuàng)新性的對抗編碼器框架來提取城市之間的共性特征,在新冠病毒從疫情重災(zāi)區(qū)傳播到目標(biāo)城市之前,就預(yù)測出目標(biāo)城市中每個小區(qū)的疫情感染風(fēng)險,以做到在疫情早期,從大量居民小區(qū)中有效地篩查出高風(fēng)險小區(qū)。
此外,在智慧出行方面百度也擁有豐富的經(jīng)驗。針對不同人群差異化的出行需求,百度提出了改善方案——自適應(yīng)互監(jiān)督多任務(wù)圖神經(jīng)網(wǎng)絡(luò)(Ada-MSTNet)。該方案不僅可以在不同群體和區(qū)域?qū)?yīng)的任務(wù)間共享信息,還可以有效防止不相關(guān)任務(wù)之間的噪音傳播,帶領(lǐng)開發(fā)者了解圖神經(jīng)網(wǎng)絡(luò)、多任務(wù)學(xué)習(xí)和自監(jiān)督學(xué)習(xí)等前沿技術(shù)在城市交通預(yù)測方面的應(yīng)用。
(細粒度區(qū)域流量分析&人群需求分析)
最后,百度資深研發(fā)工程師深度講解了百度數(shù)據(jù)聯(lián)邦平臺及其應(yīng)用和前沿研究。百度數(shù)據(jù)聯(lián)邦平臺是基于領(lǐng)先的云上可信計算和可信數(shù)據(jù)存儲容器,實現(xiàn)跨信任實體的云上大規(guī)模數(shù)據(jù)聯(lián)邦計算和分析平臺,提供基于“云智一體”的百度智能云的大數(shù)據(jù)處理服務(wù)。百度不止對數(shù)據(jù)聯(lián)邦平臺的存儲進行了優(yōu)化,提升了數(shù)據(jù)存儲的效率,還基于數(shù)據(jù)聯(lián)邦平臺,與合作單位提出了第一款基于百度圖神經(jīng)網(wǎng)絡(luò)的疫情預(yù)測模型。此外,工程師們基于疫情的空間大數(shù)據(jù),總結(jié)了疫情與搜索、居民外出及當(dāng)?shù)亟?jīng)濟情況的關(guān)系。在線上沙龍中,百度工程師也分享了在數(shù)邦平臺的安全數(shù)據(jù)處理的幫助下對分布式的車輛共享進行的研究,提出了合理的車輛調(diào)度方法,從而降低了成本。另外,基于數(shù)據(jù)聯(lián)邦平臺的聯(lián)邦學(xué)習(xí)與可解釋性的研究與進展也是本次分享中的一大亮點。
(基于飛槳的疫情預(yù)測深度學(xué)習(xí)模型結(jié)果)
“數(shù)據(jù)是21世紀的石油”,數(shù)據(jù)的重要性已然成為行業(yè)共識。站在“十四五”開局之年,以云計算、人工智能等為代表的新興技術(shù),正在推進數(shù)據(jù)智能的發(fā)展,不斷推動技術(shù)創(chuàng)新和落地應(yīng)用。未來,百度技術(shù)沙龍2.0還將不斷凝聚前期活動的經(jīng)驗,通過“有趣,有料,有溫度“的方式將最實用的專業(yè)知識傳遞到有需求的人手中,進而從人才角度助力產(chǎn)業(yè)智能化轉(zhuǎn)型,讓所有人都有望分享到數(shù)字經(jīng)濟帶來的紅利。