據(jù)外媒報(bào)道,IBM的開(kāi)源數(shù)據(jù)和人工智能技術(shù)中心(CODAIT)正在發(fā)布一個(gè)新的工具包,幫助開(kāi)發(fā)人員和數(shù)據(jù)科學(xué)家回答有關(guān)疫情的問(wèn)題。COVID notebooks旨在幫助完成一些任務(wù),包括獲取有關(guān)疫情現(xiàn)狀的權(quán)威數(shù)據(jù),清理最嚴(yán)重的數(shù)據(jù)質(zhì)量問(wèn)題,將數(shù)據(jù)整理成便于使用Pandas和Scikit-Learn等工具進(jìn)行分析的格式,以及構(gòu)建一組初始的示例報(bào)告和圖表。
處理好這些任務(wù),開(kāi)發(fā)人員和數(shù)據(jù)科學(xué)家就可以解放出來(lái),專注于高級(jí)分析和建模任務(wù),而不用擔(dān)心數(shù)據(jù)格式和數(shù)據(jù)清理等問(wèn)題。該存儲(chǔ)庫(kù)使用開(kāi)發(fā)者友好的Jupyter notebook來(lái)涵蓋每個(gè)初始數(shù)據(jù)分析步驟。此外還有使用Elyra Notebook Pipelines Visual Editor和KubeFlow Pipelines的數(shù)據(jù)處理管道。
“對(duì)于正在分析COVID-19效果并試圖根據(jù)數(shù)據(jù)提出可操作計(jì)劃的數(shù)據(jù)科學(xué)家和政策制定者來(lái)說(shuō),信息景觀是壓倒性的,”IBM開(kāi)源數(shù)據(jù)和AI技術(shù)中心的首席架構(gòu)師Frederick Reiss說(shuō)。“來(lái)自研究報(bào)告、新聞媒體、社交媒體和健康組織的數(shù)據(jù)幾乎源源不斷,這使得將數(shù)據(jù)分析為有用的行動(dòng)的任務(wù)幾乎不可能完成。開(kāi)發(fā)人員和數(shù)據(jù)科學(xué)家需要回答他們關(guān)于數(shù)據(jù)來(lái)源、工具以及如何從不斷變化的數(shù)據(jù)中得出有意義的、統(tǒng)計(jì)上有效的結(jié)論的問(wèn)題。”
COVID notebooks工具現(xiàn)已通過(guò)GitHub提供,你可以在IBM開(kāi)發(fā)者博客上閱讀更多內(nèi)容。