隨著互聯網、云計算和物聯網技術的發展,社會信息化和智能化程度不斷加深,數據充斥著整個世界并滲透到每一個行業和業務職能領域,逐漸成為重要的生產因素。由此大數據發展得到全球性的廣泛關注,并深刻地改變我們的生活、工作和思維。
如何安全穩定的處理與分析越來越多的數據?如何更便捷地使用定量方法、構建模型、挖掘數據價值?如何讓底層計算資源更好地調配、更好支持研究?如何發展出更加適當趨勢的共享與協作模式?這些都是隨著數據的爆炸增長,大數據時代科學研究所面臨的問題,在進行數據科學科研項目的過程中,往往也會面臨諸多挑戰,如:
搭建數據分析平臺費時費力、在研究工作外消耗太多精力;
重復的編程工作繁瑣耗時,大量的分析算法需要適應;
任務中間成果交接困難,多角色協作缺乏統一媒介;
數據資源、分析資料分散,協調管理工作麻煩;
科研過程解釋、復現不便,成果價值難以充分呈現;
成果的碎片化和保密性讓其難以體系化流轉。
基于目前的科研環境,為了幫助研究團隊解決底層工程復雜繁瑣、研究成果流轉復現困難等問題,ModelWhale科研版應運而生,極大的提升了數據科研的工作效率。
ModelWhale科研版:讓科研數據的探索與分析更簡單、流暢
ModelWhale科研版是一個科研團隊數據科學云端協作平臺,可選擇Jupyter Notebook交互式和Canvas拖拽式兩種編程界面,支持Python和R語言,提供即開即用的云端分析環境和安全流暢的協同管理功能,支持代碼級協作、過程與成果的可視化呈現,為研究團隊解決底層工程復雜繁瑣、研究成果流轉復現困難的問題,使科研生產與協作更加便捷和高效。
ModelWhale 科研版,如何為科研機構提供數據科學與人工智能一站式科研解決方案?
1、數據獲取與管理
· 數據可統一管理
可將研究所需的各類格式數據上傳至 ModelWhale 進行安全統一的管理、展現與共享,也可連接關系型數據庫,用戶可直接調取使用,而無需下載、存儲與重復維護。
· 快速了解數據情況
對于結構化數據文件,可自動生成描述性統計、頻數可視化分布,對于關系型數據庫可在線查看、篩選各數據庫表與詳細字段,方便又高效。
· 外部數據輕松獲取
資源庫中整合了和鯨社區5000G+優質的數據集,含50+的企業開放數據、100+的科研機構獨家開放數據,都可在 ModelWhale 中直接調取使用。
2、數據處理與分析
· 即開即用 Python 和 R,各類算力彈性調度
基于 Jupyter 范式,自帶各類常用工具包和機器學習框架,可管理與自定義環境、調用各類 CPU/GPU 云資源、進行離線訓練,而無需擔心運維計算環境時的費時費力。
· 算法代碼片段庫
提供不斷更新的算法代碼片段,涵蓋數據分析處理、可視化與常用模型,也可自行收藏常用代碼片段,可簡單便捷地調用與復用,降低數據科學技術運用成本。
· 拖拽式編程 Canvas
基于圖形化的操作,進一步提升團隊在預處理數據、數據可視化、機器學習建模的工作效率與體驗,自定義常用模塊,一鍵轉換為 Notebook 進行代碼工作。
· 過程和結果輕松可視化
Notebook 與 Canvas 詳細直觀地呈現數據分析與建模的過程,在寫代碼分析數據的同時,無縫進行思路與說明的撰寫;模型支持可視化解析,使模型結構更具可讀性。
3、團隊分工與協作
· 任務規劃輕松流暢
進行任務拆解與分配、進度交流與分享,輕松同步團隊進展;資料與成果在知識庫中可輕松沉淀與梳理,方便協作者直接查看與使用。
· 各自分工的成果一鍵整合
通過一鍵分享與 Fork,科研工作者可快速復制與復現 Notebook,也可將各自分工獨立分析編寫的 Notebook、關聯數據與模型進行一鍵整合。
· 與和鯨社區生產力協作
通過科研版內相關模塊發起科研眾包需求,在數據處理、分析、建模環節獲得和鯨社區10萬人才的助力,任務成果可基于 ModelWhale 輕松流轉。
4、成果管理與復現
· 論文手稿寫作
ModelWhale 可直接用于產出論文手稿,Markdown 編輯器體驗良好,便捷使用 LaTeX,結合代碼輸出和圖片上傳功能,順暢記錄與呈現論文中的每一個要點
· 成果管理與沉淀
科研成果數據集、成果模型和分析過程可在知識庫中安全便捷地托管,方便相關成果的統一管理與再生產時的快速調用
· 成果流轉與應用
項目輸出功能,更方便安全地輸出數據、模型等成果,便于上下游無縫流轉,支持模型一鍵發布為 API,便于應用到實際場景中
· 輕松交流展示
Notebook 的分析過程可直接排版為 PPT,結合 Canvas 和模型可視化解析,輕松呈現過程與結果,方便在與同行交流時更好地展示分析細節
· 一鍵成果復現
ModelWhale 能夠結構化地記錄所使用的數據及背后的分析環境,基于云端即開即用的計算環境,同領域研究者可一鍵 Fork Notebook 并復現成果
和鯨科技的 ModelWhale 科研版,可以幫助導師精準把控項目細節,加快研究進度,讓團隊成員擺脫繁復的基礎工作,迅速進入研究重要階段,大幅提升科研探索效率和論文質量。同時也讓科研團隊直接跳過瑣碎的運維管理,從繁重的基礎工作中解放,無需任何硬件部署和運維,快速在應用層開展研究工作,根據任務需求彈性調度云算力,既高效又經濟。截至目前,ModelWhale 科研版已經為清華大學、南開大學、中國醫學科學院北京協和醫學院等科研團隊提供服務,并廣受好評。