北京時間9月6日早間消息,谷歌的目標(biāo)是對全世界的信息進(jìn)行組織和管理。該公司最初瞄準(zhǔn)了商業(yè)網(wǎng)絡(luò),而目前谷歌想要用新的數(shù)據(jù)集搜索引擎,為科學(xué)界提供服務(wù)。
這個名為“數(shù)據(jù)集搜索”(Dataset Search)的新服務(wù)于今天推出,將成為谷歌學(xué)術(shù)搜索服務(wù)的伴侶服務(wù)。在網(wǎng)上發(fā)布數(shù)據(jù)的機構(gòu),例如大學(xué)和政府部門,可以在網(wǎng)頁中加入元數(shù)據(jù)標(biāo)簽,以描述他們的數(shù)據(jù),包括誰創(chuàng)建了數(shù)據(jù)、何時發(fā)布數(shù)據(jù),以及如何收集數(shù)據(jù)。
隨后,這些信息將被谷歌的搜索引擎編目,并與來自知識圖譜的信息相結(jié)合。比如說,如果某個數(shù)據(jù)集由歐洲核子研究中心(CERN)發(fā)布,那么有關(guān)該研究所的信息也會被包含在搜索結(jié)果中。
谷歌人工智能研究科學(xué)家娜塔莎·諾伊(Natasha Noy)協(xié)助開發(fā)了數(shù)據(jù)集搜索。她表示,這個新服務(wù)的目標(biāo)是將數(shù)萬個不同在線數(shù)據(jù)集存檔統(tǒng)一起來。“我們想要讓這些數(shù)據(jù)可以被發(fā)現(xiàn),但數(shù)據(jù)仍保留在原始位置。”
目前,數(shù)據(jù)集的發(fā)布非常碎片化。不同科學(xué)領(lǐng)域都有自己首選的數(shù)據(jù)集存檔,而政府部門也是如此。諾伊指出,科學(xué)家們長期以來的困擾都是不知道到哪里去找數(shù)據(jù)集,一旦他們走出自己的圈子,事情就變得困難。