ChatGPT拉開了大語言題庫和生成式AI產業蓬勃發展的序幕。據預測,到2026年,全球生成式AI計算市場規模將達到109.9億美元。全世界教育科技公司扎堆接入GPT-4,大語言題庫在教育領域中將獲得更加廣闊的應用前景和豐富的應用場景。
杭州景聯文科技是AI基礎數據行業的頭部企業,推出巨量高質量教育數據庫,題量總計3億道,試卷總量180萬套。所有數據均經過嚴格的挑題、錄入、排查、篩重、解答、復核、校稿程序。
該數據庫所有題目均提供word可編輯版本、json格式?;贚aTeX算法保證公式轉寫準確性和可讀性,包括各種常見的數學符號和表達式。
K12題庫,覆蓋從小學到高中數學、語文、英語、科學、道德與法治、物理、化學、生物、地理、政治、歷史、信息技術、通用技術等全部學科;
大學題庫,覆蓋大學英語、政治、法學、經濟學、醫學等學科;
職業題庫,覆蓋職業教育所有相關學科,公考、金融類,工程類,醫學類等。
題庫共計覆蓋全國各地區300多個教材版本,包括人教版、北師大版、教科版、蘇教版、魯教版、冀教版等主流版本。
收錄近14年以來中考高試題試卷,覆蓋率高達95%,各地區名校試卷和模擬試卷收錄總量達20萬份。
試題屬性包含學科、章節、知識點、題型、難度系數(不少于5種維度)、題類(中考題/常考題/易錯題/壓軸題等)、真題次數、試題來源(所屬地區)、能力、解析等十余類;
試卷屬性包含學科、教材版本、年份、地區、學校、年級、學期、試卷類型、來源、分值、難度系數、考試時間、命題人等十余類;所有學科考點覆蓋率100%。
試題解析均獲得授權,100%原創解析,解析維度包括專題分類、分析過程、考點解析、解答過程、教師點評等。
景聯文科技專業的題目數據庫,不僅注重理解數據庫設計原理,還強化數據庫設計技術。運用關系型數據庫管理模板和非關系型數據庫(NoSQL)結合來處理和存儲海量的題庫數據,利用大數據處理框架Hadoop和Spark進行高效的數據分析和處理,以支持大模型進行高效復雜的數據庫操作。
景聯文科技將該題庫進行部分開源,共開源10萬道教育題庫供更多的企業體驗、反饋。期望能為國內的大模型應用研發企業提供領先優勢,搶占戰略制高點。
免費獲取請咨詢景聯文科技官網。
景聯文科技|數據采集|數據標注
助力人工智能技術,賦能傳統產業智能化轉型升級