【ITBEAR】近日,Mistral AI 公司正式揭曉了其最新的多模態(tài)人工智能模型——Pixtral Large。這一模型在11月18日的官方公告中首次亮相,憑借1240億參數(shù)的龐大體量,專為文本與圖像的處理任務(wù)而設(shè)計(jì)。
Pixtral Large 目前已面向研究、教育及商業(yè)領(lǐng)域開放,用戶可通過Mistral提供的研究許可證和商業(yè)許可證進(jìn)行訪問和使用。這一舉措無疑為各領(lǐng)域的研究者和實(shí)踐者提供了強(qiáng)大的工具支持。
作為Mistral AI多模態(tài)模型家族的新成員,Pixtral Large在多個(gè)標(biāo)準(zhǔn)基準(zhǔn)測(cè)試中展現(xiàn)出了卓越的性能。特別是在MathVista測(cè)試中,Pixtral Large以69.4%的準(zhǔn)確率脫穎而出,超越了所有同行競(jìng)爭(zhēng)對(duì)手,彰顯了其在復(fù)雜數(shù)學(xué)問題解決方面的優(yōu)勢(shì)。
不僅如此,Pixtral Large在ChartQA和DocVQA等測(cè)試中同樣表現(xiàn)出色,超越了GPT-4o和Gemini-1.5 Pro等業(yè)界知名模型。這些測(cè)試結(jié)果進(jìn)一步證明了Pixtral Large在處理圖表、文檔及視覺問答等任務(wù)時(shí)的強(qiáng)大能力。
Pixtral Large的技術(shù)架構(gòu)同樣令人矚目。該模型配備了123B的多模態(tài)解碼器和1B的視覺編碼器,支持高達(dá)128K的上下文窗口,能夠輕松處理至少30張高分辨率圖像。這一設(shè)計(jì)使得Pixtral Large在處理視覺數(shù)據(jù)、復(fù)雜推理以及圖表理解等方面均展現(xiàn)出了非凡的實(shí)力。
隨著Pixtral Large的推出,Mistral AI進(jìn)一步鞏固了其在多模態(tài)人工智能領(lǐng)域的領(lǐng)先地位。這一創(chuàng)新成果不僅為研究者提供了強(qiáng)大的工具支持,也為商業(yè)應(yīng)用開辟了更加廣闊的前景。