xAI發(fā)布支持視覺的多模態(tài)AI模型Grok-1.5V
火幣HTX報(bào)道,馬斯克旗下人工智能公司xAI宣布推出首個(gè)多模態(tài)AI模型Grok-1.5V。除了強(qiáng)大的文本處理能力,Grok還能夠處理各種視覺信息,包括文檔、圖表、屏幕截圖和照片等。 在多個(gè)領(lǐng)域的基準(zhǔn)測試中,Grok-1.5V的表現(xiàn)均可與現(xiàn)有的前沿多模態(tài)模型相媲美。尤其在xAI新推出的RealWorldQA基準(zhǔn)測試中,Grok在現(xiàn)實(shí)世界空間理解能力上超越了同類模型。RealWorldQA數(shù)據(jù)集包含700多張圖像,旨在評估多模態(tài)模型對物理世界的基本理解能力。Grok-1.5將很快向早期測試人員和現(xiàn)有用戶開放。
版權(quán)聲明:本站所有文章皆是來自互聯(lián)網(wǎng),如內(nèi)容侵權(quán)可以聯(lián)系我們刪除!