蘋果發布多模態 AI 大語言模型 MM1.5


蘋果發布多模態 AI 大語言模型 MM1.5,目的為加強對文字和圖片的理解,以及多圖片推理能力,這是一個全面增強的版本。

MM1.5 核心升級其創新的資料處理方法,採用以資料為中心的訓練方式,精心選擇並最佳化訓練資料集,MM1.5 結合高清的 OCR 資料和合成影像描述,以及精細的視覺指令調整資料,提高了在文字辨識、圖片理解和視覺指令執行方面的表現。

留言

熱門文章