跳到主要內容

發表文章

目前顯示的是 10月, 2024的文章

蘋果發布多模態 AI 大語言模型 MM1.5

蘋果發布多模態 AI 大語言模型 MM1.5,目的為加強對文字和圖片的理解,以及多圖片推理能力,這是一個全面增強的版本。 MM1.5 核心升級其創新的資料處理方法,採用以資料為中心的訓練方式,精心選擇並最佳化訓練資料集,MM1.5 結合高清的 OCR 資料和合成影像描述,以及精細的視覺指令調整資料,提高了在文字辨識、圖片理解和視覺指令執行方面的表現。 https://arxiv.org/pdf/2409.20566