大語言模型 DeepSeek-V3 發布!


中國 AI 初創公司 DeepSeek 發布其大語言模型 DeepSeek-V3,主要用於處理一系列基於文字的工作負載和任務,例如程式碼、翻譯以及根據描述性提示撰寫論文和電子郵件。

根據 DeepSeek  內部的基準測試結果顯示,其性能優於 Meta Llama 3.1 405B、OpenAI 的 GPT-4o、Alibaba Qwen 2.5 72B,在排行榜上名列前茅。

目前 DeepSeek-V3 可透過 Hugging Face 取得。

https://www.deepseek.com/?ref=iaperfecta

留言

熱門文章