跳到主要內容

發表文章

目前顯示的是 5月, 2025的文章

Hugging Face 推出兩款新型人形機器人

人工智慧開發平台 Hugging Face 週四繼續進軍機器人領域,發布了兩款新型人形機器人。 該公司宣布推出一對開源機器人,HopeJR 和 Reachy Mini。 HopeJR 是一款全尺寸人形機器人,具有 66 個驅動自由度,或 66 個獨立運動,包括行走和移動手臂的能力。 Reachy Mini 是一款桌面設備,可移動頭部、說話、聆聽,並可用於測試人工智慧應用程式。 Hugging Face 並沒有製定運送這些機器人的具體時間表。該公司聯合創始人兼執行長 Clem Delangue 透過電子郵件告訴 TechCrunch,他們預計將在今年年底前開始運送至少前幾台設備,目前等候名單已經開放。 Hugging Face 估計 HopeJR 每台售價約為 3,000 美元,而 Reachy Mini 每台售價約為 250 至 300 美元,具體取決於關稅。 「重要的是這些機器人是開源的,所以任何人都可以組裝、重建,並了解它們的工作原理,而且價格實惠,這樣機器人技術就不會被少數擁有危險黑匣子系統的大公司所主導,」德蘭格透過電子郵件表示。 德朗格表示,此次機器人的發布部分得益於該公司4 月宣布收購人形機器人新創公司Pollen Robotics 。他補充說,Pollen 團隊賦予了 Hugging Face 製造這些機器人所需的「新功能」。 過去幾年,Hugging Face 一直在大力進軍機器人產業。該公司於 2024 年推出了LeRobot,這是一套用於建立機器人系統的開放 AI 模型、資料集和工具。 https://kopyai.com/zh-tw/latest/view/type.news/0/33 Picture Source: Hugging Face

微軟稱其 Aurora AI 可以準確預測空氣品質、颱風等

微軟聲稱,其最新的人工智慧模型之一可以準確預測空氣品質、颶風、颱風和其他與天氣相關的現象。 微軟在本週發表在《自然》雜誌上的一篇論文和隨附的部落格文章中詳細介紹了 Aurora,這家科技巨頭表示,Aurora 可以比傳統氣象方法更精確、更快速地預測大氣事件。 Aurora 已經接受了來自衛星、雷達和氣象站、模擬和預報的超過一百萬小時的資料訓練,可以利用額外的資料進行微調,對特定的天氣事件做出預測。 人工智慧天氣模型並不是什麼新鮮事。谷歌 DeepMind在過去幾年中發布了包括WeatherNext在內的多項成果,該實驗室聲稱其擊敗了世界上一些最好的預測系統。微軟將 Aurora 定位為該領域的頂尖產品之一,並且對研究氣象科學的實驗室來說是一個潛在的福音。 微軟表示,在實驗中,Aurora 提前四天預測了颱風 Doksuri 登陸菲律賓的時間,超越了一些專家的預測。該模型還在預測 2022-2023 年季節的五天熱帶氣旋路徑方面勝過美國國家颶風中心,並成功預測了 2022 年伊拉克沙塵暴。 雖然 Aurora 需要大量的運算基礎設施來訓練,但微軟表示模型運作效率很高。它可以在幾秒鐘內產生預測,而傳統系統使用超級電腦硬體則需要數小時。 微軟已公開原始碼和模型權重,並表示將透過該模型的專門版本將 Aurora 的 AI 模型整合到其 MSN 天氣應用中,該模型可產生每小時預報,包括雲層預報。 https://kopyai.com/zh-tw/latest/view/type.news/0/32 Picture Source: UnSplash

阿里巴巴發布 WorldPM 系列模型!

阿里巴巴集團旗下 Qwen 團隊宣布發表 WorldPM 系列全新偏好建模模型,包括 WorldPM-72B 及其衍生版本 WorldPM-72B-HelpSteer2、WorldPM-72B-RLHFLow、WorldPM-72B-UltraFeedback 等。這項聲明引起了全球人工智慧開發者社群的廣泛關注,被認為是偏好建模領域的重大突破。 WorldPM:偏好建模的新探索 WorldPM(世界偏好建模)是Qwen在偏好建模領域的最新成果。根據官方介紹,該模型透過對超過1500萬個偏好資料點的訓練,驗證了偏好建模與語言建模遵循類似的縮放規律。這項發現表明,隨著數據和模型規模的擴大,偏好模型可以學習統一的偏好表示,從而顯著提高監督學習的表現。 WorldPM-72B 系列擁有 72 億個參數規模,專為評估和優化其他模型的輸出而設計。官方表示,基於WorldPM進行微調比從零開始訓練有顯著提升效能,尤其在需要捕捉人類偏好的場景下表現優異。這使其成為強化學習和監督微調的理想工具,為開發人員提供模型最佳化的有效途徑。 開源策略:賦能全球開發者 Qwen 始終秉持開源精神; WorldPM 系列模型全部採用 Apache2.0 授權協議發布,現已在 Hugging Face 上開放供全球開發者免費下載使用。這項開放策略不僅降低了技術門檻,也進一步鞏固了Qwen在全球開源AI生態系統中的領導地位。 X平台的開發者回饋將WorldPM的發布描述為“開源模型生態系統的新里程碑”,引發了熱烈的討論,尤其是在監督學習和偏好評估領域。 值得注意的是,WorldPM 並不是一個通用的對話模型,而是專注於為其他模型提供偏好評分和最佳化指導。例如,開發人員可以使用 WorldPM-72B 對生成式 AI 的回應進行評分,從而提高特定任務的模型效能。這種專業化的定位使其在人工智慧發展鏈中發揮關鍵作用。 技術亮點:平衡規模與效率 在 WorldPM 的開發過程中,Qwen 團隊從公共論壇收集了多樣化的偏好數據,涵蓋了多個使用者社區,以確保跨不同文化和語言背景的適應性。 WorldPM 的訓練資料規模為 1,500 萬,結合 15 億至 720 億個參數的模型架構,展現出強大的泛化能力。官方技術報告顯示,WorldPM 在對抗性評估中表現優異,測試損失呈現冪律下降趨勢,顯示模型可以有效識別包含故...

人工智慧新創公司 Cohere 收購市場研究平台 Ottogrid

人工智慧新創公司 Cohere 收購了Ottogrid,這是一個位於溫哥華的平台,致力於開發用於自動化某些高級市場研究的企業工具。 Ottogrid 創始人之一 Sully Omar 週五在X 上的一篇文章中宣布了這筆交易。他並未透露具體條款。 奧馬爾 (Sully Omar) 表示,Ottogrid 將停止其產品,但會給予客戶「充足的通知」和「合理的過渡期」。 奧馬爾 (Sully Omar) 在一份聲明中表示:“我們非常高興加入 Cohere 團隊,並將 Ottogrid 整合到 Cohere 的平台中。” “通過與 Cohere 的合作,我們將極大地影響人們如何實現工作流程自動化、豐富數據以及擴展運營規模。” Cohere 尚未回應置評請求。 Cohere 收購 Ottogrid 之際,Ottogrid 正經歷一些企業動盪。根據 The Information 報導,Cohere 的營收遠未達到該公司在 2023 年初制定的預測,比去年的目標低 85%。 https://kopyai.com/zh-tw/latest/view/type.news/0/30 Picture Source: bpando.org

Mistral 聲稱其最新 AI 模型擁有高性能和低價格

Mistral AI 不斷推動開放模型(Mistral Small、Mistral Large、Pixtral 等)以及企業模型(Mistral OCR、Mistral Saba、Ministral 3B / 8B 等)的前沿。從Mistral 7B 開始,我們的模型就一直展現出明顯更重、更昂貴的模型的性能。今天,我們很高興地宣布 Mistral Medium 3,它將進一步提高語言模型的效率和可用性。 特色 1. Mistral Medium 3 引入了一個新的模型,可以平衡 SOTA 性能 成本降低 8 倍 更簡單的部署以加速企業使用 2. 該模型在編碼和多模式理解等專業用例中處於領先地位 3. 該模型提供了一系列企業功能,包括: 混合或本地/VPC 內部署 客製化後期訓練 整合到企業工具和系統中 Mistral Medium 3 具有卓越的性能,但價格便宜得多。例如,該模型在基準測試中的表現達到或超過 Claude Sonnet 3.7 的 90%,而且成本明顯較低(每 M 個令牌輸入 0.4 美元/輸出 2 美元)。 在性能上,Mistral Medium 3 也超越了領先的開放模型,例如 Llama 4 Maverick 和企業模型,例如 Cohere Command A。在定價上,該模型在 API 和自部署系統中都擊敗了 DeepSeek v3 等成本領先者。 此外,Mistral Medium 3 還可以部署在任何雲端上,包括四個 GPU 及以上的自架環境。 Mistral Medium 3 的設計處於領先地位,特別是在專業用途領域。在下面的評估中,我們會使用其他供應商先前報告的數字(如果有),否則我們會使用我們自己的評估工具。所有基準的性能準確度都是透過相同的內部評估流程獲得的。 Mistral Medium 3 在程式設計和 STEM 任務中表現尤為突出,在這些任務中它的表現接近其體型龐大且速度慢得多的競爭對手。 https://kopyai.com/zh-tw/latest/view/type.news/0/29 Picture Source Mistral.ai

美國4月就業人數增加17.7萬個,超出預期

儘管人們擔心唐納德·川普總統對美國貿易夥伴徵收一攬子關稅的影響,但四月就業成長強於預期。 美國勞工統計局週五報告稱,經季節性調整後,4 月非農就業人數增加了 177,000 人,略低於 3 月下調後的 185,000 人,但高於道瓊斯估計的 133,000 人。 失業率維持在4.2%,符合預期,顯示勞動市場保持相對穩定。用於計算失業率的家庭調查顯示,失業人數增幅更為強勁,當月有工作的人數增加了 436,000 人。 一項涵蓋灰心喪志的工人、因經濟原因從事兼職工作的人員或未充分就業人員的更廣泛的失業指標小幅下降至 7.8%。勞動參與率小幅上升至62.6%。 數據公佈後,股市期貨上漲,公債殖利率也上漲。 https://kopyai.com/markets/view/type.stock.us/0/55 Picture Source unsplash

歐元區4月通膨率維持在2.2%不變,為歐洲央行進一步降息留下空間

歐盟統計局週五公佈的數據顯示,歐元區 4 月通膨率維持在 2.2% 不變,低於預期的下降幅度。 路透社調查的經濟學家此前預計,4 月通膨率將達到 2.1%,而 3 月為 2.2%,因為通膨率已回落至歐洲央行 2% 的目標。 核心通膨率(不包括波動較大的食品、能源、酒精和菸草價格)從 3 月的 2.4% 上升至 2.7%。備受關注的服務業通膨數據也再次回升,從先前的 3.5% 升至 3.9%。 數據公佈後,歐元兌美元和英鎊走高。債券殖利率幾乎沒有變化, 10 年期德國公債殖利率 持續上漲約 3 個基點。 凱投宏觀(Capital Economics)高級歐洲經濟學家弗朗西斯卡·帕爾馬斯(Franziska Palmas)在一份報告中表示,服務業通膨率的上升可能「主要受到復活節時機效應的影響」。她補充道,這些影響將在未來一個月內逆轉,這意味著歐洲央行進一步降息留下了空間。 帕爾馬斯補充道:“我們認為,由於美國關稅對經濟活動造成壓力,且勞動力市場持續疲軟,今年剩餘時間內服務業稅率將大幅下降。” 與此同時,晨星首席股票策略師麥可·菲爾德呼籲保持謹慎,稱關稅的不確定性意味著「我們現在所擁有的任何安慰都是不穩定的」。他說,關稅緊張局勢進一步升級將意味著歐洲通膨上升。 菲爾德補充說,歐洲央行仍在考慮進一步降息。他表示:“整體通膨率相對較低,減輕了歐洲央行的壓力,從而可以進一步降低利率。​​” 歐洲央行行長克里斯蒂娜·拉加德上周向 CNBC 表示,“我們正朝著 2025 年的通膨目標邁進,因此通貨緊縮進程已基本完成。” 拉加德和其他政策制定者上週警告稱,中期通膨前景不太明朗,歐洲可能對美國關稅採取報復性措施,以及德國主要基礎設施一攬子計劃等財政轉變等因素都將發揮作用。 拉加德表示,歐洲央行在製定利率決定時將「極度依賴數據」。央行上個月最後一次降息,將基準利率——存款便利利率——從 2023 年中期的 4% 的高點降至 2.25%。 https://kopyai.com/markets/view/type.stock.us/0/54 Picture Source unsplash

開放程式碼數學 AI 模型 DeepSeek Prover V2 發布

總部位於中國杭州的人工智慧 (AI) 公司DeepSeek週三發布了其 Prover 模型的更新版本。它被稱為 DeepSeek-Prover-V2,是一個高度專業化的模型,專注於證明形式數學定理。大型語言模型(LLM)使用Lean 4程式語言,透過獨立分析每個步驟來檢查數學證明是否邏輯一致。與中國公司先前發布的版本類似,DeepSeek-Prover-V2 是一個開源模型,可以從 GitHub 和 Hugging Face 等流行的儲存庫下載。 DeepSeek 推出以數學為中心的全新 AI 模型 該人工智慧公司在其 GitHub列表頁面上詳細介紹了新模型。它本質上是一個以推理為中心的模型,具有可見的思路鏈(CoT),在數學領域中發揮作用。它是基於 2024 年 12 月發布的 DeepSeek-V3 AI 模型構建並提煉的。 DeepSeek-Prover-V2 可以以多種方式使用。它可以解決高中到大學程度的數學問題,並發現和修復數學定理證明中的錯誤。它還可以用作教學輔助工具,對證明進行逐步解釋,並幫助數學家和研究人員探索新的定理並證明其有效性。 它有兩種模型大小——70 億參數大小和更大的 6,710 億參數大小。後者是在 DeepSeek-V3-Base 上進行訓練的,而前者則建立在 DeepSeek-Prover-V1.5-Base 之上,上下文長度高達 32,000 個標記。 在預訓練過程中,研究人員透過促使基礎模型分解複雜問題實現了冷啟動訓練系統。這些問題構成了一系列子目標。然後,將已解決子目標的證明添加到 CoT 中,並與基礎模型的推理相結合,為強化學習創建初始冷啟動。 值得注意的是,除了 GitHub 之外,該 AI 型號還可以從 DeepSeek 的 Hugging Face 清單中下載。 Prover-V2 模型強調了 AI 模型訓練過程的迭代變化如何顯著提高其專業能力。與其他開源模型發布類似,有關核心架構或更大資料集的細節尚不清楚。 https://kopyai.com/zh-tw/latest/view/type.news/0/28 Picture Source tldv.io