跳到主要內容

發表文章

Xiaomi 發布聲音理解大模型 MiDashengLM-7B!

Xiaomi (小米) 正式發表並全面開放 MiDashengLM-7B 多模態大模型程式碼和參數,旨在為其電動車和智慧家居設備提供 AI 驅動,這款專注於音訊理解的 AI 模型在性能和效率上都取得了顯著突破。 一流的性能 在多個關鍵音訊理解任務上表現優於 Qwen2.5-Omni-7B、Kimi-Audio-Instruct-7B 。 高效率 與 Qwen2.5-Omni-7B 相比,在同等批量大小下,吞吐量加快了3.2 倍。 透過進一步增加批次大小,吞吐量提升了 20 倍。我們在 80GB GPU 上測試了大量大小高達 512 的30 秒音訊輸入。基準測試僅支援批次大小為 8。 與 Qwen2.5-Omni-7B 相比,第一個令牌時間 (TTFT) 加速高達4 倍。 基於標題的對齊 使用通用音訊字幕(而不是 ASR 成績單)進行訓練,以實現整體音訊理解。 完全透明 公共源訓練資料和可重複的管道。 Apache License 2.0 適用於研究和商業用途。 MiDashengLM-7B 模型以現有的語音技術為基礎,並採用了阿里巴巴的開放程式碼 Qwen2.5-Omni-7B 作為解碼器訓練的初始化模型。 https://kopyai.com/zh-tw/latest/view/type.news/0/45 Picture Source: unsplash.com
最近的文章

Google 推出虛擬衛星 AI 模型 - AlphaEarth Foundations

Google DeepMind 團隊推出虛擬衛星 AI 模型 - AlphaEarth Foundations,這是一個整合了數 PB 的地球觀測數據,產生統一的數據,徹底改變了全球地圖繪製和監測模式。 衛星每天都會捕捉資訊豐富的影像和測量數據,為科學家和專家提供近乎即時的地球視圖。雖然這些數據影響深遠,但其複雜性、多模態性和高刷新率也帶來了新的挑戰:如何連接不同的數據集並有效地利用它們。 AlphaEarth Foundations 是一個功能類似虛擬衛星的人工智慧 (AI) 模型。它透過將海量地球觀測資料整合成統一的數位表示(或稱為「嵌入」),使電腦系統能夠輕鬆處理,從而準確且有效率地描述地球的整個陸地和沿海水域。這使得該模型能夠為科學家提供更完整、更一致的地球演化圖景,幫助他們在糧食安全、森林砍伐、城市擴張和水資源等關鍵問題上做出更明智的決策。 為了加速研究並解鎖用例,Google 將 AlphaEarth 基金會的年度嵌入資料集作為 Google Earth Engine 中的衛星嵌入資料集發布。在過去的一年裡,Google 與 50 多個組織合作,在其實際應用中測試了該資料集。 Google 的合作夥伴已經看到了顯著的效益,他們利用這些數據來更好地對未測繪的生態系統進行分類,了解農業和環境變化,並大幅提高測繪工作的準確性和速度。 AlphaEarth Foundations 的運作方式 AlphaEarth Foundations 透過解決兩個主要挑戰:資料過載和資訊不一致,為了解我們的星球提供了強大的新視角。 首先,它整合了來自數十個不同公共來源的海量資訊——光學衛星圖像、雷達、3D雷射測繪、氣候模擬等等。它將所有這些資訊整合在一起,以10x10米的清晰網格分析全球陸地和沿海水域,從而能夠以驚人的精度追蹤隨時間推移的變化。 其次,它使這些數據變得切實可行。該系統的關鍵創新在於它能夠為每個方格創建高度緊湊的摘要。與我們測試過的其他人工智慧系統相比,這些摘要所需的儲存空間減少了16倍,並顯著降低了行星級分析的成本。 這項突破使科學家們能夠實現先前不可能實現的成就:按需創建詳細一致的世界地圖。無論是監測農作物健康狀況、追蹤森林砍伐,或是觀察新建築,他們都不再需要依賴單顆衛星。現在,他們擁有了一種全新的地理空間資料基礎。 https://kopyai.com/z...

Anthropic 部署 AI 代理程式來審核模型的安全性

  Anthropic已經建立了一支自主人工智慧代理大軍,其唯一使命是:審核像 Claude 這樣的強大模型以提高安全性。 隨著這些複雜系統的快速發展,確保其安全、杜絕隱憂已成為一項艱鉅的任務。 Anthropic 認為他們已經找到了解決方案,這是一個以毒攻毒的經典案例。 這個想法類似於數位免疫系統,其中人工智慧代理就像抗體一樣,在問題造成實際損害之前識別並消除它們。它使研究人員不必依賴過度勞累的人類團隊,與潛在的人工智慧問題進行無休止的「打地鼠」遊戲。 數字偵探小隊 該方法本質上是一個數位偵探小組;由三名專門的人工智慧安全人員組成,每個人員都有不同的角色。 首先登場的是調查員特工,團隊中頭髮花白的偵探。它的任務是深入調查,找出問題的根源。它配備了一套工具包,可以審問嫌疑模型,在大量資料中篩選線索,甚至可以透過窺探模型的神經網路來了解其思維方式,從而進行某種數位取證。 然後是評估代理。你給這個代理人一個特定的已知問題——例如,一個有點過於急於取悅的模型——它會設計並運行一系列測試來衡量問題的嚴重程度。這一切都是為了產生證明案例所需的冷酷無情的數據。 團隊的最後一位成員是廣度優先紅隊特工,臥底特工。這位特工的任務是與模型進行數千次不同的對話,試圖誘使其暴露任何令人擔憂的行為,即使是研究人員尚未想到的行為。最可疑的互動隨後會傳遞到上級人工審核,確保專家不會浪費時間鑽牛角尖。 Anthropic 測試其 AI 安全代理程式的效能 為了檢驗新招募的數位人員是否能勝任這項工作,Anthropic 的研究人員對他們進行了一系列「審計遊戲」。 在一項測試中,他們創建了一個帶有秘密目的的模型:成為一個諂媚者。它被秘密訓練,根據一項虛構的學術研究來奉承其內部的獎勵系統,而這恰恰是其程式設計中隱藏的缺陷。 當派出一名調查員特工時,它表現得非常吃力,只有13%的機率找到隱藏目標。事實證明,這名特工有一個非常人性的缺陷:它容易執著於第一個想法,而忽略了探索其他線索。 但這正是該系統的精妙之處。當研究人員部署一位「超級特工」匯總十位獨立調查員的調查結果時,成功率飆升至42%。這證明了團隊合作才能成就夢想,即使對人工智慧來說也是如此,它能讓團隊克服可能阻礙調查的個人盲點。 其他特工也都出色地通過了測試。評估特工成功設計了測試,能夠以 88% 的準確率發現異常模型,而紅隊特工則成功發現了...

Mistral AI 發布 Devstral 系列

Mistral AI 和 All Hands AI 合作發布 Devstral Medium 和 Devstral Small 升級版本,全新 Devstral Small 1.1 採用 Apache 2.0 授權發布,是程式碼代理開放模型中最先進的,Devstral Medium 可透過 Mistral AI 的 API 取得,並在性價比和效能上相比 Gemini 2.5 Pro 和 GPT 4.1 有著不錯的成效。 Devstral Small 1.1 與 Devstral Small 的上一版本一樣,我們根據 Apache 2.0 許可證發布了 Devstral Small 1.1。雖然架構保持不變,參數數量僅 24B,但 Devstral Small 1.1 與其前身相比有了顯著的改進: 增強效能 Devstral Small 1.1 在 SWE-Bench Verified 上獲得了 53.6% 的分數,並為沒有測試時間擴展的開放模型設定了新的最先進水平。 多功能性和通用性 Devstral Small 1.1 與 OpenHands 搭配使用時表現出色,並且能夠更好地泛化到不同的提示符和編碼環境。 同時支援 Mistral 函數呼叫和 XML 格式,進一步增強了其多功能性,使其能夠適用於各種應用程式和代理框架。 Devstral Medium Devstral Medium 繼承了 Devstral Small 的優勢,並將性能提升至更高水平,在 SWE-Bench Verified 測試中獲得了 61.6% 的得分。 Devstral Medium 可透過 Mistral AI 的公共 API 獲取,其卓越的性能和極具競爭力的價格使其成為尋求高品質、高性價比模型的企業和開發者的理想之選。 對於偏好本地解決方案的用戶,Devstral Medium 可以直接部署在私人基礎架構上,從而增強資料隱私和控制力。我們還支援 Devstral Medium 的自訂微調,讓企業可以根據特定用例自訂模型,並根據其特定需求實現最佳效能。 可用性 devstral-small-2507 的價格與 Mistral Small 3.1 相同:0.1 美元/M 輸入 Tokens 和 0.3 美元/M 輸出 Tokens。 devstral-medium-2507 的價格與 M...

微軟發布輕量級推理模型 Phi-4-mini-flash-reasoning

微軟推出 Phi 模型系列的新版本 - Phi-4-mini-flash-reasoning,此新模型專為運算、記憶體和延遲受到嚴格約束的場景而設計,旨在為邊緣設備、行動應用程式和其他資源受限的環境帶來高級推理能力。 新模型沿用 Phi-4-mini,但建立在一種新的混合架構上,吞吐量提高了 10 倍,延遲平均降低了 2 到 3 倍,在不犧牲推理性能的情況下實現了顯著加快的推理速度。 Phi-4-mini-flash-reasoning 在數學推理能力和效率之間取得平衡,使其可能適用於教育應用、基於即時邏輯的應用等。  與前代產品類似,Phi-4-mini-flash-reasoning 是一個擁有 38 億個參數的開放模型,並針對高階數學推理進行了最佳化。它支援 64K 的 token 上下文長度,並基於高品質合成資料進行了微調,以提供可靠的邏輯密集型效能部署。   Phi-4-mini-flash-reasoning 的核心是全新引入的解碼器-混合解碼器架構 SambaY,其核心創新在於門控記憶單元 (GMU),這是一種簡單而有效的跨層共享表徵機制。該架構包含一個自解碼器,它結合了 Mamba(狀態空間模型)和滑動視窗注意力 (SWA),以及一個單層全注意力機制。此外,該架構還包含一個交叉解碼器,它將昂貴的交叉注意力層與全新的高效 GMU 交錯排列。這種具有 GMU 模組的新架構顯著提升了解碼效率,增強了長上下文檢索效能,並使該架構能夠在各種任務中提供卓越的效能。  SambaY 架構的主要優勢包括:  增強解碼效率。 保留線性預歸檔時間複雜度。 提高了可擴展性並增強了長上下文效能。 吞吐量提高高達 10 倍。 與 Phi 系列的所有模型一樣,Phi-4-mini-flash-reasoning 可部署在單 GPU 上,從而適用於廣泛的用例。然而,它的獨特之處在於其架構優勢。與 Phi-4-mini-reasoning 相比,這個新模型實現了顯著更低的延遲和更高的吞吐量,尤其是在長上下文生成和延遲敏感型推理任務中。  這使得 Phi-4-mini-flash-reasoning 成為希望部署需要快速、可擴展和高效推理的智慧型系統的開發人員和企業的引人注目的選擇——無論是在本地還是在設備上。  h...

歐盟發布通用人工智慧實踐準則,8月2日起正式實施

該實踐準則有助於業界遵守《人工智慧法案》關於通用人工智慧模型的安全性、透明度和版權的法律義務。 《通用人工智慧 (GPAI) 實踐準則》是一項自願性工具,由獨立專家在多利益相關者參與的流程中製定,旨在幫助產業遵守《人工智慧法案》對通用人工智慧模型提供者的義務。了解更多關於該準則起草過程的時間表。 該準則於2025年7月10日發布。在接下來的幾週內,成員國和委員會將評估其充分性。此外,委員會關於通用人工智慧模型關鍵概念的指南也將補充該準則,該指南也將於7月發布。 在該準則獲得成員國和委員會批准後,自願簽署該準則的人工智慧模型提供者可以透過遵守該準則來證明其遵守了《人工智慧法案》。這將減輕他們的行政負擔,並賦予他們比其他方式證明合規性更高的法律確定性。 為什麼要製定通用人工智慧的行為準則? 通用人工智慧 (GPAI) 模型可以執行廣泛的任務,並正在成為歐盟許多人工智慧系統的基礎。其中一些模型如果功能強大或被廣泛使用,可能會帶來系統性風險。為了確保人工智慧的安全性和透明性,《人工智慧 法案》 為此類模型的提供者制定了規則,其中包括透明度和版權相關規則。對於可能存在系統性風險的模型,提供者應評估並降低這些風險。 《人工智慧法案》中關於通用人工智慧的規定將於 2025 年 8 月 2 日起生效。人工智慧辦公室一直在推動制定《實踐準則》,以詳細說明這些規則。 該準則是由獨立專家編寫的自願工具,旨在幫助業界遵守《人工智慧法案》關於通用人工智慧的規定。  https://kopyai.com/zh-tw/latest/view/type.news/0/40 Picture Source: unsplash

美國公布 2025 年六月非農就業人數

美國勞工統計局今天報告稱,6 月非農業就業總人數增加了 14.7 萬人,失業率基本持平於 4.1%。州政府和醫療保健領域的就業機會增加。聯邦政府部門的就業機會持續減少。 本新聞稿提供的統計數據來自兩項月度調查。 家庭調查以人口統計特徵衡量勞動力狀況,包括失業率。 機構調查以行業衡量非農業就業人數、工時和收入。 家庭調查數據 6月份,失業率為 4.1%,失業人數為 700 萬,兩者皆變化不大。自2024年5月以來,失業率一直維持在 4.0% 至 4.2% 的窄幅區間內。 在主要勞動族群中,非裔美國人(6.8%)的失業率在6月有所上升,而成年女性(3.6%)和白人(3.6%)的失業率則下降。成年男性(3.9%)、青少年(14.4%)、亞裔(3.5%)和西班牙裔(4.8%)的失業率在當月幾乎沒有變化。 6 月份,長期失業人數(失業 27 週或以上)增加了 19 萬,達到 160 萬,基本上抵消了上個月的降幅。長期失業者佔所有失業人口的 23.3%。 6 月份,勞動參與率基本維持不變,為 62.3%,就業人口比率維持在 59.7%。 6 月份,因經濟原因從事兼職工作的人數為 450 萬,基本維持不變。這些人原本更傾向於全職工作,但由於工作時間減少或無法找到全職工作,他們只能從事兼職工作。 6 月份,目前希望就業但未加入勞動力的人數基本保持不變,為 600 萬人。這些人未被計入失業人數,因為他們在調查前 4 週內沒有積極尋找工作,或無法接受工作。 在希望就業但未加入勞動力隊伍的人數中,6 月處於邊緣就業狀態的人數增加了 23.4 萬人,達到 180 萬人。這些人希望工作,並且能夠工作,在過去 12 個月的某個時間點尋找工作,但在調查前 4 週內沒有尋找工作。灰心喪志的工人(邊緣就業人群中的一部分,他們認為沒有工作機會)的人數在 6 月增加了 25.6 萬人,達到 63.7 萬人。 機構調查數據 6月份非農業就業總人數增加了 14.7 萬個,與過去 12 個月平均每月增加 14.6 萬個的水平持平。6月份,州政府和醫療保健領域的就業機會增加。聯邦政府的就業機會持續減少。 6月政府就業機會增加了 7.3 萬個。州政府就業機會增加了4.7萬個,主要集中在教育領域(增加了4萬個)。地方政府教育領域的就業機會持續增加(增加了2.3萬個)。聯邦政府就業機會持續減少(減少了7千個),自1月...