跳到主要內容

OpenAI 發布推理模型最佳實踐!


OpenAI 提供兩種類型的模型:推理模型(例如 o1 和 o3-mini)和GPT 模型(如 GPT-4o)。這些模範家庭的行為各有不同。

推理模型與 GPT 模型

與 GPT 模型相比,我們的 o 系列模型擅長不同的任務並且需要不同的提示。一個模範家庭並不比另一個更好——他們只是不同而已。

我們訓練我們的 o 系列模型(「規劃者」)對複雜任務進行更長時間、更深入的思考,使其能夠有效地制定策略、規劃複雜問題的解決方案,並根據大量模糊資訊做出決策。這些模型還可以高精度地執行任務,使其成為數學、科學、工程、金融服務和法律服務等原本需要人類專家的領域的理想選擇。

另一方面,我們的低延遲、更具成本效益的 GPT 模型(「主力」)旨在實現直接執行。應用程式可能會使用 o 系列模型來規劃解決問題的策略,並使用 GPT 模型來執行特定任務,尤其是在速度和成本比完美的準確性更重要時。

如何選擇

對於您的用例來說什麼是最重要的?

  • 速度和成本→GPT 模型速度更快,而且成本更低
  • 執行明確定義的任務→GPT 模型可以很好地處理明確定義的任務
  • 準確性與可靠性→ o 系列模型是可靠的決策者
  • 解決複雜問題→ o 系列模型解決模糊性和複雜性

如果速度和成本是完成任務時最重要的因素,而您的用例由簡單、定義明確的任務組成,那麼我們的 GPT 模型最適合您。但是,如果準確性和可靠性是最重要的因素,並且您需要解決非常複雜、多步驟的問題,那麼我們的 o 系列模型可能適合您。

大多數 AI 工作流程都會結合使用這兩種模型——o 系列用於代理規劃和決策,GPT 系列用於任務執行。

何時使用我們的推理模型

以下是我們從客戶和 OpenAI 內部觀察到的一些成功使用模式。這並不是對所有可能用例的全面回顧,而是對測試我們的 o 系列模型的一些實用指導。

1. 處理模糊任務

推理模型特別擅長利用有限的資訊或不同的訊息,並透過簡單的提示,理解使用者的意圖並處理指令中的任何差距。事實上,推理模型在做出無根據的猜測或試圖填補資訊空白之前,通常會提出澄清問題。

2. 大海撈針

當你傳遞大量非結構化資訊時,推理模型擅長理解並提取最相關的資訊來回答問題。

3. 在大型資料集中尋找關係和細微差別

我們發現推理模型特別擅長推理包含數百頁密集、非結構化資訊的複雜文檔,例如法律合約、財務報表和保險索賠。這些模型特別擅長在文件之間進行類比,並根據數據中所代表的不言而喻的事實做出決策。

4. 多步驟代理規劃

推理模型對於代理規劃和策略發展至關重要。我們已經看到了成功,當推理模型被用作「規劃者」時,它會為問題提供詳細的多步驟解決方案,然後根據高智慧或低延遲是否最重要,為每個步驟選擇和分配正確的 GPT 模型(「執行者」)。

5.視覺推理

截至目前,o1 是唯一支援視覺功能的推理模型。它與 GPT-4o 的不同之處在於,o1 甚至可以掌握最具挑戰性的視覺效果,例如結構模糊的圖表和表格或影像品質不佳的照片。

6. 審查、調試和改進程式碼品質

推理模型在審查和改進大量程式碼方面特別有效,由於模型的延遲較高,因此通常在後台運行程式碼審查。

7. 其他模型響應的評估和基準測試

我們還發現推理模型在基準測試和評估其他模型響應方面表現良好。資料驗證對於確保資料集的品質和可靠性非常重要,尤其是在醫療保健等敏感領域。傳統的驗證方法使用預先定義的規則和模式,但像 o1 和 o3-mini 這樣的高階模型可以理解資料的上下文和推理,從而實現更靈活、更聰明的驗證方法。

https://kopyai.com/zh-tw/latest/view/type.news/0/14

Picture Source:

openai.com

留言

這個網誌中的熱門文章

美國公布 2025 年六月非農就業人數

美國勞工統計局今天報告稱,6 月非農業就業總人數增加了 14.7 萬人,失業率基本持平於 4.1%。州政府和醫療保健領域的就業機會增加。聯邦政府部門的就業機會持續減少。 本新聞稿提供的統計數據來自兩項月度調查。 家庭調查以人口統計特徵衡量勞動力狀況,包括失業率。 機構調查以行業衡量非農業就業人數、工時和收入。 家庭調查數據 6月份,失業率為 4.1%,失業人數為 700 萬,兩者皆變化不大。自2024年5月以來,失業率一直維持在 4.0% 至 4.2% 的窄幅區間內。 在主要勞動族群中,非裔美國人(6.8%)的失業率在6月有所上升,而成年女性(3.6%)和白人(3.6%)的失業率則下降。成年男性(3.9%)、青少年(14.4%)、亞裔(3.5%)和西班牙裔(4.8%)的失業率在當月幾乎沒有變化。 6 月份,長期失業人數(失業 27 週或以上)增加了 19 萬,達到 160 萬,基本上抵消了上個月的降幅。長期失業者佔所有失業人口的 23.3%。 6 月份,勞動參與率基本維持不變,為 62.3%,就業人口比率維持在 59.7%。 6 月份,因經濟原因從事兼職工作的人數為 450 萬,基本維持不變。這些人原本更傾向於全職工作,但由於工作時間減少或無法找到全職工作,他們只能從事兼職工作。 6 月份,目前希望就業但未加入勞動力的人數基本保持不變,為 600 萬人。這些人未被計入失業人數,因為他們在調查前 4 週內沒有積極尋找工作,或無法接受工作。 在希望就業但未加入勞動力隊伍的人數中,6 月處於邊緣就業狀態的人數增加了 23.4 萬人,達到 180 萬人。這些人希望工作,並且能夠工作,在過去 12 個月的某個時間點尋找工作,但在調查前 4 週內沒有尋找工作。灰心喪志的工人(邊緣就業人群中的一部分,他們認為沒有工作機會)的人數在 6 月增加了 25.6 萬人,達到 63.7 萬人。 機構調查數據 6月份非農業就業總人數增加了 14.7 萬個,與過去 12 個月平均每月增加 14.6 萬個的水平持平。6月份,州政府和醫療保健領域的就業機會增加。聯邦政府的就業機會持續減少。 6月政府就業機會增加了 7.3 萬個。州政府就業機會增加了4.7萬個,主要集中在教育領域(增加了4萬個)。地方政府教育領域的就業機會持續增加(增加了2.3萬個)。聯邦政府就業機會持續減少(減少了7千個),自1月...

Kyutai Labs 發布最新文字轉語音 AI 模型 - Kyutai TTS

法國 AI 研究機構 Kyutai Labs 發布最新文字轉語音 AI 模型 - Kyutai TTS,這是一個即時低延遲,並擁有 16 億參數的模型,包含多項創新。 Kyutai TTS 引領了文字轉語音領域的新潮流。 詞錯率(WER) 衡量的是 TTS 未能遵循腳本的頻率。 說話人相似度是語音複製時衡量產生的音訊與原始樣本的接近程度的指標。 Kyutai Labs 將 Kyutai TTS 與其他模型在 NTREX 的 15 篇英文新聞和 15 篇法文新聞上進行了比較。除 Kyutai TTS 和 ElevenLabs 外,所有模型都被要求逐句生成,因為我們觀察到這種方式效果最佳。 Kyutai TTS 無需提前了解整個文本,從接收第一個文本標記到生成第一個音頻區塊的延遲為 220 毫秒。在Unmute.sh部署中,我們使用批次功能同時處理最多 32 個請求,使用 L40S GPU 時觀察到延遲為 350 毫秒。 Kyutai STT 模型針對即時使用進行了最佳化,可以批量處理以提高效率,並返回單字級時間戳記。我們提供兩種模型: kyutai/stt-1b-en_fr,一個具有約 1B 個參數、0.5 秒延遲和語義 VAD 的英語和法語模型。 kyutai/stt-2.6b-en,一個僅支援英語的模型,具有約 26 億個參數和 2.5 秒的延遲。 這些語音轉文字模型有幾個優點: 流式推理:模型可以分塊處理音頻,從而實現即時轉錄,非常適合互動式應用程式。 輕鬆批次處理以實現最高效率:H100 可以即時處理 400 個串流。 它們傳回單字級時間戳。 1B 模型具有語義語音活動偵測 (VAD) 元件,可用於偵測使用者何時說話。這對於建立語音代理尤其有用。 https://kopyai.com/zh-tw/latest/view/type.news/0/39 Picture Source: kyutai.org

美國公布2025年第一季各州國內生產毛額及個人收入數據

根據美國經濟分析局今天發布的統計數據,2025 年第一季度,39 個州的實際國內生產總值下降,百分比變化範圍從南卡羅來納州的年率 1.7% 到愛荷華州和內布拉斯加州的 -6.1%。 47 個州和哥倫比亞特區的現價國內生產毛額 (GDP)均有所增長,百分比變化範圍從北達科他州的年率 8.7% 到愛荷華州的 -2.7%。 2025 年第一季度,全美 50 個州和哥倫比亞特區的個人收入(以現價美元計算)均有所增加,變化百分比從北達科他州的年率 12.7% 到華盛頓州的 3.2% 不等。 實際GDP 2025年第一季,美國實質GDP年率下降0.5%。在經濟分析局(BEA)編制季度州級估算的23個產業中,有16個產業的實際GDP出現下降。金融和保險業;農業、林業、漁業和狩獵業;以及批發貿易是導致全國實際GDP下降的主要因素。 農業、林業、漁業和狩獵業在 39 個州出現下降,是造成內布拉斯加州、愛荷華州、蒙大拿州和堪薩斯州等 11 個州產量下降的主要原因。 採礦業在43個州出現下降,是造成八個州GDP下降的主要原因,其中包括懷俄明州,該州實際GDP降幅排名第五。 金融和保險業在美國全部 50 個州和哥倫比亞特區均出現下滑,是造成 18 個州下滑的主因。 美國所有 50 個州和哥倫比亞特區的房地產和租賃業均有所增長,成為南卡羅來納州經濟成長的主要貢獻者,該州實際 GDP 增幅最大。 個人收入 2025年第一季度,現價個人收入增加了4,073億美元,年增率為6.7%(表3)。在全國範圍內,收入、轉移收入和財產收入(股息、利息和租金)的增加促進了個人收入的成長。 https://kopyai.com/zh-tw/markets/view/type.stock.us/0/72 Picture Source: 美國經濟分析局