OpenAI 最強的 o3 模型被揭露欺詐,提前獲得 FrontierMath 測試題庫的特權訪問權限
Bitget2025/01/21 03:29
顯示原文
EpochAI 的一位名為 "Meemi" 的承包商在 Less Wrong 論壇上透露,OpenAI 不僅為 FrontierMath 基準測試提供了財務支持,還獲得了測試題庫的特權訪問權。
EpochAI 的副主任兼聯合創始人 Tamay Besiroglu 很快在平台 X 上承認了這一點。我們犯了一個錯誤,沒有及時披露 OpenAI 在 FrontierMath 中的參與。我們的合同禁止我們在 o3 發布之前這樣做。事後看來,我們應該更早努力爭取透明度。我們承認這一點,並承諾未來會做得更好。
EpochAI 的首席數學家 Elliot Glazer 承認他在項目期間沒有主動披露行業資金的信息,並向那些如果事先知道可能不會參與的數學家道歉。關於 o3 分數,他對 OpenAI 報告的分數準確性表示信心,但強調 EpochAI 需要通過正在開發的獨立保留測試集進行驗證,並承諾將公開該測試集的評估分數。當被問及該保留集的狀態時,Glazer 澄清說它仍在開發中,而不是已完成。
據報導,FrontierMath 是一個高度權重的高級數學推理能力評估基準。它由 EpochAI 與超過 60 位頂尖數學家共同創建,其中包括多位菲爾茲獎得主和國際數學奧林匹克競賽的經驗豐富的題目設計者。
0
0
免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。
PoolX: 鎖倉獲得新代幣空投
不要錯過熱門新幣,且APR 高達 10%+
立即參與
您也可能喜歡
Benchmark分析師重申對日本加密貨幣公司Metaplanet的「買入」評級
金色财经•2025/09/25 03:09
麻吉大哥在Hyperliquid上的ETH及PUMP多單浮虧達1868萬美元
金色财经•2025/09/25 02:51

GAIN官方:正在調查異常增發相關問題
金色财经•2025/09/25 02:29
數據:10 個地址於6小時內共累計收到21萬枚ETH,價值約8.63億美元
Chaincatcher•2025/09/25 02:28
加密貨幣價格
更多
Bitcoin
BTC
$123,337.03
+1.06%

Ethereum
ETH
$4,527.12
+0.50%

BNB
BNB
$1,310.1
-0.35%

Tether USDt
USDT
$1
-0.01%

XRP
XRP
$2.9
+0.84%

Solana
SOL
$229.21
+2.59%

USDC
USDC
$0.9999
+0.01%

Dogecoin
DOGE
$0.2580
+3.09%

TRON
TRX
$0.3422
+0.96%

Cardano
ADA
$0.8402
+1.82%
如何出售 PI
Bitget 上架 PI:在 Bitget 上快速購買或出售 PI!
立即交易
還不是 Bitget 用戶嗎?新用戶可獲得價值 6,200 USDT 的迎新大禮包
立即註冊