“我們正在沿著指數(shù)級技術(shù)進(jìn)步的長弧線攀登,它總是向前看是垂直的,向后看是平坦的。”
基座模型圈的迭代已成循環(huán),繼DeepSeek和谷歌進(jìn)行了一輪模型更新后, OpenAI接替開始發(fā)布新的模型版本。
北京時(shí)間6月11日,OpenAI在X上宣布o(jì)3-pro正式上線,向Pro和Team用戶開放,企業(yè)、教育用戶將在下周獲得使用權(quán)限。
OpenAI CEO奧爾特曼(Sam Altman)發(fā)文稱,“o3-pro太聰明了!我第一次看到它相對于 o3 的勝率時(shí),簡直不敢相信。”
根據(jù)OpenAI內(nèi)部測試,o3-pro在數(shù)學(xué)基準(zhǔn)測試AIME 2024中超越谷歌最強(qiáng)的模型Gemini 2.5 Pro,在博士級科學(xué)測試GPQA Diamond中擊敗Anthropic 最強(qiáng)的Claude 4 Opus,展現(xiàn)出推理模型領(lǐng)域的領(lǐng)先性能。
不過,在X上的評論區(qū)有用戶反饋,“o3 pro什么時(shí)候能回復(fù)我的問題?已經(jīng)加載了45分鐘了。”顯示出推理模型的回復(fù)速度問題。
根據(jù)官方,作為推理模型o3的升級版,o3-pro更加強(qiáng)大,設(shè)計(jì)為思考更長的時(shí)間,提供最可靠的反應(yīng),適合在數(shù)學(xué)、科學(xué)和編碼等領(lǐng)域使用這種模型,因此“等待是值得的”。
此外,奧爾特曼還表示將上一代推理模型o3的價(jià)格降低了80%。o3 模型從輸入 10 美元/百萬 tokens、輸入 40 美元/百萬 tokens,直接降到了 2 美元和 8 美元。與此同時(shí),o3-pro 每輸入百萬 tokens 收費(fèi) 20 美元,每輸出百萬 tokens 收費(fèi) 80 美元,比 o1-pro 便宜 87%。
在宣布o(jì)3降價(jià)前,有媒體消息稱,OpenAI已與谷歌達(dá)成云服務(wù)合作協(xié)議,將利用谷歌的計(jì)算資源支撐自身業(yè)務(wù),于今年5月正式敲定。對OpenAI而言,這是擺脫對微軟過度依賴的最新舉措,而對谷歌而言,這是旗下云服務(wù)業(yè)務(wù)的重大勝利。不過,雙方目前均拒絕置評。
模型飛速迭代的背后是對算力永不滿足的渴求。去年9月,OpenAI預(yù)計(jì),未來幾年模型訓(xùn)練的計(jì)算成本可能會(huì)大幅上升,到2026年將高達(dá)一年95億美元,這還不包括大模型研究的前期訓(xùn)練成本。
今年1月,微軟曾宣布,不再擔(dān)任OpenAI的獨(dú)家云服務(wù)供應(yīng)商,但保留了“優(yōu)先購買權(quán)”。當(dāng)時(shí)的報(bào)道稱, OpenAI高層對微軟建設(shè)新數(shù)據(jù)中心進(jìn)展緩慢較為不滿。從這一合作看起來,算力的需求比模型領(lǐng)域的競爭對手更為重要。
除了發(fā)布模型迭代和降價(jià),奧爾特曼還久違地更新了一篇博客文章《溫和的奇點(diǎn)》(The Gentle Singularity),談到對未來的設(shè)想。他在X上介紹稱,“這可能是最后一次在沒有任何AI幫助的情況下寫這樣的文章了。”他很自豪自己以老式的方式寫下了”從相對論的角度來看,奇點(diǎn)是一點(diǎn)一點(diǎn)發(fā)生的”。
在文章中,奧爾特曼給出了一個(gè)大模型迭代的時(shí)間線:
2025年,能夠進(jìn)行真正認(rèn)知工作的代理系統(tǒng)將出現(xiàn);
2026年,能夠提出新穎見解的系統(tǒng)可能會(huì)出現(xiàn);
2027年,能夠在現(xiàn)實(shí)世界中執(zhí)行任務(wù)的機(jī)器人可能會(huì)出現(xiàn)。
2030年代很可能與以往任何時(shí)期都截然不同,智能、能源、創(chuàng)意,以及實(shí)現(xiàn)創(chuàng)意的能力將變得異常豐富,有了豐富的智力和能源(以及良好的管理),理論上可以擁有任何其他東西。
“我們已經(jīng)從科學(xué)家那里聽說,他們的生產(chǎn)力是人工智能出現(xiàn)之前的兩到三倍。我們也許能夠發(fā)現(xiàn)新的計(jì)算基礎(chǔ),更好的算法。如果我們能在一年或一個(gè)月內(nèi)完成十年的研究,那么進(jìn)展的速度顯然會(huì)大不相同。”奧爾特曼說。
隨著數(shù)據(jù)中心生產(chǎn)的自動(dòng)化,智能的成本最終會(huì)趨近于電力成本。奧爾特曼還介紹了ChatGPT查詢會(huì)使用多少能量:平均查詢大約使用0.34瓦時(shí),大約是一個(gè)烤箱在一秒鐘多一點(diǎn)的時(shí)間內(nèi)使用的電量,或者是一個(gè)節(jié)能燈泡在幾分鐘內(nèi)使用的電量。此外,每次還使用了大約0.000085加侖的水,大約一茶匙的十五分之一。
奧爾特曼認(rèn)為,技術(shù)進(jìn)步的速度將繼續(xù)加快,會(huì)有一些非常困難的地方,例如整個(gè)階層的工作崗位會(huì)消失,但另一方面,世界將變得迅速富有,我們將能夠考慮以前從未有過的新政策和想法。
“我們正在沿著指數(shù)級技術(shù)進(jìn)步的長弧線攀登,它總是向前看是垂直的,向后看是平坦的,但它是一條平滑的曲線。”奧爾特曼稱。
所以GPT-5什么時(shí)候出現(xiàn)?這也是評論區(qū)網(wǎng)友的呼聲。
前幾日,在墨西哥舉辦的 AI Summit 峰會(huì)上,兩名 OpenAI 公司代表透露,公司正在開發(fā)下一代基礎(chǔ)模型 GPT-5,性能將遠(yuǎn)超 GPT-4 等現(xiàn)有模型。關(guān)于發(fā)布時(shí)間,OpenAI 初步定于今年夏天,7 月是目前的目標(biāo)。然而,公司也表示計(jì)劃可能隨時(shí)調(diào)整。如果 GPT-5 未能達(dá)到內(nèi)部設(shè)定的性能目標(biāo),發(fā)布可能會(huì)延遲。
奧爾特曼此次在X上還提到,將花費(fèi)更多時(shí)間在公開權(quán)重模型上,預(yù)計(jì)會(huì)在今年夏天晚些時(shí)候,而不是六月。“我們的研究團(tuán)隊(duì)做了一些出乎意料且非常令人驚奇的事情,我們認(rèn)為這非常值得等待,但需要更長的時(shí)間。”目前他沒有透露這到底是什么類型的模型。