AI大模型的發(fā)展日新月異。從文生視頻到長(zhǎng)文本,從“深度思考”到“解放雙手”,AI大模型的能力邊界不斷拓寬;從能力到產(chǎn)品力,從“百模大戰(zhàn)”到頭部大模型“出圈”,AI大模型產(chǎn)業(yè)格局加速演變。
未來(lái),從重投入轉(zhuǎn)變?yōu)橹禺a(chǎn)出,將是AI大模型產(chǎn)業(yè)的重要主題。AI大模型應(yīng)用的商業(yè)模式將越來(lái)越成熟,并被更多人接受。隨著應(yīng)用場(chǎng)景更加多元,規(guī)模持續(xù)擴(kuò)大,AI大模型公司將從比技術(shù)趨向比成本、比服務(wù);大公司贏家通吃,中小公司百花齊放或成未來(lái)格局?!蛴浾?劉怡鶴
亮點(diǎn)頻出 大模型能力全面展現(xiàn)
2024年,對(duì)于AI大模型產(chǎn)業(yè)來(lái)說(shuō)仍是技術(shù)突飛猛進(jìn)的一年。年初,OpenAI發(fā)布了文生視頻模型Sora。這款“世界模擬器”的橫空出世,不僅可能顛覆影視內(nèi)容產(chǎn)業(yè),而且被視為邁向通用人工智能(AGI)的重要一步。
文生視頻之后,超長(zhǎng)文本點(diǎn)燃了大模型產(chǎn)業(yè)的另一把火。“一口氣讀完20萬(wàn)字小說(shuō)”的Kimi火了,背后是國(guó)產(chǎn)大模型的上下文處理能力,從十萬(wàn)字級(jí)別躍升到千萬(wàn)字級(jí)別。
9月,OpenAI的o1模型預(yù)覽版推出;12月,o1正式版、o1 pro發(fā)布。o1系列聚焦“深度思考”,可以“思考”(推理)更長(zhǎng)的時(shí)間來(lái)獲得更可靠的響應(yīng)。在外部專家測(cè)試人員的評(píng)估中,o1 pro 模式可以產(chǎn)生更可靠、更準(zhǔn)確、更全面的響應(yīng),尤其是在數(shù)據(jù)科學(xué)、編程和判例法分析等領(lǐng)域。
各大科技巨頭也亮點(diǎn)頻出。美國(guó)AI獨(dú)角獸Anthropic的大模型Claude推出了Computer use(電腦使用)的功能,大模型可以根據(jù)指令控制電腦進(jìn)行相關(guān)操作,指向了未來(lái)“解放雙手”的理想狀態(tài)。谷歌Gemini 2.0 Flash Thinking不僅和o1模型一樣擅長(zhǎng)編程、數(shù)學(xué)等“慢思考”工作,而且還能給出其“思考”的過(guò)程。
上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任肖仰華對(duì)記者說(shuō):“OpenAI o1推出之后,我們就有一個(gè)判斷,即AI大模型作為人類智能的一個(gè)復(fù)制,其從0到1的技術(shù)突破已經(jīng)全面展現(xiàn)出來(lái)。o1之后大部分大模型的各項(xiàng)進(jìn)展,事實(shí)上是在已有各種能力上的不斷完善。”
用戶激增 AI應(yīng)用產(chǎn)品力爆發(fā)
2024年,AI大模型的產(chǎn)品力逐漸顯現(xiàn)出來(lái)。
11月的全球月活躍用戶排行榜顯示,ChatGPT 的MAU(月活躍用戶人數(shù))居全球首位,達(dá)到2.87億。12月初,OpenAI宣布,ChatGPT 每周已有3億活躍用戶,每天發(fā)送的消息超過(guò)10億條,并且美國(guó)有130萬(wàn)開(kāi)發(fā)者在OpenAI平臺(tái)上開(kāi)發(fā)應(yīng)用程序。
ChatGPT已形成較為成熟的訂閱式商業(yè)模式。普通版本的ChatGPT免費(fèi)提供給用戶,幫助完成日常任務(wù),plus和pro版分別定價(jià)每月20美元和200美元。12月最新推出的pro服務(wù)可以無(wú)限制地訪問(wèn)OpenAI最智能的o1系列,包括最新發(fā)布的o1 pro,以及o1-mini、GPT-4o和高級(jí)語(yǔ)音模式(Advanced Voice)。
豆包App成為國(guó)內(nèi)最火AI應(yīng)用,其11月的MAU接近6000萬(wàn),僅次于ChatGPT。截至12月中旬,豆包通用模型的日均tokens使用量已超過(guò)4萬(wàn)億,較七個(gè)月前首次發(fā)布時(shí)增長(zhǎng)了33倍。
在12月18日到19日字節(jié)跳動(dòng)舉行的火山引擎Force大會(huì)上,豆包大模型圍繞用戶體驗(yàn)進(jìn)行了全面升級(jí)。豆包戰(zhàn)略研究負(fù)責(zé)人周昊表示:“豆包一直在努力,讓用戶的輸入更快更方便?!币虼?,豆包產(chǎn)品非常注重多模態(tài)的輸入和打磨,包括語(yǔ)音、視覺(jué)等能力。
研究顯示,人類接收的信息超過(guò)80%來(lái)自視覺(jué)。字節(jié)跳動(dòng)發(fā)布了豆包視覺(jué)理解模型,旨在極大地拓展大模型的能力邊界,同時(shí)降低人們與大模型交互的門檻,為大模型解鎖更豐富的應(yīng)用場(chǎng)景。
在企業(yè)服務(wù)方面,豆包大模型已經(jīng)與八成主流汽車品牌合作,并接入多家手機(jī)、PC等智能終端,覆蓋終端設(shè)備約3億臺(tái),來(lái)自智能終端的豆包大模型調(diào)用量在半年時(shí)間內(nèi)增長(zhǎng)100倍。
火山引擎總裁譚待認(rèn)為,豆包大模型市場(chǎng)份額的爆發(fā),得益于火山引擎“更強(qiáng)模型、更低成本、更易落地”的發(fā)展理念,讓AI成為每一家企業(yè)都能用得起、用得好的普惠科技。
在二級(jí)市場(chǎng)上,“豆包概念股”行情火熱。光云科技全資子公司杭州其樂(lè)融融科技有限公司獲得了火山引擎“萬(wàn)有計(jì)劃”產(chǎn)品生態(tài)合作伙伴鉆石級(jí)稱號(hào)。12月18日到20日,光云科技三日漲幅達(dá)46.78%,位列A股全市場(chǎng)漲幅榜第一。12月以來(lái),潤(rùn)欣科技、視覺(jué)中國(guó)股價(jià)已實(shí)現(xiàn)翻倍,潤(rùn)澤科技、天娛數(shù)科、漢得信息、樂(lè)鑫科技等多股均大幅上漲。
上海市人工智能技術(shù)標(biāo)準(zhǔn)化委員會(huì)委員王文廣接受記者采訪表示,在產(chǎn)品化方面,目前應(yīng)用較為廣泛的是知識(shí)搜索和自動(dòng)編程。
通過(guò)外部知識(shí)增強(qiáng)大模型的方法,已經(jīng)成為大模型應(yīng)用的標(biāo)準(zhǔn)配置。ChatGPT、豆包、百度的文小言(文心一言)、智譜清言、訊飛星火、DeepSeek等產(chǎn)品都支持搜索功能;谷歌、百度、微信的“搜一搜”等傳統(tǒng)搜索引擎也都加入了大模型應(yīng)用。
在大模型自動(dòng)編程方面,微軟旗下的GitHub Copilot推出了免費(fèi)版本,Devin推出了每月500美元的完全自動(dòng)化版本,WindSurf和Cursor也被開(kāi)發(fā)者廣泛使用。“這些大模型編程產(chǎn)品大幅提升了編碼效率,甚至在簡(jiǎn)單應(yīng)用場(chǎng)景下,幾乎實(shí)現(xiàn)了完全自動(dòng)化?!蓖跷膹V說(shuō)。
頭部集中 未來(lái)產(chǎn)業(yè)格局浮現(xiàn)
“百模大戰(zhàn)”之后,頭部集中的格局正在浮現(xiàn)。OpenAI作為行業(yè)的先行者,持續(xù)開(kāi)創(chuàng)性地推出技術(shù)升級(jí)和新功能,其迭代既有著較高的用戶關(guān)注度,也往往引發(fā)行業(yè)效仿,行業(yè)地位難以撼動(dòng)。豆包雖然起步較晚,但作為字節(jié)跳動(dòng)旗下首個(gè)AI應(yīng)用,坐擁字節(jié)跳動(dòng)生態(tài)的強(qiáng)大本土流量?jī)?yōu)勢(shì),以及用戶體驗(yàn)的打磨能力與經(jīng)驗(yàn)。
上海人工智能研究院算法工程師黃冠對(duì)記者說(shuō):“ChatGPT的產(chǎn)品路徑優(yōu)點(diǎn)首先在于探索‘無(wú)人之境’,其次生成結(jié)果質(zhì)量較高,一些實(shí)用性功能錦上添花,實(shí)時(shí)搜索、高級(jí)語(yǔ)音視頻的交互模式顯著提升了用戶體驗(yàn)?!?/p>
豆包的產(chǎn)品化路徑主要是深入用戶端的實(shí)際使用場(chǎng)景,更貼“地氣”。豆包覆蓋了電腦端、手機(jī)端、網(wǎng)頁(yè)端等多個(gè)場(chǎng)景。比如電腦端的豆包可以開(kāi)啟“劃詞”等功能直接與用戶互動(dòng),幫助用戶更高效地完成日常辦公,培養(yǎng)出了較高的用戶黏性。最新融入視覺(jué)大模型后,豆包的應(yīng)用場(chǎng)景有望進(jìn)一步拓寬。
“大模型公司明顯開(kāi)始轉(zhuǎn)向打造爆款應(yīng)用,打造讓用戶群體滿意、適配各場(chǎng)景、解決實(shí)際問(wèn)題的平臺(tái)和工具?!毙ぱ鋈A說(shuō),大模型產(chǎn)業(yè)從不計(jì)成本的投入和研發(fā),轉(zhuǎn)變?yōu)殛P(guān)注獲得產(chǎn)出。未來(lái),如何打開(kāi)更大規(guī)模的應(yīng)用場(chǎng)景,采取什么方式獲得更豐厚的回報(bào),成為行業(yè)的重要趨勢(shì)。
王文廣認(rèn)為,隨著AI技術(shù)和產(chǎn)品不斷成熟,訂閱服務(wù)的商業(yè)模式將逐漸被廣泛接受,越來(lái)越多的用戶愿意為提升工作效率而付費(fèi)。
黃冠預(yù)期,具備強(qiáng)大預(yù)測(cè)能力和決策能力的大模型最有可能成為下一個(gè)行業(yè)風(fēng)口,例如在機(jī)器人具身智能、端到端的自動(dòng)駕駛等方面的應(yīng)用。隨著行業(yè)應(yīng)用場(chǎng)景將出現(xiàn)爆炸性增長(zhǎng),大模型將從一項(xiàng)高新技術(shù)“落入凡間”,轉(zhuǎn)向比拼成本和落地服務(wù)能力。
“基座大模型具有AI基礎(chǔ)設(shè)施的特性,和其他基礎(chǔ)設(shè)施一致,只有資本雄厚、場(chǎng)景豐富、渠道多元的頭部公司才能成為贏家?!毙ぱ鋈A認(rèn)為,絕大部分中小企業(yè)可以轉(zhuǎn)型成為大模型的應(yīng)用開(kāi)發(fā)商,打造基于大模型基礎(chǔ)設(shè)施的各種應(yīng)用程序,完成大模型變現(xiàn)的“最后一公里”。