OpenAI最新部署的GPT-4o多模態(tài)模型正面臨甜蜜的煩惱。3月28日,公司CEO薩姆·奧特曼在X平臺(tái)確認(rèn),由于圖像生成請求量呈指數(shù)級增長,已啟動(dòng)臨時(shí)速率限制機(jī)制。"每生成一張4K精度的圖像,相當(dāng)于處理500頁文本的算力消耗,"內(nèi)部工程師透露。
此次升級的突破性在于文本-圖像協(xié)同生成能力。測試顯示,GPT-4o可連續(xù)執(zhí)行"生成穿西裝的黑貓→添加VR頭顯→置入賽博朋克場景"這類多層指令,其上下文記憶窗口擴(kuò)展至128K tokens,遠(yuǎn)超Stable Diffusion等單點(diǎn)模型。但中文等非拉丁語系的文字渲染仍是技術(shù)洼地,錯(cuò)誤率比英文高47%。
限速措施背后是殘酷的硬件現(xiàn)實(shí)。據(jù)半導(dǎo)體行業(yè)分析機(jī)構(gòu)Tirias Research測算,?單次GPT-4o圖像生成需調(diào)用8塊H100 GPU協(xié)同工作,能耗相當(dāng)于3個(gè)美國家庭的日均用電量。這迫使OpenAI做出取舍:優(yōu)先保障企業(yè)級API用戶的服務(wù)質(zhì)量,同時(shí)將免費(fèi)用戶的訪問權(quán)限壓縮至每日3次。
值得注意的是,該限制恰逢NVIDIA新一代B100芯片量產(chǎn)延期。這批采用3nm工藝的加速卡原計(jì)劃Q2交付,其FP8運(yùn)算性能較H100提升30%,被視為緩解AI算力荒的關(guān)鍵。行業(yè)觀察家認(rèn)為,OpenAI的緊急制動(dòng)反映了多模態(tài)AI商業(yè)化的深層矛盾——用戶體驗(yàn)越流暢,基礎(chǔ)設(shè)施承壓越顯著。
目前,ChatGPT Plus訂閱用戶仍可無限制使用圖像功能,但響應(yīng)時(shí)間延長至平均12秒。奧特曼強(qiáng)調(diào)正在優(yōu)化模型架構(gòu),包括實(shí)驗(yàn)性的動(dòng)態(tài)精度縮放技術(shù),可根據(jù)任務(wù)復(fù)雜度自動(dòng)調(diào)整算力分配。微軟Azure的最新監(jiān)測數(shù)據(jù)顯示,OpenAI專用集群的GPU利用率已連續(xù)72小時(shí)維持在98%的警戒線以上。