download BusinessFocus app
【AI 硬件戰】NVIDIA 霸權告終?OpenAI 聯手 Cerebras 推出「極速版」GPT-5.3!拆解每秒 1000 Tokens 背後的晶片革命與投資變局

【AI 硬件戰】NVIDIA 霸權告終?OpenAI 聯手 Cerebras 推出「極速版」GPT-5.3!拆解每秒 1000 Tokens 背後的晶片革命與投資變局

Business Investment News
By Johnny Zhu on 13 Feb 2026

天下武功,唯快不破。在 AI 的世界裡,這句話正成為新的真理。正當全世界都在搶購 NVIDIA 的 H100 晶片時,OpenAI 卻悄悄聯手另一家硬件獨角獸,發動了一場針對「速度」的突襲。

今日,OpenAI 宣佈推出全新模型 GPT-5.3-Codex-Spark,專為高頻率的編程 (Coding) 及實時應用而設。其最大賣點是驚人的推論速度——高達 每秒 1000 Tokens!這意味著,它生成一篇 1000 字的深度文章,只需 1 秒鐘,速度比人類閱讀還要快上數倍。

幕後功臣:Cerebras 與它的「巨型晶片」

這次突破的關鍵,並非來自我們熟悉的 NVIDIA GPU,而是來自 AI 晶片初創公司 Cerebras Systems。為什麼 Cerebras 能做到 NVIDIA 做不到的事?關鍵在於架構。

• 晶圓級引擎 (Wafer Scale Engine):Cerebras 的 WSE-3 晶片大如一部 iPad,是世界上最大的晶片。它將 4 萬億個電晶體和 44GB 的 SRAM 記憶體集成在單一晶圓上。

• 零延遲傳輸:傳統 GPU 需要將數據在記憶體 (HBM) 和計算單元之間來回搬運,這造成了延遲。而 Cerebras 將記憶體直接放在計算單元旁邊,消除了數據傳輸的瓶頸,從而實現了極致的 即時推論 (Real-time Inference)。

從 Chatbot 到 Real-time Agent

這種速度的提升,不僅僅是為了「快」,而是為了解鎖全新的應用場景。

當 AI 的回應速度快到人類感覺不到延遲時,它就不再是一個「問答機器」,而是一個可以隨時打斷、隨時插入的 「實時對話夥伴」。想像一下,未來的語音助手不再需要 "Thinking..." 的停頓,未來的遊戲 NPC 可以即時生成對白。這才是 Agentic AI 的真正形態。

NVIDIA 的護城河會崩塌嗎?

這對投資者意味著什麼?NVIDIA 目前壟斷了 90% 的 AI 訓練 (Training) 市場,這點短期內難以撼動。但在 推論 (Inference) 市場,戰局才剛剛開始。

隨著 AI 應用普及,企業對「低延遲、低成本」推論晶片的需求將爆炸性增長。Cerebras 宣稱其推論成本比 GPU 低 10 倍,這對於需要大規模部署 AI 的企業(如 OpenAI, Anthropic)來說,是無法抗拒的誘因。

硬件戰國時代

這場發布會預示著 AI 硬件市場將進入百花齊放的戰國時代。除了 NVIDIA,投資者應密切留意 ASIC (專用晶片) 開發商的崛起,以及各大雲端巨頭(Google TPU, AWS Trainium)的自研晶片進展。這場仗,才剛開始打。

Text by BusinessFocus Editorial

免責聲明:本網頁一切言論並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦,讀者務請運用個人獨立思考能力自行作出投資決定,如因相關言論招致損失,概與本公司無涉。投資涉及風險,證券價格可升可跌。

【了解更多最快最新的財經、商業及創科資訊】

👉🏻 追蹤 WhatsApp 頻道 BusinessFocus

👉🏻 下載 BusinessFocus APP

👉🏻 立即Follow Instagram businessfocus.io

最新 金融投資熱話專頁 MarketFocus