IBM 發佈 Granite 4.0:企業就绪 輕量 高效 低成本

IBM 發佈 Granite 4.0:企業就绪 輕量 高效 低成本

Market Information PR Newswire
By PR Newswire on 10 Oct 2025
PR Newswire (www.prnasia.com), a Cision company, is the premier global provider of media monitoring platforms and news distribution services that marketers, corporate communicators and investor relations professionals leverage to engage key audiences. Having pioneered the commercial news distribution industry since 1954, PR Newswire today provides end-to-end solutions to produce, distribute, target and measure text and multimedia content across traditional, digital, mobile and social channels. Combining the world's largest multi-channel content distribution and optimization network with comprehensive workflow tools and platforms, PR Newswire powers the stories of organizations around the world. PR Newswire serves tens of thousands of clients from offices in the Americas, Europe, Middle East, Africa and Asia-Pacific regions.
  • 全球首個獲得 ISO/IEC 42001:2023 AI 管理系統認證的開源模型
  • 專為處理代理型關鍵任務而生 可單獨部署或作為大型複雜推理系統的關鍵模組

香港2025年10月10日 /美通社/ -- IBM 日前發佈其最新一代企業級語言模型 Granite 4.0,以創新的混合式架構,結合 Mamba-2 與 Transformer 技術,實現前所未有的效能與效率。Granite 4.0 不僅大幅降低內存與硬體成本,更提供企業部署 AI 的安全性、可控性與彈性,為香港各類型企業的 AI 應用落地提供強力支援。

IBM 發佈 Granite 4.0:企業就绪 輕量 高效 低成本
IBM 發佈 Granite 4.0:企業就绪 輕量 高效 低成本

Granite 4.0已在 IBM watsonx.ai 平台正式上線,並同步支援 Dell Technologies (Dell Pro AI Studio 與 Enterprise Hub)、Docker Hub、Hugging Face、Kaggle、LM Studio、NVIDIA NIM、Ollama、OPAQUE 及Replicate 等平台;未來也將支援 Amazon SageMaker JumpStart 與 Microsoft Azure AI Foundry。

混合式架構,創造效能與成本的完美平衡

Granite 4.0 採用創新的 Mamba/Transformer 混合架構,突破傳統 Transformer 模型處理長文本的效能瓶頸。Mamba 架構可線性擴展上下文長度,讓 Granite 4.0 在處理複雜任務時,大幅降低內存的使用量達 70%,推理速度卻加快 2 倍,同時支援更平價的 GPU包括家用硬體。這項突破對香港中小企業與開發者意味著高效能 AI 不再是高成本的同義詞,而是人人可及的技術資源。

多元模型版本,滿足各種企業需求

Granite 4.0 提供多種模型規格,靈活應對不同場景:

  • Granite-4.0-H-Small:總參數量32B的混合式專家模型,活躍參數9B,適合客服自動化、多工具代理任務;
  • Granite-4.0-H-Tiny:總參數量7B的混合式專家模型,活躍參數1B,適合邊緣運算與地端部署;
  • Granite-4.0-H-Micro:總參數量3B 的混合式模型,快速執行關鍵任務;
  • Granite-4.0-Micro:傳統 Transformer 架構,適用於尚未支援混合架構的平台。

Granite 4.0 所有模型皆提供 Base 與 Instruct 版本;並預計於2025年底推出強化邏輯推理的Thinking 模型。

小模型,大效能

Granite 4.0模型雖然尺寸精簡,但在多項基準測試中的表現,超越同級與其他大型開源模型:

  • 在 Stanford IFEval 指令遵循測試中,Granite-4.0-H-Small 表現優於所有開源模型(除 Llama 4 Maverick 外);
  • 在 Berkeley Function Calling Leaderboard v3 中,Granite-4.0-H-Small 以更低成本達到與大型模型相同的工具調用準確率;
  • 在 MTRAG 多輪檢索增強生成測試中亦有亮眼表現。

上述成果歸功於 IBM 全面升級了模型架構、訓練方法與數據品質,包含使用一個精心編製、聚焦於企業應用的 22 兆字元規模的語料庫。Granite 4.0 的預訓練數據涵蓋多元來源,包括 DataComp-LM (DCLM)、GneissWeb、TxT360 子集、Wikipedia 以及其他與企業場景高度相關的數據來源。為了增強模型處理企業任務的表現,這些模型經過後訓練(post-training),涵蓋語言理解、程式碼生成、數學推理、多語言處理、安全性、工具調用 (tool calling)、檢索增強生成(RAG)與資安等多個領域,並結合合成數據與開放數據集進行優化。

安全、可信、可控,是企業部署的首選

Granite 4.0 是全球第一個獲得 ISO/IEC 42001:2023 AI 管理系統認證的開源模型家族,展現 IBM 對 AI 安全與負責任治理的高度承諾:

  • 所有模型皆經過加密簽章,確保來源與完整性;
  • 訓練數據皆經過倫理審查與企業授權;
  • 若在 watsonx.ai 平台使用 Granite 模型,IBM 提供無上限第三方 IP 賠償保障。

此外,IBM 與 HackerOne 共同宣布「找尋Granite漏洞」獎勵計畫,最高獎金達美金十萬元,鼓勵開發社群共同提升 AI 安全。

企業部署AI更簡單、更靈活

Granite 4.0 支援多種硬體與推理框架,讓香港企業與開發者可快速整合至現有系統:

  • 支援 AMD Instinct™ MI-300X GPU 與 Qualcomm Hexagon™ NPU,適用於行動與邊緣設備;
  • 相容於 vLLM、llama.cpp、MLX、NexaML 等主流推理框架;
  • 可透過 Unsloth 進行微調,並整合至 Continue 等開發者工具。

開發者可在 Granite Playground試用 Granite 4.0,並參考 Granite Docs 中的 RAG、摘要、自動化教學資源。

IBM 將繼續擴展 Granite 4.0 模型家族,將推出:

  • 更小型的 Medium 與 Nano 模型,強化邊緣AI部署能力;
  • 強化邏輯推理的 Thinking 模型,支援複雜決策與分析任務;
  • 持續優化架構與平台支援,推動 AI 普及化與在地化。

IBM推出Granite 4.0,持續倡議與實現開放、安全、高效的企業級AI,協助全球企業在數位轉型旅程中穩健前行。Granite 4.0 模型已在 IBM watsonx.ai 平台開放使用,並採用 Apache 2.0 開源授權。更多資訊請參閱IBM Granite 4.0網頁。

關於IBM

IBM 是全球領先的混合雲、人工智能及企業服務提供商,幫助超過 175 個國家和地區的客戶,從其擁有的數據中獲取商業洞察,簡化業務流程,降低成本,並獲得行業競爭優勢。金融服務、電信和醫療健康等關鍵基礎設施領域的數千家政府和企業實體依靠 IBM 混合雲平台和紅帽 OpenShift 快速、高效、安全地實現數字化轉型。IBM 在人工智能、量子計算、行業雲解決方案和企業服務方面的突破性創新為我們的客戶提供了開放和靈活的選擇。對企業誠信、透明治理、社會責任、包容文化和服務精神的長期承諾是 IBM 業務發展的基石。瞭解更多信息,請訪問: www.ibm.com/

查詢更多本地資訊,請訪問IBM香港新聞間:https://hongkong.newsroom.ibm.com/  

傳媒查詢:

郭韜 gguotao@cn.ibm.com

【了解更多最快最新的財經、商業及創科資訊】

👉🏻 追蹤 WhatsApp 頻道 BusinessFocus

👉🏻 下載 BusinessFocus APP

👉🏻 立即Follow Instagram businessfocus.io

最新 金融投資熱話專頁 MarketFocus