阿里千問AI大升級股價升8% 新模型較DeepSeek瘦身95% 效能卻相若更勝ChatGPT?

By thomas.chan on 06 Mar 2025

Digital Editor

熱愛新聞工作，充滿好奇心。從投資分析、慳家攻略到AI應用都有濃厚興趣。期望藉著多年以來的工作經驗，為BF這嶄新的財經新聞頻道上出一分力。

馬雲成功了！馬雲創立的阿里巴巴（9988）憑發展AI奇蹟大翻身，阿里千問（Qwen）團隊最新推出的「通義千問QwQ-32B」AI大模型效能大躍進，它只需要320億參數，較全球大熱的DeepSeek-R1的6,710億參數大幅「瘦身」95%，但兩個大模型在數學推理及通用能力竟然相若。記者實測亦發現，新的阿里千問QwQ模型除了能夠AI生成高質及像真的圖片之外，更能夠正確回答一條有陷阱的數學推理題，反觀免費ChatGPT則答錯了，證明千問推理能力之強。

QwQ千問新模型的強大效能，觸發阿里股價今日一度大漲8%至140.5元的高位，今年累計升幅已達7成。港股包括AI科技股亦因而受帶動，牛氣沖天，恒指今日最多曾升在700點，高見24,301點。近期多間大行普遍把阿里的目標價提高至每股180港元或以上，一年內上望200港元。

分析相信，阿里未來股價其中兩個關鍵，包括通義千問AI大模型能否走出世界，與DeepSeek甚至ChatGPT競爭；此外，阿里曾透露將為蘋果於內地銷售的iPhone提供人工智能服務，此合作最終能否成事，阿里AI質素能否令iPhone用家滿意及帶來巨大收入，亦必成為影響阿里股價的重大因素。

摩根大通分析師即提醒，投資者雖看好阿里AI前景，但仍關注其技術優勢能否轉化為實際收益。而阿里早前最新業績說明中，管理層已透露未來3年在雲計算和AI上的資本開支，將超過過去10年總和，展現全力發展AI的決心。

阿里巴巴Qwen團隊於昨日發表文章，宣布最新研究成果即 QwQ-32B 大語言模型，在僅有 DeepSeek-R1 約二十分之一參數量的情況下，成功運用強化學習 (RL) 達成性能上的補足，令兩個大模型效能幾乎不分上下。Qwen 團隊指採用了冷啟動 (cold-start checkpoint) 方式並實施結果導向 (outcome-based rewards) 強化學習策略，這種策略的核心在於不依賴傳統的獎勵模型，而是直接根據任務結果如答案是否正確、代碼是否運行成功來指導模型的學習，更加高效和直接。

數據顯示，在 AIME24 和 IFEval 等關鍵基準測試中，QwQ-32B 表現甚至略微超過參數量巨大的DeepSeek-R1大模型，且在其他基準測試中，表現也基本與 DeepSeek-R1不相上下，並遠超其他對比的大模型。

阿里千問Qwen QwQ-32B的AI大模型，現時已可供全球用家免費下載及安裝（網址：https://huggingface.co/Qwen/QwQ-32B-Preview ），不過由於檔案大小超過65GB，也需要大量的Ram，故有關AI模型並非入門級電腦所能運行。故讀者另一個可行方案，是瀏覽「阿里Qwen千問體驗版」網站（網址：https://chat.qwen.ai/），選用Qwen2.5-Max的同時，選擇「深度思考（QwQ）」的功能，如此即可體驗到最新AI模型的部分強大運算能力。

BusinessFocus記者上午實測時，發現只能向Qwen千問體驗版作文字查詢，但下午卻發現疑已開放了製圖功能。記者能以文字指令，要求千問AI繪圖卡通化又或是極像真實人或物的圖片。初步看來，部分千問AI創作的相片（例如描繪公園內的少女與小狗），質素甚至優於ChatGPT生成的圖片。

記者再就以一條「有陷阱」的數學推理題，測試同屬免費的「Qwen千問體驗版（深度思考QwQ）」及免費版ChatGPT時，更發現ChatGPT竟然答錯了，反而Qwen千問AI能夠作出詳細兼正確的解答，可見其數學推理能力之強。

該條測試的問題為：「一間超級市場提供「換領優惠」，該超市賣出的限量版罐裝可樂，每罐賣港幣5元。但只要消費者提供兩個已喝完的及空的可樂罐，即可換取一罐新的可樂。假設你現時有75元去買可樂，連同「換領優惠」在內，你可以飲到多少罐的限量版可樂？」

免費ChatGPT回答時，認為消費者用75元買15罐可樂並喝完後，15個空罐可換7罐新可樂；再喝完7罐後，可再換3罐新可樂；喝完3罐後，又可換1罐新可樂。故認為透過花費75元，總共可以喝26罐可樂（15+7+3+1）。

但這個免費ChatGPT提供的答案其實是錯悟的！因為消費者實際上最初只需以14個空罐換7罐新可樂，多出的一個空罐，在之後可發揮作用，可結合其他空罐，合力換取可樂。故這題推題的正確答案，應該是29罐可樂（15＋7+4+2+1）才對。

相比之下，同樣免費「Qwen千問體驗版（深度思考QwQ）」則能識破記者提出數學推理問題的陷阱，正確回答「29罐」，以詳細解釋何以會得出答案。記者其後再向收費版的ChatGPT詢問同一條問題，結果一樣獲得正確的答案（29罐），從此可見，免費ChatGPT的「智商」相對較低。

不過值得留意的是，因應內地監管制度，「Qwen千問體驗版（深度思考QwQ）」與其他中國AI大模型一樣，會拒絕回應涉及中國領導人或某些爭議事件的敏感話題。故在這方面，ChatGPT的表現遠勝中國式AI。

Text by BusinessFocus Editorial

免責聲明：本網頁一切言論並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦，讀者務請運用個人獨立思考能力自行作出投資決定，如因相關言論招致損失，概與本公司無涉。投資涉及風險，證券價格可升可跌。

【了解更多最快最新的財經、商業及創科資訊】

👉🏻 追蹤 WhatsApp 頻道 BusinessFocus

👉🏻 下載 BusinessFocus APP

👉🏻 立即Follow Instagram businessfocus.io

最新金融投資熱話專頁 MarketFocus

阿里千問AI大升級 股價升8% 新模型較DeepSeek瘦身95% 效能卻相若 更勝ChatGPT?

阿里千問AI大升級股價升8% 新模型較DeepSeek瘦身95% 效能卻相若更勝ChatGPT?