download BusinessFocus app
阿里千問AI大升級 股價升8% 新模型較DeepSeek瘦身95% 效能卻相若 更勝ChatGPT?

阿里千問AI大升級 股價升8% 新模型較DeepSeek瘦身95% 效能卻相若 更勝ChatGPT?

Business Investment News
By thomas.chan on 06 Mar 2025
Digital Editor
熱愛新聞工作,充滿好奇心。從投資分析、慳家攻略到AI應用都有濃厚興趣。期望藉著多年以來的工作經驗,為BF這嶄新的財經新聞頻道上出一分力。

馬雲成功了!馬雲創立的阿里巴巴(9988)憑發展AI奇蹟大翻身,阿里千問(Qwen)團隊最新推出的「通義千問QwQ-32B」AI大模型效能大躍進,它只需要320億參數,較全球大熱的DeepSeek-R1的6,710億參數大幅「瘦身」95%,但兩個大模型在數學推理及通用能力竟然相若。記者實測亦發現,新的阿里千問QwQ模型除了能夠AI生成高質及像真的圖片之外,更能夠正確回答一條有陷阱的數學推理題,反觀免費ChatGPT則答錯了,證明千問推理能力之強。

QwQ千問新模型的強大效能,觸發阿里股價今日一度大漲8%至140.5元的高位,今年累計升幅已達7成。港股包括AI科技股亦因而受帶動,牛氣沖天,恒指今日最多曾升在700點,高見24,301點。近期多間大行普遍把阿里的目標價提高至每股180港元或以上,一年內上望200港元。

分析相信,阿里未來股價其中兩個關鍵,包括通義千問AI大模型能否走出世界,與DeepSeek甚至ChatGPT競爭;此外,阿里曾透露將為蘋果於內地銷售的iPhone提供人工智能服務,此合作最終能否成事,阿里AI質素能否令iPhone用家滿意及帶來巨大收入,亦必成為影響阿里股價的重大因素。

摩根大通分析師即提醒,投資者雖看好阿里AI前景,但仍關注其技術優勢能否轉化為實際收益。而阿里早前最新業績說明中,管理層已透露未來3年在雲計算和AI上的資本開支,將超過過去10年總和,展現全力發展AI的決心。

阿里巴巴Qwen團隊於昨日發表文章,宣布最新研究成果即 QwQ-32B 大語言模型,在僅有 DeepSeek-R1 約二十分之一參數量的情況下,成功運用強化學習 (RL) 達成性能上的補足,令兩個大模型效能幾乎不分上下。Qwen 團隊指採用了冷啟動 (cold-start checkpoint) 方式並實施結果導向 (outcome-based rewards) 強化學習策略,這種策略的核心在於不依賴傳統的獎勵模型,而是直接根據任務結果如答案是否正確、代碼是否運行成功來指導模型的學習,更加高效和直接。

數據顯示,在 AIME24 和 IFEval 等關鍵基準測試中,QwQ-32B 表現甚至略微超過參數量巨大的DeepSeek-R1大模型,且在其他基準測試中,表現也基本與 DeepSeek-R1不相上下,並遠超其他對比的大模型。

阿里千問Qwen QwQ-32B的AI大模型,現時已可供全球用家免費下載及安裝(網址:https://huggingface.co/Qwen/QwQ-32B-Preview ),不過由於檔案大小超過65GB,也需要大量的Ram,故有關AI模型並非入門級電腦所能運行。故讀者另一個可行方案,是瀏覽「阿里Qwen千問體驗版」網站(網址:https://chat.qwen.ai/),選用Qwen2.5-Max的同時,選擇「深度思考(QwQ)」的功能,如此即可體驗到最新AI模型的部分強大運算能力。

BusinessFocus記者上午實測時,發現只能向Qwen千問體驗版作文字查詢,但下午卻發現疑已開放了製圖功能。記者能以文字指令,要求千問AI繪圖卡通化又或是極像真實人或物的圖片。初步看來,部分千問AI創作的相片(例如描繪公園內的少女與小狗),質素甚至優於ChatGPT生成的圖片。

記者再就以一條「有陷阱」的數學推理題,測試同屬免費的「Qwen千問體驗版(深度思考QwQ)」及免費版ChatGPT時,更發現ChatGPT竟然答錯了,反而Qwen千問AI能夠作出詳細兼正確的解答,可見其數學推理能力之強。

該條測試的問題為:「一間超級市場提供「換領優惠」,該超市賣出的限量版罐裝可樂,每罐賣港幣5元。但只要消費者提供兩個已喝完的及空的可樂罐,即可換取一罐新的可樂。假設你現時有75元去買可樂,連同「換領優惠」在內,你可以飲到多少罐的限量版可樂?」

免費ChatGPT回答時,認為消費者用75元買15罐可樂並喝完後,15個空罐可換7罐新可樂;再喝完7罐後,可再換3罐新可樂;喝完3罐後,又可換1罐新可樂。故認為透過花費75元,總共可以喝26罐可樂(15+7+3+1)。

但這個免費ChatGPT提供的答案其實是錯悟的!因為消費者實際上最初只需以14個空罐換7罐新可樂,多出的一個空罐,在之後可發揮作用,可結合其他空罐,合力換取可樂。故這題推題的正確答案,應該是29罐可樂(15+7+4+2+1)才對。

相比之下,同樣免費「Qwen千問體驗版(深度思考QwQ)」則能識破記者提出數學推理問題的陷阱,正確回答「29罐」,以詳細解釋何以會得出答案。記者其後再向收費版的ChatGPT詢問同一條問題,結果一樣獲得正確的答案(29罐),從此可見,免費ChatGPT的「智商」相對較低。

不過值得留意的是,因應內地監管制度,「Qwen千問體驗版(深度思考QwQ)」與其他中國AI大模型一樣,會拒絕回應涉及中國領導人或某些爭議事件的敏感話題。故在這方面,ChatGPT的表現遠勝中國式AI。

Text by BusinessFocus Editorial

免責聲明:本網頁一切言論並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦,讀者務請運用個人獨立思考能力自行作出投資決定,如因相關言論招致損失,概與本公司無涉。投資涉及風險,證券價格可升可跌。

【了解更多最快最新的財經、商業及創科資訊】

👉🏻 追蹤 WhatsApp 頻道 BusinessFocus

👉🏻 下載 BusinessFocus APP

👉🏻 立即Follow Instagram businessfocus.io

最新 金融投資熱話專頁 MarketFocus