千問推出最新大模型 平頭哥單飛 阿里AI超級入口怎么做
大廠AI之戰,千問激烈度陡然升級。推出頭哥
馬化騰在騰訊年會上罕見地公開反思,最新直言“AI速度慢了”,大模單飛還點評了“千問全面接入阿里生態”,型平稱騰訊會一體化考慮大模型和AI產品,阿里試圖以“元寶派”打開新空間;百度智能云將“2026年AI相關收入增速”上調到200%,超級全力沖刺AI云市場第一;字節跳動更是入口激進,豆包手機試圖直接搶占硬件終端,千問二代豆包AI手機正在緊鑼密鼓準備中。推出頭哥
就在所有人都以為戰局會在春節后進入高潮時,最新1月26日深夜,大模單飛甚至沒有一場發布會,型平阿里放出了最強模型。阿里
千問旗艦推理模型Qwen3-Max-Thinking正式發布。超級
根據披露的數據,Qwen3-Max-Thinking是目前阿里規模最大、能力最強的推理模型,其性能指標媲美GPT-5.2和Gemini 3 Pro,在19個公認的大模型基準測試中,刷新了數項最佳表現(SOTA)紀錄。千問PC和網頁端隨即絲滑接入,支持深度邏輯推演與自我校驗。
還有一則有意思的動態。
1月26日,國星宇航披露成功把千問3(Qwen3)大模型部署到了“星算”計劃01組太空計算中心,這是全球首次將通用大模型從地面上注至在軌運行的衛星,并執行端到端推理任務。網友調侃,千問這回真“上天”了。
開年以來,在關乎未來輸贏的“超級入口”之爭上,阿里全面進擊,從千問接入阿里生態,到阿里旗下芯片子公司平頭哥計劃單獨上市,再到Qwen模型發布最強版本,芯片層、模型層、應用層動作接連不斷。
AI進入下半場,各家策略各異。“誰都知道以后AI重要,不管起步早晚,大廠都在做AI生態了,但現在方向都沒定,阿里做生態、騰訊做社交、百度押注云、字節做硬件,還不到分野的時候。”一位AI產業資深觀察人士表示。
千問推理再進化
Qwen3-Max-Thinking模型被官方稱為“迄今為止最接近國際頂尖模型的國內最強AI大模型”。它的目標非常明確,在推理技術上進行系列創新,最終完成模型性能的大幅飛躍。
根據阿里發布的詳細資料,該模型總參數超過萬億,在涵蓋事實知識、復雜推理、指令遵循、人類偏好對齊、Agent能力等19項權威基準測試中刷新了全球紀錄。
在關鍵的模型推理能力提升中,千問新模型采用了一種全新的測試時擴展(Test-time Scaling)機制,推理性能提升的同時更經濟。
業界推理時計算,通常是簡單增加并行推理路徑,重復推導已知結論,造成冗余推理效率低下。千問采用的測試時擴展新機制,可以對此前推理的結果進行“經驗提取”式的提煉,并據此進行多輪自我迭代,在相同的上下文中實現更高效的推理計算,獲得更智能的推理結果。
簡單理解,就是類似于讓AI在解題時不再“一張草稿紙算到底”,而是能像人類一樣,對前面的思考步驟進行回顧、提煉“經驗”,并在后續步驟中更聰明地調用這些經驗,從而實現更高效、更準確的復雜推理。
基于這一推理技術創新,千問推理性能和推理效率有明顯提升,比如在被稱為“人類最后的測試”HLE測試中,千問得分58.3,超過GPT-5.2-Thinking的45.5、Gemini 3 Pro的45.8,錄得當前所有模型的最高分。
面向即將到來的智能體Agent時代,Qwen3-Max-Thinking還大幅增強了自主調用工具的原生Agent能力。具體而言,在完成初步的工具使用微調后,通義團隊對模型進一步在大量多樣化任務上進行了基于規則獎勵與模型獎勵的聯合強化學習訓練,使得Qwen3-Max-Thinking擁有更智能結合工具進行思考的能力。
這種自適應的工具調用能力可以在QwenChat上完整體驗,模型自主選用搜索、個性化記憶和代碼解釋器等三個核心的Agent工具功能,提供專業人士一樣水平的回答。同時,模型幻覺也大為降低,為解決真實復雜任務打下基礎。
為什么業界如此看重推理和智能體能力?因為這直接關系到AI能否從“聊天玩具”進化為真正的“生產力工具”乃至“個人助理”。一個能進行深度推理、自主調用工具的AI才有能力處理復雜任務,比如規劃旅行、編寫專業報告、分析數據等。
或許阿里的這個“旗艦推理模型”,目的就是走出“僅對話”階段,開始為物理AI的“超級入口”做準備。
平頭哥獨立,千問融入生態
同期,阿里還在做兩個看似相反的動作,讓芯片獨立出去,把千問無縫整合到阿里生態。
平頭哥的單飛,是觀察中國互聯網巨頭AI戰略縱深的一個切片。作為源自阿里達摩院的芯片公司,平頭哥最早是為阿里云及內部生態提供自主算力的,其推出的含光、倚天等系列AI芯片,已經成了阿里云算力基礎的一部分。
市場解讀阿里推動平頭哥獨立運營并尋求上市,是希望把芯片從成本中心轉化為收入中心。
其實不只阿里,百度也在推動昆侖芯獨立上市,這也是一種行業必然。
大模型參數規模進入萬億時代,訓練與推理的成本指數級上升,算力成了AI時代的“水電煤”。對于互聯網大廠內部來說,自研芯片不僅能優化性能、降低對英偉達等國際巨頭的依賴,還能在架構層面與自家的AI框架、模型進行深度協同,形成從底層硬件到上層應用的垂直優化閉環。
而讓芯片公司獨立出來,則是出于營收的考量。既能通過外部壓力倒逼技術迭代,也能通過資本市場為長期的芯片研發“輸血”。一方面支撐自家云業務,另一方面向外輸出、形成行業標準的基礎設施,順便把外部的資金賺回來,支撐研發。
在算力層、模型層都有積淀之后,阿里最終的目的開始變得清晰,把千問融入龐大的商業生態里,搶奪AI的“超級入口”。
近段時間以來,阿里進行了一系列緊湊的生態調整。2025年12月,集團整合資源,成立了千問C端事業群,直接面向消費者打造AI產品體驗。2026年1月15日,千問APP推出重大版本更新,正式宣布從“聊天工具”升級邁入“辦事時代”,深度接入淘寶、支付寶、淘寶閃購、高德、飛豬等阿里生態核心業務,實現了點外賣、購物、訂機票酒店等AI全流程辦事服務,一次性上線超400項AI辦事功能,串起了需求表達、任務執行到支付履約的閉環。
比如,用戶對千問說“周末我想去郊外露營,預算人均500元”。千問在理解這個模糊意圖后,其背后的“智能體”能力可以同時調動多個插件,通過高德查詢合適的露營地與實時路況,通過飛豬或本地生活板塊預訂營地,通過淘寶推薦并比價帳篷、睡袋等裝備,再通過支付寶整合優惠套餐并完成支付。用戶不需要在多個APP之間頻繁操作,通過自然對話可以完成從想法到消費的全流程。
未來千問還將繼續接入優酷、大麥、菜鳥驛站、阿里健康、1688、盒馬等其他阿里旗下核心業務條線,進一步提升生態協同和場景覆蓋度。
也就是說,以千問作為入口,能夠無縫串聯起“電商交易”“本地生活”“文娛內容”“支付金融”等場景,千問本身可以成為覆蓋用戶生活的“AI管家”。
國海證券在研報中指出,千問的生態整合模式重新定義了“入口”價值邏輯,促使行業競爭從單一模型能力,轉向“模型+生態+場景”全維度比較。
大廠路徑各異
同期,其他互聯網巨頭也在加碼進攻。
騰訊,正如馬化騰所言,在通用大模型的激進發布上顯得謹慎。但其優勢在于社交產品矩陣和深厚的產業互聯網基礎。騰訊的AI戰略更傾向于“滲透”與“結合”,把AI能力深度融入微信、QQ、企業微信等國民級應用以及游戲、金融科技等優勢業務中。騰訊更喜歡用不打擾用戶的方式,做“潤物細無聲”的生態融合。
百度開年第一個發聲是“AI云”,文心大模型是底層模型能力,商業化在于提供AI解決方案,并且業務增速和招投標數據表現很不錯。百度的“入口”思維更偏向于B端,成為企業和機構智能化轉型的首選合作伙伴。
字節跳動以敏捷和務實著稱。豆包在字節內部應用非常廣泛,包括抖音的內容推薦、創作工具,飛書的辦公協同等等。推出“豆包AI手機”、研發“豆包AI耳機”,顯示字節開始觸碰硬件層。字節潛在的AI超級入口可能是抖音,可能是豆包,也可能是尚未完全成型的新硬件。
相比之下,阿里從平頭哥的底層芯片,到千問的模型層,再到千問APP上層應用、夸克AI眼鏡硬件,試圖搭建起一個完整閉環。這種模式的優點是自主可控、協同潛力大,但是戰線長,每一環都需要巨大的投入,對公司的資源整合與戰略定力要求非常高。
尤其在千問宣布全面接入阿里生態之后,外界也有質疑聲音,不少用戶表示:“我不想被限定在阿里的圈子里,就想有更多選擇權。”這對于阿里能否把千問做成“超級入口”是有挑戰的,用戶意愿和用戶習慣往往最難左右。
(21世紀經濟報道記者陶力對本文亦有貢獻)
(作者:孔海麗 編輯:朱益民)