美團(tuán)于9月1日正式發(fā)布并開(kāi)源其最新大語(yǔ)言模型 LongCat-Flash-Chat,該模型總參數(shù)量達(dá)到560B,采用混合專(zhuān)家模型(Mixture-of-Experts, MoE)架構(gòu),在提升性能的同時(shí)顯著優(yōu)化了計(jì)算效率,尤其在智能體任務(wù)方面表現(xiàn)突出,引發(fā)行業(yè)廣泛關(guān)注。
LongCat-Flash 的核心創(chuàng)新在于其 MoE 架構(gòu)中引入“零計(jì)算專(zhuān)家”機(jī)制。該機(jī)制通過(guò)上下文動(dòng)態(tài)激活參數(shù),每個(gè) token 僅調(diào)用 18.6B 至 31.3B 參數(shù),平均激活參數(shù)量控制在 27B,既降低了計(jì)算成本,也提高了響應(yīng)速度。訓(xùn)練過(guò)程中還采用 PID 控制器實(shí)時(shí)調(diào)整專(zhuān)家偏置,進(jìn)一步提升了資源利用效率。
在系統(tǒng)架構(gòu)層面,LongCat-Flash 通過(guò)跨層通道設(shè)計(jì)實(shí)現(xiàn)了通信與計(jì)算的高度并行,大幅提升訓(xùn)練和推理效率。據(jù)官方披露,該模型在 30 天內(nèi)完成訓(xùn)練,并在 H800 硬件上實(shí)現(xiàn)每秒生成超過(guò) 100 個(gè) token,推理成本低至每百萬(wàn) token 5 元,在效率與成本之間取得了良好平衡。
在多項(xiàng)權(quán)威基準(zhǔn)測(cè)試中,LongCat-Flash 展現(xiàn)出強(qiáng)勁性能。在通用知識(shí)評(píng)測(cè)方面,其于 ArenaHard-V2 中獲得 86.50 分,位列第二;在 MMLU 和 CEval 分別取得 89.71 和 90.44 的成績(jī),媲美當(dāng)前國(guó)內(nèi)主流大模型,而參數(shù)量卻少于 DeepSeek-V3.1 和 Kimi-K2 等競(jìng)品。
值得關(guān)注的是,LongCat-Flash 在智能體相關(guān)任務(wù)中表現(xiàn)卓越。在 τ2-Bench 和 VitaBench 這類(lèi)高復(fù)雜度智能體評(píng)測(cè)中,其成績(jī)均領(lǐng)先于更大規(guī)模的模型,尤其在 VitaBench 中以 24.30 的得分位列第一,顯示出出色的工具調(diào)用與復(fù)雜場(chǎng)景處理能力。
此外,在編程能力方面,該模型在 TerminalBench 和 SWE-Bench-Verified 分別獲得 39.51 和 60.4 的分?jǐn)?shù),顯示出較強(qiáng)的代碼理解和終端任務(wù)處理能力。在指令遵循任務(wù)中,LongCat-Flash 同樣表現(xiàn)優(yōu)異,于 IFEval 中獲得 89.65 的最高分,并在中英文多類(lèi)指令集測(cè)試中均取得最佳成績(jī)。
美團(tuán)方面表示,為提升智能體能力,團(tuán)隊(duì)自建了 Agentic 評(píng)測(cè)集,并采用多智能體方法生成高質(zhì)量軌跡數(shù)據(jù),從數(shù)據(jù)策略到訓(xùn)練流程均進(jìn)行了全面優(yōu)化。
目前,LongCat-Flash-Chat 已在 Hugging Face 和 GitHub 平臺(tái)開(kāi)源,相關(guān)模型權(quán)重、代碼及技術(shù)文檔均已公開(kāi),可供研究者和開(kāi)發(fā)者下載使用。這一舉措有望推動(dòng)大模型技術(shù)在智能體應(yīng)用領(lǐng)域的進(jìn)一步創(chuàng)新與落地。
總體來(lái)看,LongCat-Flash 通過(guò)算法與工程的協(xié)同優(yōu)化,在有限激活參數(shù)下實(shí)現(xiàn)了與頂級(jí)模型媲美的性能,其高效率與低推理成本的特點(diǎn),尤其適合長(zhǎng)時(shí)間、高復(fù)雜度的智能體應(yīng)用場(chǎng)景。美團(tuán)的這一次發(fā)布,也為國(guó)內(nèi)大模型技術(shù)路徑的多樣化提供了新的思路。
(注:本文在資料搜集、框架搭建及部分段落初稿撰寫(xiě)階段使用了 AI 工具,最終內(nèi)容經(jīng)人類(lèi)編輯核實(shí)事實(shí)、調(diào)整邏輯、優(yōu)化表達(dá)后完成。)
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )