美團LongCat發布新一代高效推理模型LongCat-Flash-Thinking

AI 科技 2025-09-23 10:32:27
美團LongCat團隊發布LongCat-Flash-Thinking,在ARC-AGI、LiveCodeBench等基準測試中均獲開源第一,並已在HuggingFace與GitHub全面開源。

觀點網訊:9月22日,美團旗下LongCat團隊正式發布新一代高效推理模型LongCat-Flash-Thinking,並同步在HuggingFace與GitHub開源。該模型在保持前代極速響應的同時,于邏輯、數學、代碼、智能體及形式化定理證明五大領域全面刷新開源模型SOTA紀錄。

技術層面,團隊采用“領域並行強化學習”将STEM、代碼與智能體任務解耦訓練,配合異步彈性共卡系統DORA實現萬卡級集群穩定運行,訓練效率較同步框架提升3倍。

實測顯示,在AIME25數據集上,模型以90%準确率的智能體工具調用方案将Token消耗從1.97萬降至6965,節省64.5%。此外,其MiniF2F-test pass@1得分67.6,大幅領先現有開源模型。

免責聲明:本文内容與數據由觀點根據公開信息整理,不構成投資建議,使用前請核實。

審校:
返回