2025/09/07 03:50:13 1,675次浏览

智东西 作者 陈骏达 编辑 云鹏

智东西9月1日报道,昨日,美团发布了其首款开源大模型LongCat-Flash,这是一款拥有5600亿个总参数的MoE(混合专家)模型。

推理速度是这一模型最大的特点之一。美团称,这一模型具备快捷连接架构,扩展了计算-通信重叠窗口,实现了 每秒超过100个token的推理速度 ,理论每token输出时间 相比DeepSeek-V3降低近50% 。

智东西的实测也印证了这点:我们要求其输出大约100个token的内容,除去首token延时后,输出速度确实在100 tokens/秒左右。

LongCat-Flash目前 暂时不支持文件、图像等多模态内容的上传 。网页端内,提供了联网搜索功能,但 深度思考功能显示为“敬请期待” 的状态。

在今年5月的财报电话中,美团创始人兼CEO王兴已经透露了LongCat模型的更多信息,他称,“增强后的模型(指LongCat)现在可以 在推理和非推理模式之间无缝切换 ”,性能接近GPT-4o。王兴还在电话会议中定调称,美团在AI领域的战略是 主动进攻 ,而不是被动防守,其AI战略包含工作中的AI、产品中的AI和自研大语言模型。

另据公众号01 Founder爆料,经过01 Founder与多方信源的交叉确认,LongCat-Flash的训练并非在英伟达GPU上完成,在其官方技术报告中,美团使用了“ 数万个加速卡 ”的模糊表述,由于一些原因,该硬件厂商的具体名字不方便透露。不过,美团对具体使用何种GPU尚无官方信息放出。

根据美团龙猫团队分享的技术报告,LongCat-Flash采用了创新的MoE架构,引入 零计算专家 ,减少了在低难度token上浪费的计算资源,从而提升推理效率。

与DeepSeek-V3.1、Kimi-K2、Qwen3 MoE-2507等头部开源模型相比,LongCat-Flash在通用领域、编程等场景的能力还有一定差距, 但在Agentic工具调用、指令遵循等场景中,LongCat-Flash达到了开源模型SOTA的水准。

这一模型已经上线Hugging Face、GitHub等开源平台,技术报告同步发布。同时,美团也提供了LongCat-Flash模型的网页版体验链接,智东西第一时间对其能力进行了体验。

Hugging Face地址:

huggingface.co/meituan-longcat

GitHub地址:

github.com/meituan-longcat/LongCat-Flash-Chat

技术报告链接:

github.com/meituan-longcat/LongCat-Flash-Chat/blob/main/tech_report.pdf

网页版:

longcat.ai/

一、锐评外卖大战阶段性战况,但算不清小学数学

智东西对LongCat-Flash的数学、编程、搜索、常识等能力进行了体验。LongCat-Flash介绍,自己的知识截止时间为2024年6月,在不开启联网的情况下,它对之后发生的事情并不了解。

当被问及腾讯元宝这一AI工具的开发者是谁时,LongCat-Flash已经无法给出正确答案,它称元宝是美团开发的。元宝的发布时间为2024年5月30号,刚好卡在其知识截止时间的边界。

紧接着,我们让LongCat-Flash完成联网搜索,整合信息并输出研报这一常见的工作流,使用的案例是最新的“外卖大战”,要求LongCat-Flash 搜索美团、阿里和京东三家企业的最新财报,并对“外卖大战”做一个阶段性评估。

LongCat-Flash仅搜索了10个网页,与其他大模型相比数量较少。同时,其信源构成较为单一,主要来自百家号,缺少对权威媒体、公司官网等信源的覆盖,在明确要求其查询公司官网后,也未能在引用链接中看到相关网页。

其引用的财报数据准确,分析部分基本符合业内对阿里、美团、京东三家外卖大战的主流观点。 LongCat-Flash的结论中更看好阿里,不过并未提出过多新见解。

在9.8-9.11这类大模型容易“翻车”的简单算数上,LongCat-Flash未能幸免。 它很快给出了答案,但结果明显错误。可以看到,模型没有自主验证结果的准确性,更像是“拍脑门”给出了答案。

在计算利息这类更为场景化的数学题中,LongCat-Flash能给出更为全面的分析和解题过程,并最终得出正确答案。

通用知识场景中,我们让LongCat-Flash在未开启联网搜索的情况下,解释了“为什么天空在白天是蓝色的,而在日落时会变红?”这一现象。

LongCat-Flash的解释分为三个部分,不仅提供了对白天、日落时天空颜色的解释,还补充了日出时颜色与前者的区别。其引用的理论准确,还能用表格清晰呈现,并主动提供了参考科普资料。

在编程场景,我们让LongCat-Flash打造一个以龙猫为主题的小游戏。模型能按照要求在单一HTML网页中实现游戏功能,但是游戏机制设计得不合理,导致可玩性一般。

二、采用新颖MoE架构,给专家合作搭建“捷径”

技术报告中,美团分享了LongCat-Flash在模型架构设计和多阶段训练流水线的更多细节。

LongCat-Flash采用了一种新颖的MoE架构,这是模型实现较高推理效率的核心。

这一架构的主要模块如下:

1、零计算专家(zero-computation experts)

在下一个token预测任务中,本身就存在计算负载的差异性,困难的token(例如推理复杂或语境模糊的部分)需要更多算力才能预测准确,简单的token(如常见词或模式化结构)几乎不需要多少计算。

LongCat-Flash拥有一种动态算力资源分配机制,会将部分相对简单的token交给零计算专家处理。这些专家的特点是直接把输入原样输出,不做任何计算,因此不会额外增加计算成本。

每个token的激活专家数量会因上下文而异,模型因此能对重要token分配更多算力, 对简单token分配更少算力 ,从而在相同的算力预算下,获得更好的性能。

为了让模型真正学会这种“因上下文而异”的计算分配,必须对 零计算专家的平均使用比例 进行细粒度控制。否则,模型可能会过度依赖普通专家,而忽视零计算专家,导致资源利用效率低下。

LongCat-Flash给每个专家引入一个 专家偏置项(bias) ,根据其近期使用情况动态调整路由分数。这些偏置不影响语言模型的主要训练目标,仅用于保持计算资源分布的均衡。同时,LongCat-Flash还通过负载均衡控制,确保了MoE模型的高效训练。

2、快捷连接架构MoE(Shortcut-Connected MoE,ScMoE)

在大规模MoE模型中,通信开销仍是主要瓶颈。传统的执行方式下,专家并行需要严格的顺序流程:必须先完成一次全局通信,将token路由到对应的专家,然后才能开始计算。这种通信延迟会导致设备利用率不足,从而限制整体系统吞吐量。

共享专家架构尝试通过将通信与单个专家的计算重叠来缓解上述问题,但由于单个专家的计算窗口太小,效率提升有限。

为突破这一限制,美团提出了快捷连接架构MoE, 在层与层之间引入跨层的捷径(Shortcut) ,重新排序执行流程。这一创新使得前一层的稠密计算能够与当前MoE层的分发/聚合通信并行执行,形成比共享专家更大的重叠窗口。

测试显示,ScMoE与非ScMoE基线模型的训练损失曲线几乎相同,说明这种重排不会损害模型性能。

同时,ScMoE带来显著的效率提升,更大的重叠窗口使得前一层计算可以与当前MoE通信阶段完全并行,提升训练效率。推理过程中,ScMoE启用单批次重叠流水线,使得理论每token输出时间相比头部模型(如DeepSeek-V3)降低近50%。

同时,它还支持不同通信模式并行:节点内的张量并行通信(通过NVLink实现)与节点间的专家并行通信(通过RDMA实现)可以完全重叠,最大化网络利用率。

3、可扩展的方差对齐设计

随着模型规模的扩大,一些在小规模下表现良好的架构可能变得次优,导致模型性能不稳定。通过实验和理论分析,LongCat-Flash团队发现模块内部的 方差不匹配 是造成这种问题的关键因素。

为此,他们提出了针对MLA(Multi-head Latent Attention,多头注意力)和MoE模块的方差对齐方法,通过引入了两个尺度修正因子和专家初始化的方差补偿,以提升模型可扩展性和稳定性。

三、模型从半规模版本扩展而来,Agent能力突出

在模型扩展与训练策略上,LongCat-Flash构建了一个完整的稳定性与扩展性框架。

LongCat-Flash团队没有直接在数千亿参数的模型上反复试错,而是采用了“以小推大”的策略:先在一个小规模的模型上系统地搜索学习率、初始化方差等参数,然后通过理论推导的规则将这些最佳配置迁移到大模型中。这种方法既节省了大量算力,又能保证超参数在大模型中依然合适。

其次,在模型初始化上, 团队通过“模型增长”的方式,让训练过程更加平稳。 该团队先训练了一个“半规模(half scale)”的模型,等它收敛到一定程度后,再把它扩展成完整的大模型继续训练。

新的大模型虽然在最初会出现轻微的波动,但很快就能进入稳定收敛状态,最终表现也明显优于完全随机初始化的做法。

为了进一步保证训练过程的稳定性,LongCat-Flash还配备了一套多维度的稳定性方案。

在路由层面,控制了不同专家的负载分布,避免出现有的专家过度繁忙、有的却长期闲置的情况。

在激活层面,LongCat-Flash引入了类似“保险丝”的机制,对异常大的激活值施加轻微约束,从而防止训练突然崩溃。

在优化器层面,LongCat-Flash团队对Adam的参数做了细致调整,使其在大规模训练场景下依然数值稳定。三方面配合,使模型在长时间训练中都能保持平稳,不会出现不可恢复的损失峰值。

在训练可靠性上,该团队还特别强调了可复现性和错误检测。这种严格的精度控制不仅保证了实验可复现,还能帮助快速发现和定位所谓的“静默数据损坏”(SDC),避免错误在大规模分布式系统中被掩盖。

通过这些设计,LongCat-Flash不仅能在数万张加速卡上稳定训练,还能保证训练结果可控、可靠,真正实现了在超大规模模型上的稳健扩展。

在训练流程上, 模型采用多阶段管线。 首先,通过双阶段预训练数据融合,逐步提升推理密集型数据(STEM知识与代码)的比例,构建出更适合后训练的基础模型。

在中期训练中,模型的上下文被扩展至128k tokens,并利用合成数据进一步增强推理与编程能力。

在后训练阶段,LongCat-Flash团队针对推理、编程和代理任务分别设计了数据与方法,尤其是提出多Agent合成框架,从信息处理、工具复杂度、用户交互三方面生成高难度任务,以锻炼模型的Agent能力。

在训练基础设施方面,团队进行了内核优化、分布式并行策略设计以及监控与容错机制的开发,使得模型能在数万张加速卡上稳定训练。

结合计算与通信编排、推测解码、KV缓存优化、量化与调度优化, 模型在推理中实现了每秒超100 tokens的吞吐,并将成本控制在0.7美元/百万tokens(约合人民币5元)。

LongCat-Flash团队在30项基准测试上评估了模型的能力,可以看到,Agent任务是这一模型能力的“长板”,相较DeepSeek-V3.1、Qwen3 MoE-2507和Kimi-K2等国产开源有明显优势,但在编程、数学、推理等方面还有提升空间。

结语:主动进攻的美团,要打造AI原生产品

LongCat-Flash技术团队透露,此次开源,他们旨在推动高效MoE架构、高质量数据策略以及自主Agent模型的相关研究,促进社区在大型语言模型领域的创新。

财报电话中,美团透露,已经在利用AI优化现有产品,并打造全新的AI原生产品,如AI运营助手等、消费者AI助手等。未来,美团在大模型领域的进展,值得持续关注。

美团首个开源大模型来了!5600亿个参数,推理速度比DeepSeek-V3快50%
美团首个开源大模型来了!5600亿个参数,推理速度比DeepSeek-V3快50%

巴西亿万富豪将全部遗产赠予内马尔

「活动」kumawubiaotitest

1.71MB
版本V3.9.38
下载女警脱👙给我揉🐻韩漫安装你想要的应用 更方便 更快捷 发现更多
喜欢 51%好评(773人)
评论 16
美团首个开源大模型来了!5600亿个参数,推理速度比DeepSeek-V3快50%截图0 美团首个开源大模型来了!5600亿个参数,推理速度比DeepSeek-V3快50%截图1 美团首个开源大模型来了!5600亿个参数,推理速度比DeepSeek-V3快50%截图2 美团首个开源大模型来了!5600亿个参数,推理速度比DeepSeek-V3快50%截图3 美团首个开源大模型来了!5600亿个参数,推理速度比DeepSeek-V3快50%截图4
详细信息
  • 软件大小: 8.08MB
  • 最后更新: 2025/09/07 03:50:13
  • 最新版本: V6.188.7
  • 文件格式: apk
  • 应用分类:ios-Android 亚洲男同Gay🔞戴套过
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 5.01以上
应用介绍
一,农山沟里一级A片免费,18❌羞本子拉普兰德
二,美女吊🐔巴www爽爽爽文,XHameter❌❌❌HD亚洲
三,纳西妲同人18❌网站,扒开妲己❌狂揉❌难受小说
四,爽爽午国产⭐浪潮AV性色,班长露出🐻强行被男生
五,131美女做爰AAAA,色情性黄❌片直播
六,大🐻动漫美女禁❌视频,外国高潮➕白浆➕糖心,扒开小乔❌狂揉❌难受3d小说
七,宅男app❤网站成人版
【联系我们】
客服热线:134-2881-646
加载更多
版本更新
V7.5.17
青楼传媒㊙️免费观看
  • 蜜雪b城色版18🚫在线观看

    3D动漫同人18❌动漫在线

    亚洲精品❌美无码流出

    7.33MB
    101好评

    成人久久久精品乱码一区二区三区

  • ❤️嫩草❤️嫩草V88AV

    17c在线观看㊙️

    www.😍.com.同人动

    602.64MB
    244好评

    打扑克美女被❌到深处喷水

  • 91漫画韩漫被❌到爽原神

    学生裸体黄❌❌网站入口

    让男按摩师摸🉐️好爽视频

    13.60MB
    318好评

    禁漫天堂❤A漫同人

  • 二次元美女裸体被❌虐胸羞羞

    Free❌㐅❌性HD车上

    Free❌㐅❌性HD裙底风光

    53.12MB
    276好评

    chinasexx

  • 禁漫天堂❤A漫同人

    腹肌体育生自慰出精🔞🈲网

    成人🔞高潮片免费看片

    71.05MB
    707好评

    非洲黑寡妇性猛交视频

  • 小兰脱内衣👙爆乳视频

    美女㊙️免费裸体在线观看

    精品无码㊙️人妻

    83.08MB
    333好评

    白丝校🌸脱白丝让我c图片

  • 91涩情🍑🍑🍑

    巨胸爆乳露双奶头被❌侵犯

    打男光屁股㊙️免费网站

    23.27MB
    106好评

    原神克洛琳德裸体❌开腿小说

  • 日本少妇❌❌❌喂切

    银狼被❌自慰爽

    护士脱了精光让人摸㊙️小说

    50.69MB
    924好评

    肥熟妇搡BBBB搡BBBB五十

  • 初音未来被❌吸乳羞羞漫画

    网禁🈲拗女稀缺在线观看

    火影㊙️免费裸体视频

    83.34MB
    569好评

    凝光被狂揉下部❌羞羞视频

  • 李霄鹏回应鲁能对韩国战绩不理想问题:就是要争胜

    春野樱被啪❌漫画

    裸体捆绑㊙️视频

    83.63MB
    759好评

    国产➕又黄➕视频➕️漫画视频

  • com.aim.stunts

    3D动漫柳神被❌在线观看

    成人黄漫画网站❌免费麻豆

    32.05MB
    629好评

    猛男雄壮粗浓精浓GV网站

  • 朱竹清赤裸无遮挡❌❌

    88丨九色丨国产熟女❤️

    猛男GayGay✅免费软件漫画

    26.64MB
    279好评

    原神3D同人18❌羞羞漫画免

  • 热舞阁在线观看首页入口免费

    雏田被鸣人爆❌歪歪漫画

    美女隐私㊙️让男人

    65.95MB
    740好评

    小鸡🐔伸进🈲🔞🔞直播

  • 男男GaYGAYS✅男同网站

    JJZZ欧美😍😍

    黄品汇免费无遮挡🔞视频网站下

    54.82MB
    757好评

    国产农村乱理

  • 扒开美女❌狂揉❌真

    直男体育生打✈️GAY2025

    a点🔴w🛑㸔🅱️片❌在线

    57.32MB
    685好评

    東京熱大亂交无碼大亂交有声小说

  • 女人裸体❌❌AI去衣免费

    爱丝视频官网

    mm操逼

    24.74MB
    350好评

    成人㊙️免费下载网站

  • 美女岔开腿给我❌了一夜

    蜜桃av㊙️一区二区三区

    极品老熟女❌❌❌

    13.99MB
    310好评

    芙宁娜被❌到爽🔞

  • 美女被❎免费网站app

    男人的🍌进入🍑动漫

    jk❌❌白丝❌❌爆乳视频

    84.99MB
    213好评

    最爽的亂倫A片

  • 男生互摸jiji㊙️隐私漫画

    成人18🈲免费观看的自慰

    大象导航回家dxdy2023的功能介绍

    45.59MB
    731好评

    偷拍美女拉屎❌❌❌网站

  • 小🐔🐔伸进🈲🔞🔞9幺,裸体

    动漫美女被❌到爽🔞流香椿网站

    日本🔞无遮挡打光屁股网站近期

    10.35MB
    187好评

    男女c🔞黄㊙️学生资源

  • 🍆🍑🔞❌❌❌91看片

    王者瑶㊙️挤奶

    JlZZJlZZ妇女亚洲人水多

    44.69MB
    366好评

    美女➕开屁屁➕韩国美女洗澡

  • 动漫黄网站❌免费入口视频

    白丝jk爆❌乳❌的软件

    红桃♥️传媒视频在线观看

    91.61MB
    201好评

    偷偷❌进熟睡的老师小说

  • 黄色录像大黄中老外逼逼

    小巧🐥放到女人的🍑无遮挡

    91极品国产㊙️原神中国

    30.30MB
    909好评

    成人福利涩app导航㊙️

  • 十八禁🔞裸玉足在线观看

    18美女敝尿视频网站㊙️

    二次元美女裸体❌开腿P图

    30.90MB
    548好评

    13日本XXXXXⅩXXX20

  • 扒开雏田❌狂揉❌难受3D

    白鹿被扒开腿吸乳❌

    jennie被爆❌自慰流水

    29.68MB
    120好评

    女同学被❌爽流片真人爽

  • 91看片白丝少萝❌❌自慰动漫

    91❌❌⭕️⭕️白丝

    美女㊙️免费裸体视

    70.77MB
    455好评

    停云裸体❌开腿被c网站

  • 🔞捆绑无遮挡打光屁股图片国产做受❌❌❌高潮软件五人樱花 title="男人㊙️桶进女人屁股直播" class="0v5366j9r7414 app-list-img" src="https://t11.baidu.com/it/u=1040017057,165456434&fm=30&app=106&f=JPEG?w=312&h=208&s=15B07D95426079116A1494FD03009032"">

    符玄裸体❌开腿

    胡桃❌到爽🔞

  • FreeHD18❌❌❌3D中国女人隐私喷水㊙️ title="18🈲️精选寸止挑战" class="0v5366j9r7414 app-list-img" src="https://t10.baidu.com/it/u=3070224572,165461829&fm=30&app=106&f=JPEG?w=312&h=208&s=C6000AAC4838BAC8463F54AC0300A00B"">

    朱竹清被❌吸乳羞羞3D

    美女扒开屁股眼让男人操的视频免费看

  • 国产做受❌❌❌❌、哈妮克孜被❌免费网站视频在线 title="男男涩涩Gay㊙网站软件" class="0v5366j9r7414 app-list-img" src="https://t12.baidu.com/it/u=1041590673,165100299&fm=30&app=106&f=JPEG?w=312&h=208&s=D7383EC642E1D8EA0A87937F0300C078"">

    3d女性自慰✅免费网站

    Z〇Z○女人另类Z〇Zo小矮人

{{.转码Keywords}} 类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
包含 饿了么 的应用集
评论
  • 丰满少妇❌❌❌❌HD 0天前
    真人啪啪试看120秒
  • 玩弄高潮老妇A片 1天前
    男人的🍌伸到🍑里的软件
  • 3d无尽裸体原神触手 4天前
    Free❌❌❌男人video
  • 涩涩同人❌18禁耀嘉音 2天前
    美女大胆做18🈲在线视频
  • 欧洲美女BBBBBBBBB 6天前
    日本人吃奶玩乳30分钟
  • 亚洲午夜18🈲️毛片在线看 3天前
    18禁 9 2色情摸老师奶头
  • 女学生与黑人做爰视频在线免费观看 2天前
    国产⭕⭕⭕⭕XXXX少
  • 白丝女仆疯狂❌喷水爽 4天前
    BRAZZERSHD老熟女
  • japan18❌❌❌5D 6天前
    国产高潮❌❌❌❌
  • 成人做爰黄A片免费看直播室男男 1天前
    ❤仙桃BJ韩国女主播