LongCat是美团基于混合专家模型(Mixture-of-Experts, MoE)架构研发的AI对话平台,其总参数量高达5600亿,但通过独特的动态计算机制,每个token仅激活186亿至313亿参数(平均约270亿),实现了计算效率与性能的卓越平衡。这种创新的“零计算专家”机制,可根据任务复杂度动态调整激活参数数量,极大地提高了算力的利用效率。
LongCat不仅在技术架构上具有多项创新,还在性能表现上十分出色。它在多项权威基准测试中表现优异,尤其在智能体任务方面展现出显著优势。例如,在τ²-Bench(工具使用基准)中超越其他模型,在VitaBench(复杂场景基准)中以24.30的得分位列第一。此外,LongCat-Flash-Chat还具备强大的编程能力和指令遵循能力,能够为用户提供高质量的代码生成和解析服务。
美团选择以MIT协议开源LongCat-Flash-Chat,模型代码已部署在Hugging Face和GitHub平台。这一举措不仅降低了企业级应用门槛,也为开发者社区提供了强大的工具和可能性。开发者可以前往相关平台获取开源模型,根据自身需求进行本地部署、二次开发或研究使用。
LongCat-Flash-Chat的发布,标志着美团在AI领域的进一步深入布局。美团CEO王兴曾明确表示,美团的AI战略是主动进攻而非被动防御。LongCat-Flash-Chat的高效性能和开源策略,不仅为美团自身业务提供了强大的技术支持,也为整个AI行业的发展注入了新的动力。
关于LongCat特别声明
该网址链接来源于网络,由网友提供,本站不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不受本站实际控制,如网页的内容出现违规,可以直接反馈或联系网站管理员进行删除, 站联不承担任何责任。
