计算成本低于DeepSeek？蚂蚁集团回应自研大模型用国产AI芯片训练具体真相是什么-轻舞信息网

3月24日，针对媒体对蚂蚁百灵大模型训练成本的报道，蚂蚁集团方面回应界面新闻称，蚂蚁针对不同芯片持续调优，以降低AI应用成本，目前取得了一定的进展，也会逐步通过开源分享。

此前有报道称，蚂蚁集团正使用中国制造的半导体来开发AI模型训练技术，这将使成本降低20%。知情人士称，蚂蚁集团使用了包括来自阿里巴巴和华为的芯片，采用混合专家(MoE)机器学习方式来训练模型。他们表示，蚂蚁集团获得了与采用英伟达H800等芯片训练相似的结果。

其中一位知情人士称，蚂蚁集团仍在使用英伟达的产品进行人工智能开发，但目前其最新模型主要依赖于包括AMD产品和中国芯片在内的替代产品。

另据钛媒体报道，近日，蚂蚁集团CTO、平台技术事业群总裁何征宇带领Ling Team团队，利用AI Infra技术，开发了两个百灵系列开源MoE模型Ling-Lite 和 Ling-Plus，前者参数规模168亿，Plus基座模型参数规模高达2900亿，相比之下，AI行业估计GPT-4.5参数量1.8万亿，DeepSeek-R1参数规模达6710亿。

该技术成果论文《每一个FLOP都至关重要：无需高级GPU即可扩展3000亿参数混合专家LING大模型》已在预印版Arxiv平台上发表。

除了自研性能领先的大模型以外，该技术论文最大的突破在于提出了一系列创新方法，以提升资源受限环境下AI开发的效率与可及性。实验表明，其3000亿参数的MoE大模型可在使用国产GPU的低性能设备上完成高效训练，性能与完全使用英伟达芯片、同规模的稠密模型及MoE模型相当。