Moonshot AI发布首款自主强化学习Agent产品Kimi-Researcher，开启灰度测试

Moonshot AI发布首款自主强化学习Agent产品Kimi-Researcher，开启灰度测试快讯

TechWeb.com.cn 2025-06-23 14:12

分享到：

导读

【TechWeb】Moonshot AI公司近日正式推出其首款Agent产品——Kimi-Researcher（深度研究），能够独立规划任务流程并输出完整的研究结果，Kimi-Researcher能够自主判断在信息冲突时的处理策略。

【TechWeb】Moonshot AI公司近日正式推出其首款Agent产品——Kimi-Researcher（深度研究），并且已经开始进行小范围的灰度测试。

Kimi-Researcher采用端到端自主强化学习（end-to-end agentic RL）技术构建，在HLE测试中表现出色，其性能超过了Claude 4 Opus、Gemini 2.5 Pro以及OpenAI Deep Research等知名模型，与Gemini-Pro的Deep Research Agent性能相当。

这款智能研究助手Kimi-Researcher具有高度的自主性，能够独立规划任务流程并输出完整的研究结果。它与其他Agent的最大不同点在于其零结构设计，无需依赖复杂的提示词或预设流程，完全依靠自主决策能力在动态环境中运作。

Kimi-Researcher能够自主判断在信息冲突时的处理策略，决定任务节点的转换时机，以及筛选中间信息的重要性，始终以实际解决任务效果为核心驱动力。

作为一款专注于深度研究的模型，Kimi-Researcher整合了多个来源的数据，并支持每条引用的直接追溯，这保证了研究的严谨性，并有效降低了幻觉问题的出现。Moonshot AI表示，未来将逐步开放Kimi-Researcher的基础预训练模型及强化学习优化版本的源代码，以促进Agent强化学习领域的进一步探索和发展。（Suky）

Kimi-Researcher 研究 Agent 任务自主

分享到：

1.TMT观察网遵循行业规范，任何转载的稿件都会明确标注作者和来源；
2.TMT观察网的原创文章，请转载时务必注明文章作者和"来源：TMT观察网"，不尊重原创的行为TMT观察网或将追究责任；
3.作者投稿可能会经TMT观察网编辑修改或补充。