
Mistral Agents API:AI进化,从文本生成到问题解决
Mistral Agents API发布:赋能AI执行动作、保持上下文、编排Agent,简化Agentic用例,支持代码执行、网页搜索、图像生成、MCP工具,实现记忆、状态化对话和Agent切换。
-
Mistral Agents API 发布:AI 能力提升的关键一步
- 目标:使 AI 更强大、更有用,并成为积极的问题解决者。
- 传统语言模型的局限性:擅长生成文本,但在执行动作和保持上下文方面存在限制。
- Agents API 的解决方案:结合 Mistral 的语言模型,并提供:
- 内置连接器:代码执行、网页搜索、图像生成和 MCP 工具。
- 持久记忆:跨对话保持上下文。
- Agentic 编排能力。
- Agents API 的定位:Chat Completion API 的补充,简化 agentic 用例的实现,作为企业级 agentic 平台的基础。
- Agents API 的优势:可靠的框架,处理复杂任务,保持上下文,协调多个动作,使企业能够以更实际和更有影响力的方式使用 AI。
-
Mistral Agents API 的应用场景
- Coding assistant with Github:
- Agent 通过 Agents API 与 Github 交互,监督由 DevStral 驱动的开发者 agent 编写代码。
- Agent 拥有对 Github 的完全控制权,展示了自动化软件开发任务管理。
- Linear tickets assistant:
- 智能任务协调助手,使用多服务器 MCP 架构,将通话记录转换为 PRD,再转换为可执行的 Linear 问题,并跟踪项目交付。
- Financial analyst:
- 财务咨询 agent,协调多个 MCP 服务器,获取财务指标,编译见解,并安全地存档结果。
- Travel assistant:
- 强大的 AI 旅行助手,帮助用户计划行程、预订住宿和管理旅行需求。
- Nutrition assistant:
- AI 驱动的食物饮食伴侣,旨在帮助用户建立目标、记录膳食、接收个性化的食物建议、跟踪他们的日常成就,并发现符合其营养目标的餐饮选择。
- Coding assistant with Github:
-
创建具有内置连接器和 MCP 工具的 Agent
- 内置连接器:Agent 可以按需调用的工具。
- 代码执行
- 允许开发者创建在安全沙箱环境中执行 Python 代码的 agent。
- 应用场景:数学计算和分析、数据可视化和绘图、科学计算。
- 图像生成
- 由 Black Forest Lab FLUX1.1 [pro] Ultra 提供支持。
- 应用场景:为教育内容生成视觉辅助工具、为营销材料创建自定义图形、创作艺术图像。
- Document library
- 内置连接器,使 agent 能够访问 Mistral Cloud 中的文档。
- 支持集成的 RAG 功能,通过利用用户上传文档的内容来增强 agent 的知识。
- 网页搜索
- 允许开发者将 Mistral 模型与来自网页搜索、信誉良好的新闻和其他来源的各种最新信息相结合。
- 提高性能:在 SimpleQA 基准测试中,使用网页搜索的 Mistral Large 和 Mistral Medium 分别达到 75% 和 82.32% 的分数,而没有网页搜索时为 23% 和 22.08%。
- SimpleQA 准确率 (越高越好)
- MCP 工具
- Agents API SDK 还可以利用基于模型上下文协议 (MCP) 构建的工具。
- MCP 是一种开放的标准协议,可在 agent 和外部系统之间实现无缝集成。
- MCP 工具为 agent 提供了一个灵活且可扩展的接口,用于访问真实世界的上下文,包括 API、数据库、用户数据、文档和其他动态资源。
-
通过状态化对话实现记忆和上下文
- Agents API 通过灵活且状态化的对话系统提供强大的对话管理。
- 每个对话都保留其上下文,从而实现随时间的无缝和连贯的交互。
- 对话管理
- 两种开始对话的方式:
- 与 Agent:创建与特定 agent_id 的对话以利用其专业功能。
- 直接访问:通过直接指定模型和完成参数来开始对话,从而快速访问内置连接器。
- 每个对话都通过对话条目维护结构化历史记录,确保在交互过程中保留上下文。
- 两种开始对话的方式:
- 状态化交互和对话分支
- 开发者不再需要监控转换历史记录;他们可以查看过去的对话。
- 他们可以随时继续任何对话或从任何点启动新的对话路径。
- 流式输出
- API 还支持流式输出,无论是在开始对话还是继续之前的对话时。
- 此功能允许实时更新和交互。
-
Agent 编排
- Agents API 的真正力量在于它能够编排多个 agent 来解决复杂问题。
- 通过动态编排,可以根据需要从对话中添加或删除 agent,每个 agent 都贡献其独特的功能来解决问题的不同部分。
- 创建 agentic 工作流程
- 首先创建所有必要的 agent。
- 可以根据需要创建任意数量的 agent,每个 agent 都有特定的工具和模型,以形成定制的工作流程。
- Agent 切换
- 定义哪些 agent 可以将任务切换给其他 agent。
- 例如,财务 agent 可能会根据对话的需要将任务委派给网页搜索 agent 或计算器 agent。
- 切换启用无缝的行动链。
- 单个请求可以触发多个 agent 上的任务,每个 agent 处理请求的特定部分。
- 这种协作方法可以实现高效且有效的问题解决,从而释放现实世界应用的强大可能性。
-
开始使用
- 查阅文档,创建您的第一个 agent,然后开始构建!