近日,未来式智能(AutoAgents.ai)与北京大学、香港科技大学、多伦多大学、加州大学圣迭戈分校(UCSD)、德克萨斯大学健康科学中心及华南师范大学共同完成的研究成果《Difficulty-Aware Agentic Orchestration for Query-Specific Multi-Agent Workflows》正式入选国际顶级会议 WWW 2026(The ACM Web Conference)。WWW 作为 Web 与 AI 领域最具影响力的CCF-A国际会议之一。本次入选标志着未来式在多智能体系统自动编排(Agentic Orchestration)方向取得重要突破。

这项研究解决了一个行业共性难题:如何让智能体像人类专家一样,根据问题难易程度自主调配资源。

技术内核:重塑智能体的“组织行为学”

我们摒弃了市面上主流的“固定流水线”模式,在底层架构上实现了三个维度的自主化:

1. 显式难度预测:让系统具备“认知自觉”

核心模块Difficulty Estimator不再依赖简单的分流逻辑,而是将 Query 难度视为一种可学习的神经信号。

系统通过历史执行反馈,实时预估当前任务的潜在颗粒度。这一信号直接决定了工作流深度、每一层的 operator 选择、是否需要协作机制以及模型路由策略,并以此锁定后续所有算子的激活阈值,让“大炮打蚊子”的情况从底层被杜绝。

2. 动态 DAG 空间搜索:工作流可生成

我们将多智能体协作建模为一个可搜索的 DAG 空间。

任务结构不再是预设的代码,而是算法在搜索空间中实时生成的最优路径,驱动结构随复杂度的提升而“自发成长”,实现推理逻辑与任务需求的精准对齐。系统依据难度动态生成结构,取代预定义的 Pipeline,使结构本身成为优化对象,支撑推理深度的按需调整与协作方式的自适应演变。

3. 异构模型路由:性能与成本同时纳入目标

系统引入了多模型推理成本与任务性能的联合建模,实现了异构算力的精准投放。

考虑到实际任务中并非所有环节都需要旗舰模型,架构会在 DAG 的不同节点自动调用最匹配的模型。这种路由机制在多个 Benchmark 上展现了显著优势:在不损失复杂逻辑性能的前提下,实现了性能提升与成本降低的双重目标。

商业实效:定义企业级智能体的能效平衡点

对于致力于将大模型智能体投入生产环境的企业而言,未来式智能的研究成果通过结构性的优化,将直接转化用户商业竞争力:

极致的 TCO (总拥有成本) 优化: 

通过异构模型路由与路径修剪,系统在保持旗舰级性能的同时显著降低了 Token 消耗。这种高能效比的架构,使得智能体的大规模商业部署真正具备了经济可行性。

毫秒级的实时响应体验:

核心架构通过消除无效推理链路,实现了首字响应时间 (TTFT) 与端到端延迟的质变。在交互式业务场景中,这种速度提升直接关乎用户留存与转化。

系统级的交付确定性:

 动态编排机制在架构层面抑制了复杂流程中常见的“幻觉叠加”,显著提升了复杂业务场景下的任务完成率,为企业级应用提供了底层可靠性。

未来展望:迈向更有“分寸感”的智能

未来式智能团队认为,多智能体系统的进化方向正从单一的规模增长转向资源与智能的深度协同。在这种演进趋势下,真正的技术护城河在于以最精简的逻辑释放最强大的确定性。基于这一理念,未来式智能将继续探索多模态场景下的难度感知,并推进实时反馈驱动的结构更新,通过持续迭代的算法框架,为全球10亿知识工作者定义更高效、更具韧性的智能体搭建范式。

论文地址: https://arxiv.org/abs/2509.11079

Logo

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区,共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐