
264页最强 Agents 发展与挑战综述,微软&谷歌&MetaGPT联合出品!
MetaGPT&微软&港科大&斯坦福&谷歌等20个机构联合发表长达264页的最强:从受大脑启发的智能到进化、协作和安全的系统, 提供了一个全面的概述,将智能 Agents 置于,整合了认知科学、神经科学以及计算研究的原则。,标注了其在 AI ()研究中的当前探索水平。突出了现有成就、差距以及推动 AI 能朝着更全面、受大脑启发的能力发展的潜在机会。主张从人脑中汲取灵感,系统地分析和设计:生物系统通
MetaGPT&微软&港科大&斯坦福&谷歌等20个机构联合发表长达264页的最强基础 Agents 发展与挑战:从受大脑启发的智能到进化、协作和安全的系统, 提供了一个全面的概述,将智能 Agents 置于一个模块化、受大脑启发的架构中,整合了认知科学、神经科学以及计算研究的原则。
按主要脑区划分的关键人类大脑功能的示意图,标注了其在 AI (大型语言模型LLMs、AI Agent)研究中的当前探索水平。突出了现有成就、差距以及推动 AI 能朝着更全面、受大脑启发的能力发展的潜在机会。
主张从人脑中汲取灵感,系统地分析和设计 AI Agents 框架:生物系统通过将专业化的组件(用于感知、推理、行动等)紧密整合来实现通用智能——这种方法可以作为加强当前基于LLM的 Agents 的蓝图。
描述智能Agents循环和Agents社会的总体框架概览
将探索分为四个相互关联的部分:
- 首先,深入研究智能Agents的模块化基础,系统地将其认知、感知和操作模块映射到类似人类大脑的功能,并阐明记忆、世界建模、奖励处理以及类似情感系统等核心组件。
- 其次,讨论自我增强和适应性进化机制,探讨如何通过自动化优化范式(包括新兴的AutoML和LLM驱动的优化策略)自主完善其能力、适应动态环境并实现持续学习。
- 第三,研究协作和进化multi-Agent系统,调查从Agent互动、合作以及社会结构中涌现的集体智能,并强调其与人类社会动态的相似之处。
- 最后,着重讨论构建安全、可靠且有益的AI系统
一、智能Agents的模块化基础
- 认知(Cognition):首先探讨学习,研究它在心理状态内部发生的空间以及它所服务的具体目标。随后,研究推理,分析结构化和非结构化的方法,最后专门探讨规划能力作为一种特殊的推理行为。
- 记忆(Memory):首先简要概述人类记忆,重点关注编码、巩固和检索等关键阶段。然后,将探讨设计人工智能代理记忆系统的多样化方法,从传统的符号表示到前沿的基于神经网络的方法。最后,将考虑如何从神经科学和认知心理学中汲取原则以指导未来研究。
- 世界模型(World Model):探讨了人类认知研究中的“心理模型”与人工智能中的AI世界模型之间的关系,并将其归类为四种范式:隐式范式、显式范式、基于模拟器的范式以及一类其他新兴方法(例如,指令驱动范式)。
- 奖励(Reward):奖励帮助代理区分有益和有害的行动,塑造其学习过程并影响其决策制定。
- 感知(Perception):感知是人类和智能Agent获取信息、解释周围环境并最终做出明智决策的基础途径
- 行动系统(Action System):基础模型为Agent奠定了基础,而行动系统决定了它们实现复杂目标的最终潜力
二、智能Agent系统的自我进化
所有手工设计的Agent人工智能系统最终都将被可学习和自我进化的系统所取代,这最终可能会将Agent人工智能的开发和改进置于一个自主、自给自足的循环中。
关键概念的示意图:包括优化空间、优化器和优化目标。优化器在优化空间内迭代地细化组件,以增强代理系统,直到达到满意的结果,从而在LLM代理系统中实现自我改进。
为了实现自动化人类努力的目标,许多研究提出了利用LLM作为驱动力,以实现代理系统的自我进化。特别是,LLM为传统的优化方法(如基于梯度和基于强化学习的方法)提供了一种高效的替代方案。它们将优化空间从数值扩展到更多样化的领域,自然语言作为通用桥梁。
LLM能够优化复杂的、异构的参数,如指令和工具实现,并且可以在包括开源和闭源模型在内的各种LLM上运行。这种方法的一个显著例子是AFLOW,它自动化了整个代理系统工作流程的生成和优化。该系统采用蒙特卡洛树搜索来利用LLM的全面能力。在这个框架中,传统手工制作的代理系统被算法生成的系统所取代,标志着一种范式的转变。
- 最近在代理系统研究中探索的各种优化空间,包括提示、工具和工作流程。
- 优化算法,讨论了传统的优化范式和元优化,其中优化过程也会影响底层的优化算法本身。
- 自我进化场景,将其分为两种类型:在线优化和离线优化。
- 大型语言模型(LLM)代理自我改进技术的应用,特别是在人工智能用于科学(AI-for-science)领域的知识发现。
三、协作和进化multi-agent系统
系统地调研了基于LLM的multi-agent系统的协作机制和进化能力。
- 不同的系统目标如何塑造代理的角色、行为模式和协作策略。
- 分析了各种通信结构,包括促进有效代理间和人机通信的交互协议。
- 探讨了协作决策制定方法,以及代理如何利用其独特的专业知识和视角,
- 讨论了集体智能和进化机制以及进化过程,重点介了适应性学习方法、持续的知识共享以及共同提升MAS性能的迭代改进机制。
https://arxiv.org/pdf/2504.01990Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolutionary, Collaborative, and Safe Systemshttps://github.com/FoundationAgents/awesome-foundation-agents
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
更多推荐
所有评论(0)