PaperBanana扩展开发指南：如何添加新的智能体与自定义功能

PaperBanana是一款专为AI科学家设计的学术插图自动化工具，能够帮助研究人员快速生成符合学术规范的图表和可视化内容。本指南将详细介绍如何为PaperBanana添加新的智能体（Agent）和自定义功能，让你轻松扩展其 capabilities。## 智能体架构概览PaperBanana采用模块化的智能体架构，所有智能体都继承自`BaseAgent`抽象基类。系统已内置多种功能智能体

王海高Eudora

901人浏览 · 2026-03-18 00:32:53

王海高Eudora · 2026-03-18 00:32:53 发布

PaperBanana扩展开发指南：如何添加新的智能体与自定义功能

【免费下载链接】PaperBanana PaperBanana: Automating Academic Illustration For AI Scientists 项目地址: https://gitcode.com/gh_mirrors/pa/PaperBanana

PaperBanana是一款专为AI科学家设计的学术插图自动化工具，能够帮助研究人员快速生成符合学术规范的图表和可视化内容。本指南将详细介绍如何为PaperBanana添加新的智能体（Agent）和自定义功能，让你轻松扩展其 capabilities。

智能体架构概览

PaperBanana采用模块化的智能体架构，所有智能体都继承自BaseAgent抽象基类。系统已内置多种功能智能体，包括规划师（Planner）、可视化器（Visualizer）、风格化器（Stylist）等，它们协同工作完成学术插图的生成与优化。

图1：PaperBanana智能体系统架构图，展示了各智能体间的协作流程

核心智能体类型

系统当前实现的主要智能体包括：

PlannerAgent：负责规划图表生成策略
VisualizerAgent：处理实际的图表渲染
StylistAgent：优化图表的学术风格
CriticAgent：对生成结果进行评估和改进建议
RetrieverAgent：检索相关参考资料
PolishAgent：对最终结果进行精修

这些智能体位于agents/目录下，每个智能体都有独立的实现文件，如agents/planner_agent.py和agents/visualizer_agent.py。

创建自定义智能体的步骤

1. 定义智能体类

创建新智能体的第一步是定义一个继承自BaseAgent的类，并实现必要的抽象方法。BaseAgent位于agents/base_agent.py，它定义了所有智能体的基本接口。

from agents.base_agent import BaseAgent
from typing import Dict, Any

class CustomAgent(BaseAgent):
    """自定义智能体示例"""
    
    async def process(self, data: Dict[str, Any], **kwargs) -> Dict[str, Any]:
        """
        处理输入数据并返回结果
        
        Args:
            data: 输入数据字典
            **kwargs: 额外的参数
            
        Returns:
            处理后的结果字典
        """
        # 实现自定义处理逻辑
        result = data.copy()
        result["custom_output"] = "这是自定义智能体的输出"
        return result

2. 实现核心功能

在process方法中实现智能体的核心逻辑。根据智能体的功能，可以访问输入数据中的各种字段，并生成新的输出。例如，可视化智能体可能会处理图表描述并生成图像数据。

3. 集成到处理流程

创建智能体后，需要将其集成到PaperVizProcessor的处理流程中。编辑utils/paperviz_processor.py文件，在PaperVizProcessor类的初始化方法中添加新智能体：

def __init__(
    self,
    exp_config: ExpConfig,
    # 已有的智能体...
    custom_agent: CustomAgent,  # 添加新智能体参数
):
    # 已有的初始化代码...
    self.custom_agent = custom_agent  # 保存新智能体实例

然后在适当的处理阶段调用新智能体的process方法：

# 在process_single_query方法的适当位置添加
data = await self.custom_agent.process(data)

4. 配置与使用

最后，在主程序入口main.py中实例化新智能体并将其传递给处理器：

processor = paperviz_processor.PaperVizProcessor(
    exp_config=exp_config,
    # 已有的智能体实例化...
    custom_agent=CustomAgent(exp_config=exp_config),  # 实例化新智能体
)

智能体开发最佳实践

遵循现有接口规范

确保新智能体遵循BaseAgent定义的接口规范，特别是process方法的参数和返回值格式。这有助于保持系统的一致性和兼容性。

利用配置系统

使用utils/config.py中定义的ExpConfig类来管理配置参数，避免硬编码设置。这使得智能体更加灵活和可配置。

实现迭代优化机制

参考CriticAgent的实现，考虑为新智能体添加迭代优化能力。例如，可以实现多轮处理，每轮根据反馈改进结果：

图2：展示了CriticAgent如何通过多轮迭代优化图表风格

测试与调试

开发新智能体时，建议使用exp_mode配置来创建专门的测试模式，如dev_custom，以便在不影响其他功能的情况下进行测试。

自定义功能扩展示例

以下是几个常见的自定义功能扩展场景及其实现思路：

添加新的图表类型支持

创建专门处理该图表类型的智能体，如BarChartAgent
在VisualizerAgent中添加对新图表类型的渲染支持
更新style_guides/目录下的风格指南，添加新图表的样式规范

集成外部API

创建APIIntegrationAgent处理API调用
在配置文件configs/model_config.template.yaml中添加API密钥等配置
实现错误处理和重试机制，确保外部依赖的稳定性

添加自定义评估指标

扩展utils/eval_toolkits.py中的评估函数
创建CustomEvaluatorAgent实现新的评估逻辑
在处理流程中添加评估步骤，如在CriticAgent之后运行

部署与分享自定义扩展

完成自定义智能体开发后，可以通过以下步骤分享你的扩展：

将新智能体代码提交到项目仓库
更新README.md，添加新智能体的使用说明
在scripts/run_demo.sh中添加演示新功能的命令

总结

通过本文介绍的方法，你可以轻松扩展PaperBanana的功能，创建自定义智能体来满足特定的学术插图需求。无论是添加新的图表类型、集成外部服务，还是实现自定义评估逻辑，PaperBanana的模块化架构都能提供良好的支持。

图3：展示了添加自定义智能体后，与原始版本相比的效果提升

开始你的扩展开发之旅吧！如有疑问，可以参考现有智能体的实现代码，或查看项目中的CONTRIBUTING.md文档获取更多帮助。

【免费下载链接】PaperBanana PaperBanana: Automating Academic Illustration For AI Scientists 项目地址: https://gitcode.com/gh_mirrors/pa/PaperBanana

脑启社区

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区，共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐

快讯｜复旦发布全球首篇WAM系统性综述366篇论文绘制技术版图，飞捷科思自研可微分物理引擎Fysics指标超8B模型，维泛智能类脑芯片BiGPU融合ANN与SNN，Sim2Real实证：空间特征泛化远

脑启社区

EM-Core自动驾驶类脑世界模型——全域客观认知底座（V1.0 正式版）

本文档为 EM-Core 自动驾驶认知系统的核心认知底座规范，是 ECC 认知大脑开展推理、预判、决策的**唯一客观依据**。本模型与 MLNF-Mem 记忆中枢完全物理解耦，作为漏斗外侧独立挂载的外置模块（ad-44）运行，仅通过 `WM_QUERY` 标准消息向 ECC-01 情境解析模块和 ECC-03 因果推理模块提供风险向量与属性查询服务，不参与记忆晋升、遗忘或行为决策。适用于全场景自动