PaSa项目使用教程

PaSa（Paper Search Agent）是一个基于大型语言模型的先进学术搜索代理。它可以自主地做出一系列决策，包括调用搜索工具、阅读论文以及选择相关参考文献，以最终为复杂的学术查询提供全面而准确的结果。PaSa 使用强化学习进行优化，并在合成数据集AutoScholarQuery上进行训练，该数据集包含35k个细粒度的学术查询和来自顶级人工智能会议出版物对应的论文。此外，还开发了RealS

束娣妙Hanna

1084人浏览 · 2025-04-01 10:01:09

束娣妙Hanna · 2025-04-01 10:01:09 发布

PaSa项目使用教程

【免费下载链接】pasa PaSa -- an advanced paper search agent powered by large language models. It can autonomously make a series of decisions, including invoking search tools, reading papers, and selecting relevant references, to ultimately obtain comprehensive and accurate results for complex scholarly queries. 项目地址: https://gitcode.com/gh_mirrors/pa/pasa

1. 项目介绍

2. 项目快速启动

以下是快速启动PaSa项目的步骤：

首先，确保你已经安装了Python环境。然后按照以下步骤操作：

# 克隆项目仓库
git clone git@github.com:bytedance/pasa.git

# 进入项目目录
cd pasa

# 准备数据集
# 下载数据集并保存到data文件夹中（具体数据集下载地址在项目README中有说明）

# 准备模型 checkpoints
# 下载pasa-7b-crawler和pasa-7b-selector模型 checkpoints 并保存到checkpoints文件夹中

# 安装依赖
pip install -r requirements.txt

# 应用程序需要Google Search API密钥，请在serper.dev申请并替换utils.py中的'your google keys'

# 运行PaSa
python run_paper_agent.py

请注意，上述步骤中的utils.py中需要替换的'your google keys'是指Google Search API的密钥。