📕 目录
- 💡 什么是PAI-RAG?
- 🌟 主要模块和功能
- 🔎 快速开始
- 📜 文档
PAI-RAG 是一个易于使用的模块化 RAG(检索增强生成)开源框架,结合 LLM(大型语言模型)提供真实问答能力,支持 RAG 系统各模块灵活配置和定制开发,为基于阿里云人工智能平台(PAI)的任何规模的企业提供生产级的 RAG 系统。
- 模块化设计,灵活可配置
- 功能丰富,包括Agentic RAG, 多模态问答和nl2sql等
- 基于社区开源组件构建,定制化门槛低
- 多维度自动评估体系,轻松掌握各模块性能质量
- 集成全链路可观测和评估可视化工具
- 交互式UI/API调用,便捷的迭代调优体验
- 阿里云快速场景化部署/镜像自定义部署/开源私有化部署
您可以通过两种方式在本地运行 PAI-RAG:Docker 环境或直接从源代码运行。
-
设置环境变量
git clone [email protected]:aigc-apps/PAI-RAG.git cd PAI-RAG/docker cp .env.example .env
如果您需要使用通义千问API或者阿里云OSS存储,请编辑 .env 文件。 其中DASHSCOPE_API_KEY获取地址为 https://dashscope.console.aliyun.com/apiKey。 当服务启动后您依然可以在WEB UI中配置这些API_KEY信息,但是我们建议您通过环境变量的方式配置。
-
使用
docker compose
命令启动服务:docker-compose up -d
-
打开浏览器中的 http://localhost:8000 访问web ui. 第一次启动服务会下载需要的相关模型文件,需要等待20分钟左右。
如果想在本地启动或者进行代码开发,可以参考文档:本地开发指南
-
打开 http://localhost:8000 在浏览器中。根据需要调整索引和LLM设置。
-
访问"上传"页面,上传测试数据:./example_data/paul_graham/paul_graham_essay.txt。
-
切换到"聊天"页面, 进行对话。
-
打开 http://localhost:8000 在浏览器中。根据需要调整索引和LLM设置。
-
使用API上传数据:
切换到
PAI-RAG
目录cd PAI-RAG
请求
curl -X 'POST' http://localhost:8000/api/v1/upload_data \ -H 'Content-Type: multipart/form-data' \ -F 'files=@example_data/paul_graham/paul_graham_essay.txt'
响应
{ "task_id": "1bcea36a1db740d28194df8af40c7226" }
-
检查上传任务的状态:
请求
curl 'http://localhost:8000/api/v1/get_upload_state?task_id=1bcea36a1db740d28194df8af40c7226'
响应
{ "task_id": "1bcea36a1db740d28194df8af40c7226", "status": "completed", "detail": null }
-
Perform a RAG query:
请求
curl -X 'POST' http://localhost:8000/api/v1/query \ -H "Content-Type: application/json" \ -d '{"question":"What did the author do growing up?"}'
响应
{ "answer":"Growing up, the author worked on writing and programming outside of school. Specifically, he wrote short stories, which he now considers to be awful due to their lack of plot and focus on characters with strong feelings. In terms of programming, he first tried writing programs on an IBM 1401 in 9th grade, using an early version of Fortran. The experience was limited because the only form of input for programs was data stored on punched cards, and he didn't have much data to work with. Later, after getting a TRS-80 microcomputer around 1980, he really started programming by creating simple games, a program to predict the flight height of model rockets, and even a word processor that his father used to write at least one book.", "session_id":"ba245d630f4d44a295514345a05c24a3", "docs":[ ... ] }
可以直接通过API服务调用RAG能力(上传数据,RAG查询,检索,NL2SQL, Function call等等)。更多细节可以查看API文档
可以配置OSS存储和多模态大语言模型来实现文档中的图片理解和问答。请参考问答多模态问答
您也可以在PAI-RAG中使用支持API function calling功能的Agent,请参考文档: Agentic RAG
您可以在PAI-RAG中使用支持数据库和表格文件的数据分析功能,请参考文档:数据分析 Nl2sql
文件类型 | 文件格式 |
---|---|
非结构化 | .txt, .docx, .pdf, .html,.pptx,.md |
图片 | .gif, .jpg,.png,.jpeg, .webp |
结构化 | .csv,.xls, .xlsx,.jsonl |
其他 | .epub,.mbox,.ipynb |
- .doc格式文档需转化为.docx格式
- .ppt和.pptm格式需转化为.pptx格式