Skip to content

taishan1994/Agent-Handbook

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

20 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Agent-Handbook

Agent学习笔记。

  • pocketflow-handbook:使用Pocketflow的官方仓库及示例,构建基础的学习课程。基本上如果对pocketflow比较了解了,后续再去学习langchain或者langgraph等其它的框架就会更简单。
  • pocketflow-adp:基于google的书籍《agentic-design-patterns》,使用pocketflow实现书中不同章节的代码。
  • pocketflow-leetcode:构建一个可以自动写leetcode和测试i的智能体。
  • anthropic-article:学习anthropic发布的有关智能体的文章。

Agent框架对比

主流 AI Agent 框架优缺点对比(截至 2025 年 11 月)

框架 优点 缺点
OpenAI Agents SDK - 轻量级、设计简洁
- 原语清晰(Agent 与 Handoff)
- 支持全面的跟踪功能
- 适合快速构建生产级多智能体系统
- 拥有活跃社区(GitHub 1.1万星)
- 对非 OpenAI 模型(如开源或竞品)支持有限
- 生态目前不如 LangChain 等成熟
AutoGen(Microsoft Research) - 开创了多智能体“群聊”模式
- 支持高度灵活的协作模式
- 适合研究与原型开发
- 缺乏原生记忆支持
- 扩展性弱
- 企业级部署需额外集成
- 更适合小规模研究项目,不适合大规模生产
Microsoft Agent Framework (MAF) - 融合 AutoGen 与 Semantic Kernel 的长处
- 提供图式工作流、强类型接口
- 支持企业级功能(安全、可观测性)
- 支持 .NET 与 Python
- 相对较新,社区生态尚在建设中
- 学习曲线略陡
CrewAI - 完全从零构建、轻量快速
- 强调“角色-目标-任务”驱动的协作
- 可独立于 LangChain
- 适合构建结构化团队式智能体
- 生态较新,工具链和可视化支持较少
- 不适合需要复杂流程编排的场景
Google ADK(Agent Development Kit) - 提供开发者 UI、CLI、调试工具链完整
- 支持 Google Agent Protocol
- 便于集成 Google 生态(如 Search、Gemini)
- 内置工具限制多(如每个 Agent 只能绑定一个内置工具)
- 深度绑定 Gemini,跨模型迁移困难
MetaGPT - 模拟软件公司工作流
- 擅长从单行需求生成完整项目代码
- 适合工程类多智能体协作
- 依赖 asyncio
- 缺乏可视化构建器
- 对非技术用户不友好
Haystack Agents(deepset) - 围绕 RAG 构建
- 模块化强
- 适合企业级 NLP 应用(如智能搜索、文档处理)
- 通用智能体编排能力较弱
- 不如 AutoGen / CrewAI 等专为多智能体设计的框架灵活
Claude Agent SDK(Anthropic) - 专为 Claude 模型优化
- 支持 MCP 工具协议
- 适合构建生产级编码智能体
- 仅支持 Claude 系列模型
- 目前仅提供 Python 版本
- 长上下文需手动压缩
Crawl4AI / Crawl4AI - 专为 LLM 优化的网页抓取框架
- 异步高性能
- 输出结构化 Markdown
- 适合构建 Web 数据摄入管道
- 并非通用智能体框架
- 是特定于数据采集的工具,需与其他框架配合使用
LlamaIndex(Agents & LlamaAgents) - 在 RAG 场景下表现卓越
- 数据连接器丰富
- 文档和社区活跃
- 聚焦数据检索而非通用智能体协作
- 扩展性和通用编排能力有限
Semantic Kernel – Agent Orchestration(Microsoft) - 多语言支持(.NET / Python / Java)
- 模型无关
- 适合企业级工作流编排
- 支持 Group Chat 等高级模式
- 抽象层级高,初学者门槛略高
- 需结合其他组件构建完整智能体系统
PydanticAI - 强类型安全
- 与 Pydantic 深度集成
- 调试能力强(支持 Logfire)
- 适合构建可靠生产应用
- 较新,生态和工具链尚不成熟
- 社区规模较小
Griptape - 模块化设计
- 支持记忆、工具、多智能体协作
- 适合构建 LLM 工作流与智能体应用
- 文档和示例相对较少
- 社区活跃度不如头部框架
Flowise Agents - 低代码可视化编排
- 适合快速构建 LLM 工作流和简单智能体系统
- 动态多智能体能力有限
- 不适合复杂协作场景
- 企业集成能力较弱
LangChain - 快速原型开发能力强
- 支持海量工具与模型集成(包括本地/私有模型)
- 成熟的 RAG 与 Agent 支持
- 拥有最广泛的社区与教程资源
- 抽象层级高,学习曲线陡峭
- 调优与性能优化较复杂
- 在大型项目中带来治理和调试负担
LangGraph - 提供状态化、可持久记忆的多智能体工作流
- 基于图结构,支持循环、分支、暂停/恢复等高级控制流
- 与 LangChain 深度集成,适合构建复杂代理系统
- 支持节点级超时、重试等生产级特性
- 需要熟悉图式编程范式
- 对简单任务而言可能过度设计
- 部分高级功能需依赖 LangSmith 等商业组件
DeepAgents - 基于 LangChain/LangGraph 构建的高级代理框架
- 内置规划、待办事项(TODOs)、文件系统支持
- 支持子代理(subagents)与中间件,实现职责隔离
- 支持真实 Web 搜索与上下文卸载
- 相对新,生态和文档仍在完善
- 强依赖 LangChain 技术栈,学习成本叠加
- 更适合“深度推理”场景,不适合轻量级任务
PocketFlow - 极简设计(约 100 行核心代码)
- 无依赖、无厂商锁定
- 基于图结构,支持多智能体、RAG、任务分解等
- 非常适合教学、原型验证与 AI 编码代理辅助开发
- 功能高度精简,缺少企业级特性(如可观测性、安全控制)
- 社区规模小,扩展能力有限
- 需自行实现高级功能(如记忆、评估)
smolagents(Hugging Face) - 轻量级(核心代码约 1000 行)
- 首类支持“代码即动作”的 Code Agent
- 与 Hugging Face 生态无缝集成(模型、数据集、Space)
- 开发体验简洁,适合快速部署
- 功能聚焦特定范式(代码生成型代理)
- 缺乏复杂的多智能体协调机制
- 企业级部署能力尚未成熟
HelloAgents - 专为教学与学习设计,代码透明、结构清晰
- 基于 OpenAI 原生 API 从零构建,深入讲解 Agent 核心原理
- 包含完整教程(《从零开始构建智能体》),适合入门者
- 非生产级框架,功能有限
- 仅支持 OpenAI 模型,扩展性弱
- 社区主要用于教育,不适合工业部署

具体使用

  • 企业级复杂系统推荐:Microsoft Agent Framework、LangGraph、DeepAgents、Semantic Kernel。
  • 研究与快速原型推荐:AutoGen、CrewAI、LangChain、smolagents。
  • 极简/教学用途推荐:PocketFlow、HelloAgents。
  • 特定能力突出:Crawl4AI(数据抓取)、Claude SDK(编码代理)、Haystack(RAG 智能体)。
    实际选型应结合模型生态、团队技能栈、部署环境与可维护性综合评估。

About

Agent学习笔记。

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published