Skip to content

从 gemini-cli 学习构建 AI Agent

通过生产级源码掌握 Agent 开发核心技术

为什么选择 gemini-cli 作为学习案例?

gemini-cli 是 Google 开源的终端 AI Agent,它展示了:

  • 完整的 Agent 架构 - 从 API 调用到工具执行的完整流程
  • 生产级代码质量 - TypeScript 类型安全、测试完善、架构清晰
  • 真实的复杂度 - 处理了流式响应、上下文管理、循环检测等现实问题

学习路径

概念 → API → 工具 → 循环 → 源码 → 实战
  1. 核心概念 - 理解什么是 AI Agent,ReAct 模式是什么
  2. LLM API - 学习如何调用 Gemini API,处理流式响应
  3. 工具系统 - 掌握 Function Calling,实现自定义工具
  4. Agent 循环 - 理解循环结构、状态管理、循环检测
  5. 源码走读 - 深入 gemini-cli 的 Core 包实现
  6. 动手实战 - 构建自己的迷你 Agent

快速开始

如果你想快速了解 Agent 是什么:

typescript
// AI Agent 的本质就是这个循环
while (true) {
  const response = await llm.chat(messages)

  if (response.hasToolCall()) {
    const result = await executeTool(response.toolCall)
    messages.push({ role: 'tool', content: result })
  } else {
    return response.text() // 完成
  }
}

想了解更多?开始学习 →

通过实际源码学习 AI Agent 开发