什么是ReAct（Reason + Act）范式？

核心知识点讲解

ReAct范式的定义

ReAct是一种结合了推理（Reasoning） 和行动（Action） 的智能体范式，由Google Research在2022年提出。它的核心思想是让智能体在解决问题时，像人类一样交替进行思考（推理）和行动（执行任务）。

ReAct的基本原理

ReAct范式的工作流程通常包括以下步骤：

观察（Observation）：智能体接收外部环境的信息
思考（Thought/Reasoning）：智能体分析当前状态，制定计划
行动（Action）：智能体执行具体操作，与环境交互
反馈（Feedback）：智能体接收行动的结果
循环：重复上述过程，直到完成任务

ReAct与其他范式的对比

范式	特点	优势	局限性
ReAct	结合推理和行动	灵活性高，能处理复杂任务	实现复杂度较高
仅推理	只进行思考，不执行行动	实现简单	无法与外部环境交互
仅行动	直接执行行动，不进行思考	执行效率高	缺乏适应性和规划能力
RAG	检索增强生成	知识获取能力强	推理能力有限

ReAct的关键优势

增强推理能力：通过显式的推理步骤，智能体能够更好地处理复杂的逻辑问题
提高可靠性：推理过程可以帮助智能体识别和纠正错误
增强可解释性：推理步骤使智能体的决策过程更加透明
更好的环境适应性：通过与环境的交互，智能体能够适应不同的场景
减少幻觉：与环境的交互可以验证智能体的假设，减少错误信息的产生

实用案例分析

案例1：使用ReAct范式解决问答问题

from langchain.prompts import PromptTemplate
from langchain.llms import OpenAI
from langchain.chains import LLMChain

# ReAct提示词模板
react_prompt = PromptTemplate(
    template="""你是一个使用ReAct范式的智能体。请按照以下格式回答问题：

问题: {question}

思考: [你的思考过程]
行动: [你要执行的行动]
观察: [行动的结果]
... (重复思考-行动-观察步骤)
思考: [最终思考]
回答: [你的最终答案]

请根据问题，通过思考和行动来找到正确答案。
""",
    input_variables=["question"]
)

# 初始化语言模型
llm = OpenAI(temperature=0.7)

# 创建ReAct链
react_chain = LLMChain(
    llm=llm,
    prompt=react_prompt,
    verbose=True
)

# 运行链
result = react_chain.run("如何制作一杯完美的意式浓缩咖啡？")
print(result)

案例2：使用ReAct范式与外部工具交互

from langchain.prompts import PromptTemplate
from langchain.llms import OpenAI
from langchain.chains import LLMChain
from langchain.tools import Tool
from langchain.utilities import SerpAPIWrapper

# 初始化搜索工具
search = SerpAPIWrapper()
search_tool = Tool(
    name="Search",
    func=search.run,
    description="用于搜索网络信息"
)

# ReAct提示词模板，包含工具使用
react_with_tools_prompt = PromptTemplate(
    template="""你是一个使用ReAct范式的智能体，可以使用搜索工具来获取信息。请按照以下格式回答问题：

可用工具:
Search: 用于搜索网络信息

问题: {question}

思考: [你的思考过程]
行动: [你要执行的行动，例如：Search[关键词]]
观察: [行动的结果，由系统提供]
... (重复思考-行动-观察步骤)
思考: [最终思考]
回答: [你的最终答案]

请根据问题，通过思考和使用工具来找到正确答案。
""",
    input_variables=["question"]
)

# 初始化语言模型
llm = OpenAI(temperature=0.7)

# 创建ReAct链
react_chain = LLMChain(
    llm=llm,
    prompt=react_with_tools_prompt,
    verbose=True
)

# 运行链（简化版，实际应用中需要处理工具调用和观察结果）
result = react_chain.run("2023年世界杯冠军是谁？")
print(result)

案例3：LangChain中的ReAct智能体实现

from langchain.agents import initialize_agent, AgentType
from langchain.llms import OpenAI
from langchain.tools import Tool
from langchain.utilities import SerpAPIWrapper, Calculator

# 初始化工具
search = SerpAPIWrapper()
calculator = Calculator()

tools = [
    Tool(
        name="Search",
        func=search.run,
        description="用于搜索网络信息"
    ),
    Tool(
        name="Calculator",
        func=calculator.run,
        description="用于进行数学计算"
    )
]

# 初始化语言模型
llm = OpenAI(temperature=0.7)

# 初始化ReAct智能体
agent = initialize_agent(
    tools=tools,
    llm=llm,
    agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
    verbose=True
)

# 运行智能体
result = agent.run("2023年世界杯冠军是谁？这个国家的人口大约是多少？")
print(result)

代码解析

案例1：基本ReAct实现

ReAct提示词模板：设计了包含思考、行动、观察步骤的提示词模板
语言模型：使用OpenAI模型生成推理和行动
运行链：通过LLMChain运行ReAct流程

案例2：带工具调用的ReAct

工具初始化：创建了搜索工具，用于获取外部信息
增强提示词：在提示词中添加了工具使用说明
思考-行动循环：智能体可以通过搜索工具获取信息，然后基于信息进行推理

案例3：LangChain内置ReAct智能体

工具集：集成了搜索和计算器工具
智能体初始化：使用initialize_agent创建ReAct智能体，指定AgentType.ZERO_SHOT_REACT_DESCRIPTION
复杂任务：处理需要多个步骤和工具调用的复杂问题

ReAct的工作流程详解

标准ReAct流程

观察 → 思考 → 行动 → 观察 → 思考 → 行动 → ... → 思考 → 回答

详细步骤解析

观察（Observation）：
- 接收用户问题或环境状态
- 处理输入信息，提取关键信息
思考（Thought）：
- 分析当前状态和目标
- 制定行动计划
- 评估可能的行动方案
行动（Action）：
- 执行选定的行动
- 与外部环境或工具交互
- 可能的行动包括：搜索信息、使用工具、执行计算等
观察（Observation）：
- 接收行动的结果
- 处理反馈信息
循环：
- 重复思考-行动-观察步骤
- 直到找到答案或达到最大迭代次数
回答（Answer）：
- 基于所有思考和观察，生成最终答案
- 总结解决问题的过程

ReAct的优势与局限性

优势

增强问题解决能力：通过推理和行动的结合，能处理更复杂的问题
提高答案准确性：与环境的交互可以验证假设，减少错误
更好的可解释性：显式的推理步骤使决策过程更加透明
更强的适应性：能适应不同的问题类型和环境
减少幻觉：通过外部验证，减少模型生成的错误信息

局限性

实现复杂度：相比简单的问答系统，ReAct实现更复杂
推理成本：额外的推理步骤会增加计算成本和响应时间
工具依赖：需要合适的工具来支持行动步骤
上下文长度限制：推理过程可能会超出模型的上下文窗口
训练数据需求：需要高质量的ReAct格式训练数据

实际应用场景

1. 复杂问答系统

ReAct范式特别适合需要多步推理和信息获取的复杂问答任务，例如：

需要搜索最新信息的问题
需要多源信息综合分析的问题
需要逻辑推理的问题

2. 任务规划与执行

ReAct可以用于需要规划和执行多步任务的场景，例如：

旅行规划（查询航班、酒店、景点）
购物助手（比较产品、查找优惠）
研究助手（收集资料、整理信息）

3. 教育与辅导

ReAct可以作为教育工具，通过展示思考过程来帮助学生学习：

解题辅导（展示解题思路）
语言学习（思考语法规则）
科学实验（设计实验步骤）

高级应用：ReAct与其他技术的结合

ReAct + RAG

结合检索增强生成（RAG）技术，ReAct可以更有效地获取和使用外部知识：

from langchain.agents import initialize_agent, AgentType
from langchain.llms import OpenAI
from langchain.tools import Tool
from langchain.vectorstores import Chroma
from langchain.embeddings import OpenAIEmbeddings
from langchain.document_loaders import TextLoader
from langchain.text_splitter import CharacterTextSplitter
from langchain.chains import RetrievalQA

# 加载文档并创建向量存储
loader = TextLoader("docs/ai_knowledge.txt")
documents = loader.load()
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
texts = text_splitter.split_documents(documents)
embeddings = OpenAIEmbeddings()
vectorstore = Chroma.from_documents(texts, embeddings)

# 创建检索工具
retrieval_qa = RetrievalQA.from_chain_type(
    llm=OpenAI(),
    chain_type="stuff",
    retriever=vectorstore.as_retriever()
)

retrieval_tool = Tool(
    name="DocumentRetrieval",
    func=retrieval_qa.run,
    description="用于从文档库中检索信息"
)

# 初始化智能体
llm = OpenAI(temperature=0.7)
agent = initialize_agent(
    tools=[retrieval_tool],
    llm=llm,
    agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
    verbose=True
)

# 运行智能体
result = agent.run("什么是人工智能？它的发展历史是怎样的？")
print(result)

ReAct + 多智能体系统

将ReAct范式应用于多智能体系统，实现更复杂的协作：

from langchain.agents import initialize_agent, AgentType
from langchain.llms import OpenAI
from langchain.tools import Tool
from langchain.utilities import SerpAPIWrapper, Calculator

# 初始化工具
search = SerpAPIWrapper()
calculator = Calculator()

# 创建不同领域的智能体
search_agent = initialize_agent(
    tools=[Tool(name="Search", func=search.run, description="用于搜索网络信息")],
    llm=OpenAI(temperature=0.7),
    agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
    verbose=True
)

math_agent = initialize_agent(
    tools=[Tool(name="Calculator", func=calculator.run, description="用于进行数学计算")],
    llm=OpenAI(temperature=0.7),
    agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
    verbose=True
)

# 协作解决问题
def collaborative_solve(question):
    if any(keyword in question for keyword in ["计算", "数学", "等于"]):
        return math_agent.run(question)
    else:
        return search_agent.run(question)

# 测试协作系统
result1 = collaborative_solve("2023年世界杯冠军是谁？")
print("搜索结果:", result1)

result2 = collaborative_solve("12345的平方根是多少？")
print("计算结果:", result2)

总结

ReAct（Reason + Act）范式是一种强大的智能体设计方法，通过结合推理和行动，使智能体能够更有效地解决复杂问题。它的核心优势在于：

增强的问题解决能力：能够处理需要多步推理和信息获取的复杂任务
提高的可靠性：通过与环境的交互验证假设，减少错误
更好的可解释性：显式的推理步骤使决策过程更加透明
更强的适应性：能适应不同的问题类型和环境

虽然ReAct实现起来比简单的问答系统复杂，但它在处理复杂任务时的优势是显而易见的。通过与RAG、多智能体系统等技术的结合，ReAct可以应用于更广泛的场景，为AI智能体的发展提供了新的思路。

课后思考

ReAct范式与传统的问答系统相比，有哪些本质区别？
如何设计有效的ReAct提示词模板？
ReAct范式在哪些场景下特别有效？在哪些场景下可能不是最佳选择？
如何评估ReAct智能体的性能？
ReAct范式的未来发展方向是什么？

在下一集中，我们将学习如何手撕源码：实现一个简单的ReAct智能体，通过实际编码来深入理解ReAct范式的工作原理。