LangChain 是一个用于开发由语言模型驱动的应用程序的框架。他们的框架使您能够构建具有上下文感知能力的分层LLM驱动应用程序,这些应用程序能够作为代理与其环境动态交互,从而简化您的代码,并为您的客户提供更具动态性的用户体验。
LLMs面临的最常见挑战之一是克服其训练数据的缺乏时效性和特定性 - 答案可能过时,并且由于其知识库的巨大多样性,它们容易产生幻觉。工具是让LLM能够在受控环境中回答问题的一个很好的方法,这些环境利用您现有的知识库和内部API - 而不是试图将LLM一直引导到您预期的答案,您允许它访问工具,动态调用信息,解析并提供给客户。
- 设置: 导入包并连接到Pinecone向量数据库。
- LLM代理: 构建一个代理,利用修改版的ReAct框架进行思维链推理。
- 带历史记录的LLM代理: 为LLM提供对对话中先前步骤的访问权限。
- 知识库: 创建一 个“你应该知道的事情”播客剧集的知识库,以便通过工具访问。
- 带工具的LLM代理: 扩展代理以访问多个工具,并测试它是否使用这些工具来回答问题。
您可以将Pinecone替换为任何其他vectorstore或数据库 - Langchain原生支持一些选择,而其他连接器将需要您自己开发。
# Langchain 导入
from langchain.agents import Tool, AgentExecutor, LLMSingleActionAgent, AgentOutputParser
from langchain.prompts import BaseChatPromptTemplate, ChatPromptTemplate
from langchain import SerpAPIWrapper, LLMChain
from langchain.schema import AgentAction, AgentFinish, HumanMessage, SystemMessage
# 大型语言模型封装器
from langchain.chat_models import ChatOpenAI
from langchain import OpenAI
# 对话记忆
from langchain.memory import ConversationBufferWindowMemory
# 嵌入与向量存储
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.vectorstores import Pinecone
# 向量存储索引
index_name = 'podcasts'
api_key = os.getenv("PINECONE_API_KEY") or "PINECONE_API_KEY"
# 在Pinecone控制台中找到您的API密钥旁边的环境
pinecone.init(api_key=api_key, environment=env)
# 检查是否已存在同名索引 - 如果是,则删除
if index_name in pinecone.list_indexes():
# 创建新索引
pinecone.create_index(name=index_name, dimension=1536)
index = pinecone.Index(index_name=index_name)
# 确认我们的索引已创建
我们 将运用一些核心概念来创建一个代理,使其按照我们希望的方式进行对话,可以使用工具来回答问题,并使用适当的语言模型来驱动对话。 -
提示模板: 控制LLM行为的输入模板,以及它如何接受输入并生成输出 -
这是驱动应用程序的大脑(文档)。 -
一种解析LLM输出的方法。如果LLM使用特定标头生成输出,您可以启用复杂的交互,其中变量由LLM在其响应中生成,并传递到链条的下一步骤中(文档)。 -
LLM链条: 一个链条将提示模板与将执行它的LLM结合在一起 -
,但这个框架也可以与OpenAI完成模型或其他完全不同的LLM一起使用(文档)。 -
LLM可以使用的外部服务,用于检索信息或执行命令,如果用户需要的话(文档)。 -
注意: 在使用此手册与搜索工具之前,您需要在 https://serpapi.com/
# 启动搜索工具 - 请注意,您需要按照上述说明将 SERPAPI_API_KEY 设置为环境变量。
search = SerpAPIWrapper()
# 定义一个工具列表
tools = [
name = "Search",
description="useful for when you need to answer questions about current events"
# 为工具、用户输入和模型记录其工作过程的便签板设置输入变量提示。
template = """Answer the following questions as best you can, but speaking as a pirate might speak. You have access to the following tools:
Use the following format:
Question: the input question you must answer
Thought: you should always think about what to do
Action: the action to take, should be one of [{tool_names}]
Action Input: the input to the action
Observation: the result of the action
... (this Thought/Action/Action Input/Observation can repeat N times)
Thought: I now know the final answer
Final Answer: the final answer to the original input question
Begin! Remember to speak as a pirate when giving your final answer. Use lots of "Arg"s
Question: {input}
# 创建一个提示模板
class CustomPromptTemplate(BaseChatPromptTemplate):
# 所使用的模板
template: str
# 可用工具清单
tools: List[Tool]
def format_messages(self, **kwargs) -> str:
# 获取中间步骤(AgentAction、Observation 元组)
# 以特定方式格式化它们
intermediate_steps = kwargs.pop("intermediate_steps")
thoughts = ""
for action, observation in intermediate_steps:
thoughts += action.log
thoughts += f"\nObservation: {observation}\nThought: "
# 将 `agent_scratchpad` 变量设置为该值。
kwargs["agent_scratchpad"] = thoughts
# 从提供的工具列表中创建一 个名为 tools 的变量。
kwargs["tools"] = "\n".join([f"{tool.name}: {tool.description}" for tool in self.tools])
# 创建一个所提供工具的名称列表
kwargs["tool_names"] = ", ".join([tool.name for tool in self.tools])
formatted = self.template.format(**kwargs)
return [HumanMessage(content=formatted)]
prompt = CustomPromptTemplate(
# 这省略了 `agent_scratchpad`、`tools` 和 `tool_names` 变量,因为这些是动态生成的。
# 这包括了 `intermediate_steps` 变量,因为它是必需的。
input_variables=["input", "intermediate_steps"]
class CustomOutputParser(AgentOutputParser):
def parse(self, llm_output: str) -> Union[AgentAction, AgentFinish]:
# 检查代理是否应结束
if "Final Answer:" in llm_output:
return AgentFinish(
# 返回值通常总是一个包含单个 `output` 键的字典。
# 目前不建议尝试其他任何操作 :)
return_values={"output": llm_output.split("Final Answer:")[-1].strip()},
# 解析出动作和动作输入
regex = r"Action: (.*?)[\n]*Action Input:[\s]*(.*)"
match = re.search(regex, llm_output, re.DOTALL)
# 如果无法解析输出,它会引发一个错误
# 您可以在这里添加自己的逻辑来以不同方式处理错误,例如传递给人工处理,给出一个标准回复
if not match:
raise ValueError(f"Could not parse LLM output: `{llm_output}`")
action = match.group(1).strip()
action_input = match.group(2)
# 返回动作和动作输入
return AgentAction(tool=action, tool_input=action_input.strip(" ").strip('"'), log=llm_output)
output_parser = CustomOutputParser()
# 启动我们的LLM - 默认设置为 'gpt-3.5-turbo'
llm = ChatOpenAI(temperature=0)
# 由大型语言模型(LLM)和提示组成的LLM链
llm_chain = LLMChain(llm=llm, prompt=prompt)
# 利用工具,LLM链和输出解析器来构建一个智能体
tool_names = [tool.name for tool in tools]
agent = LLMSingleActionAgent(
# We use "Observation" as our stop sequence so it will stop when it receives Tool output
# 如果你更改了提示模板,你也需要相应地进行调整。
# 启动将响应我们查询的代理程序。
# 将 verbose 设置为 True,以分享 LLM 进行 CoT 推理的过程。
agent_executor = AgentExecutor.from_agent_and_tools(agent=agent, tools=tools, verbose=True)
agent_executor.run("How many people live in canada as of 2023?")
# 创建一个提示模板,能够插入历史记录
template_with_history = """You are SearchGPT, a professional search engine who provides informative answers to users. Answer the following questions as best you can. You have access to the following tools:
Use the following format:
Question: the input question you must answer
Thought: you should always think about what to do
Action: the action to take, should be one of [{tool_names}]
Action Input: the input to the action
Observation: the result of the action
... (this Thought/Action/Action Input/Observation can repeat N times)
Thought: I now know the final answer
Final Answer: the final answer to the original input question
Begin! Remember to give detailed, informative answers
Previous conversation history:
New question: {input}
prompt_with_history = CustomPromptTemplate(
# The history template includes "history" as an input variable so we can interpolate it into the prompt
input_variables=["input", "intermediate_steps", "history"]
llm_chain = LLMChain(llm=llm, prompt=prompt_with_history)
tool_names = [tool.name for tool in tools]
agent = LLMSingleActionAgent(
# 以k=2初始化记忆,保留最近两次的回合。
# 将记忆提供给代理
memory = ConversationBufferWindowMemory(k=2)
agent_executor = AgentExecutor.from_agent_and_tools(agent=agent, tools=tools, verbose=True, memory=memory)
agent_executor.run("How many people live in canada as of 2023?")
在这个示例中,我们将使用《Stuff You Should Know》播客的文字记录,这些记录是由OSF DOI 10.17605/OSF.IO/VM9NT提供的。
import wget
# 以下是一个包含转录播客的压缩文件的网址。
# Note that this data has already been split into chunks and embeddings from OpenAI's `text-embedding-3-small` embedding model are included
content_url = 'https://cdn.openai.com/API/examples/data/sysk_podcast_transcripts_embedded.json.zip'
# 下载文件(文件大小约为541MB,因此需要一些时间)
