format_document#
- langchain_core.prompts.base.format_document(doc: Document, prompt: BasePromptTemplate[str]) str [source]#
根据提示模板将文档格式化为字符串。
首先,这从文档的两个来源提取信息:
- page_content:
这将从document.page_content中获取信息并将其分配给名为page_content的变量。
- metadata:
这从document.metadata中获取信息并将其分配给同名的变量。
这些变量随后被传递到prompt中以生成格式化的字符串。
- Parameters:
doc (Document) – 文档,page_content 和 metadata 将用于创建最终的字符串。
prompt (BasePromptTemplate[str]) – BasePromptTemplate,将用于将page_content和metadata格式化为最终字符串。
- Returns:
文档格式化的字符串。
- Return type:
字符串
示例
from langchain_core.documents import Document from langchain_core.prompts import PromptTemplate doc = Document(page_content="This is a joke", metadata={"page": "1"}) prompt = PromptTemplate.from_template("Page {page}: {page_content}") format_document(doc, prompt) >>> "Page 1: This is a joke"