JinaRerank#

class langchain_community.document_compressors.jina_rerank.JinaRerank[来源]#

基础类:BaseDocumentCompressor

使用Jina Rerank API的文档压缩器。

通过解析和验证来自关键字参数的输入数据来创建一个新模型。

如果输入数据无法验证以形成有效模型,则引发 [ValidationError][pydantic_core.ValidationError]。

self 被显式地设为仅位置参数,以允许 self 作为字段名称。

param jina_api_key: str | None = None#

Jina API 密钥。必须直接指定或通过环境变量 JINA_API_KEY 指定。

param model: str = 'jina-reranker-v1-base-en'#

用于重新排序的模型。

param session: Any = None#

用于与API通信的请求会话。

param top_n: int | None = 3#

返回的文档数量。

param user_agent: str = 'langchain'#

发出请求的应用程序的标识符。

async acompress_documents(documents: Sequence[Document], query: str, callbacks: list[BaseCallbackHandler] | BaseCallbackManager | None = None) Sequence[Document]#

根据查询上下文异步压缩检索到的文档。

Parameters:
Returns:

压缩的文档。

Return type:

序列[文档]

compress_documents(documents: Sequence[Document], query: str, callbacks: list[BaseCallbackHandler] | BaseCallbackManager | None = None) Sequence[Document][来源]#

使用Jina的Rerank API压缩文档。

Parameters:
Returns:

一系列压缩文档。

Return type:

序列[文档]

rerank(documents: Sequence[str | Document | dict], query: str, *, model: str | None = None, top_n: int | None = -1, max_chunks_per_doc: int | None = None) List[Dict[str, Any]][source]#

返回按与提供的查询的相关性排序的文档有序列表。

Parameters:
  • query (str) – 用于重新排序的查询。

  • documents (Sequence[str | Document | dict]) – 需要重新排序的文档序列。

  • model (str | None) – 用于重新排序的模型。默认为 self.model。

  • top_n (int | None) – 返回的结果数量。如果为None,则返回所有结果。 默认为self.top_n。

  • max_chunks_per_doc (int | None) – 从文档中派生的最大块数。

Return type:

列表[字典[str, 任意]]

使用 JinaRerank 的示例