langchain_community.document_loaders.pubmed

from typing import Iterator, Optional

from langchain_core.documents import Document

from langchain_community.document_loaders.base import BaseLoader
from langchain_community.utilities.pubmed import PubMedAPIWrapper


[docs]class PubMedLoader(BaseLoader):
    """从`PubMed`生物医学库加载。

    属性：
        query: 要传递给PubMed API的查询。
        load_max_docs: 要加载的最大文档数。"""

[docs]    def __init__(
        self,
        query: str,
        load_max_docs: Optional[int] = 3,
    ):
        """初始化PubMedLoader。

参数：
    query：要传递给PubMed API的查询。
    load_max_docs：要加载的最大文档数。默认为3。
"""
        self.query = query
        self.load_max_docs = load_max_docs
        self._client = PubMedAPIWrapper(  # type: ignore[call-arg]
            top_k_results=load_max_docs,  # type: ignore[arg-type]
        )

[docs]    def lazy_load(self) -> Iterator[Document]:
        for doc in self._client.lazy_load_docs(self.query):
            yield doc
Source code for langchain_community.document_loaders.pubmed