BiliBiliLoader#

class langchain_community.document_loaders.bilibili.BiliBiliLoader(video_urls: List[str], sessdata: str = '', bili_jct: str = '', buvid3: str = '')[source]#

从BiliBili视频中加载获取字幕。

使用BiliBili视频URL和认证cookie初始化加载器。 如果没有提供认证cookie,加载器将无法获取字幕 并且只会获取视频信息。

Parameters:
  • video_urls (List[str]) – B站视频URL列表。

  • sessdata (str) – 用于身份验证的SESSDATA cookie值。

  • bili_jct (str) – 用于身份验证的BILI_JCT cookie值。

  • buvid3 (str) – 用于身份验证的BUVI3 cookie值。

方法

__init__(video_urls[, sessdata, bili_jct, ...])

使用BiliBili视频URL和认证cookies初始化加载器。

alazy_load()

文档的懒加载器。

aload()

将数据加载到Document对象中。

lazy_load()

一个用于文档的懒加载器。

load()

加载并返回包含视频转录文本的文档列表。

load_and_split([text_splitter])

加载文档并将其分割成块。

__init__(video_urls: List[str], sessdata: str = '', bili_jct: str = '', buvid3: str = '')[来源]#

使用BiliBili视频URL和认证cookie初始化加载器。 如果没有提供认证cookie,加载器将无法获取字幕 并且只会获取视频信息。

Parameters:
  • video_urls (List[str]) – B站视频URL列表。

  • sessdata (str) – 用于身份验证的SESSDATA cookie值。

  • bili_jct (str) – 用于身份验证的BILI_JCT cookie值。

  • buvid3 (str) – 用于身份验证的BUVI3 cookie值。

async alazy_load() AsyncIterator[Document]#

文档的懒加载器。

Return type:

AsyncIterator[Document]

async aload() list[Document]#

将数据加载到Document对象中。

Return type:

列表[Document]

lazy_load() Iterator[Document]#

文档的懒加载器。

Return type:

迭代器[文档]

load() List[Document][source]#

加载并返回包含视频转录文本的文档列表。

Returns:

文档对象的转录和元数据列表。

Return type:

列表[Document]

load_and_split(text_splitter: TextSplitter | None = None) list[Document]#

加载文档并将其分割成块。块以文档形式返回。

不要重写此方法。它应该被视为已弃用!

Parameters:

text_splitter (可选[TextSplitter]) – 用于分割文档的TextSplitter实例。 默认为RecursiveCharacterTextSplitter。

Returns:

文档列表。

Return type:

列表[Document]

使用 BiliBiliLoader 的示例