BiliBiliLoader#
- class langchain_community.document_loaders.bilibili.BiliBiliLoader(video_urls: List[str], sessdata: str = '', bili_jct: str = '', buvid3: str = '')[source]#
从BiliBili视频中加载获取字幕。
使用BiliBili视频URL和认证cookie初始化加载器。 如果没有提供认证cookie,加载器将无法获取字幕 并且只会获取视频信息。
- Parameters:
video_urls (List[str]) – B站视频URL列表。
sessdata (str) – 用于身份验证的SESSDATA cookie值。
bili_jct (str) – 用于身份验证的BILI_JCT cookie值。
buvid3 (str) – 用于身份验证的BUVI3 cookie值。
方法
__init__
(video_urls[, sessdata, bili_jct, ...])使用BiliBili视频URL和认证cookies初始化加载器。
文档的懒加载器。
aload
()将数据加载到Document对象中。
一个用于文档的懒加载器。
load
()加载并返回包含视频转录文本的文档列表。
load_and_split
([text_splitter])加载文档并将其分割成块。
- __init__(video_urls: List[str], sessdata: str = '', bili_jct: str = '', buvid3: str = '')[来源]#
使用BiliBili视频URL和认证cookie初始化加载器。 如果没有提供认证cookie,加载器将无法获取字幕 并且只会获取视频信息。
- Parameters:
video_urls (List[str]) – B站视频URL列表。
sessdata (str) – 用于身份验证的SESSDATA cookie值。
bili_jct (str) – 用于身份验证的BILI_JCT cookie值。
buvid3 (str) – 用于身份验证的BUVI3 cookie值。
- load() List[Document] [source]#
加载并返回包含视频转录文本的文档列表。
- Returns:
文档对象的转录和元数据列表。
- Return type:
列表[Document]
- load_and_split(text_splitter: TextSplitter | None = None) list[Document] #
加载文档并将其分割成块。块以文档形式返回。
不要重写此方法。它应该被视为已弃用!
- Parameters:
text_splitter (可选[TextSplitter]) – 用于分割文档的TextSplitter实例。 默认为RecursiveCharacterTextSplitter。
- Returns:
文档列表。
- Return type:
列表[Document]
使用 BiliBiliLoader 的示例