langchain_community.document_loaders.bilibili
.BiliBiliLoader¶
- class langchain_community.document_loaders.bilibili.BiliBiliLoader(video_urls: List[str], sessdata: str = '', bili_jct: str = '', buvid3: str = '')[source]¶
从BiliBili视频中获取字幕。
使用BiliBili视频URL和认证cookie初始化加载器。 如果没有提供认证cookie,加载器将无法获取字幕,只能获取视频信息。
- 参数:
video_urls(List[str]):BiliBili视频URL列表。 sessdata(str):用于认证的SESSDATA cookie值。 bili_jct(str):用于认证的BILI_JCT cookie值。 buvid3(str):用于认证的BUVI3 cookie值。
Methods
__init__
(video_urls[, sessdata, bili_jct, ...])使用BiliBili视频URL和认证cookie初始化加载器。 如果没有提供认证cookie,加载器将无法获取字幕,只能获取视频信息。
一个用于文档的惰性加载器。
aload
()将数据加载到文档对象中。
一个用于文档的惰性加载器。
load
()加载并返回包含视频转录的文档列表。
load_and_split
([text_splitter])加载文档并分割成块。块作为文档返回。
- Parameters
video_urls (List[str]) –
sessdata (str) –
bili_jct (str) –
buvid3 (str) –
- __init__(video_urls: List[str], sessdata: str = '', bili_jct: str = '', buvid3: str = '')[source]¶
使用BiliBili视频URL和认证cookie初始化加载器。 如果没有提供认证cookie,加载器将无法获取字幕,只能获取视频信息。
- 参数:
video_urls(List[str]):BiliBili视频URL列表。 sessdata(str):用于认证的SESSDATA cookie值。 bili_jct(str):用于认证的BILI_JCT cookie值。 buvid3(str):用于认证的BUVI3 cookie值。
- Parameters
video_urls (List[str]) –
sessdata (str) –
bili_jct (str) –
buvid3 (str) –
- load() List[Document] [source]¶
加载并返回包含视频转录的文档列表。
- 返回:
List[Document]: 包含转录和元数据的Document对象列表。
- Return type
List[Document]
- load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document] ¶
加载文档并分割成块。块作为文档返回。
不要覆盖此方法。应该被视为已弃用!
- 参数:
- text_splitter: 用于分割文档的TextSplitter实例。
默认为RecursiveCharacterTextSplitter。
- 返回:
文档列表。
- Parameters
text_splitter (Optional[TextSplitter]) –
- Return type
List[Document]