langchain_community.document_loaders.bilibili.BiliBiliLoader

class langchain_community.document_loaders.bilibili.BiliBiliLoader(video_urls: List[str], sessdata: str = '', bili_jct: str = '', buvid3: str = '')[source]

从BiliBili视频中获取字幕。

使用BiliBili视频URL和认证cookie初始化加载器。 如果没有提供认证cookie,加载器将无法获取字幕,只能获取视频信息。

参数:

video_urls(List[str]):BiliBili视频URL列表。 sessdata(str):用于认证的SESSDATA cookie值。 bili_jct(str):用于认证的BILI_JCT cookie值。 buvid3(str):用于认证的BUVI3 cookie值。

Methods

__init__(video_urls[, sessdata, bili_jct, ...])

使用BiliBili视频URL和认证cookie初始化加载器。 如果没有提供认证cookie,加载器将无法获取字幕,只能获取视频信息。

alazy_load()

一个用于文档的惰性加载器。

aload()

将数据加载到文档对象中。

lazy_load()

一个用于文档的惰性加载器。

load()

加载并返回包含视频转录的文档列表。

load_and_split([text_splitter])

加载文档并分割成块。块作为文档返回。

Parameters
  • video_urls (List[str]) –

  • sessdata (str) –

  • bili_jct (str) –

  • buvid3 (str) –

__init__(video_urls: List[str], sessdata: str = '', bili_jct: str = '', buvid3: str = '')[source]

使用BiliBili视频URL和认证cookie初始化加载器。 如果没有提供认证cookie,加载器将无法获取字幕,只能获取视频信息。

参数:

video_urls(List[str]):BiliBili视频URL列表。 sessdata(str):用于认证的SESSDATA cookie值。 bili_jct(str):用于认证的BILI_JCT cookie值。 buvid3(str):用于认证的BUVI3 cookie值。

Parameters
  • video_urls (List[str]) –

  • sessdata (str) –

  • bili_jct (str) –

  • buvid3 (str) –

async alazy_load() AsyncIterator[Document]

一个用于文档的惰性加载器。

Return type

AsyncIterator[Document]

async aload() List[Document]

将数据加载到文档对象中。

Return type

List[Document]

lazy_load() Iterator[Document]

一个用于文档的惰性加载器。

Return type

Iterator[Document]

load() List[Document][source]

加载并返回包含视频转录的文档列表。

返回:

List[Document]: 包含转录和元数据的Document对象列表。

Return type

List[Document]

load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document]

加载文档并分割成块。块作为文档返回。

不要覆盖此方法。应该被视为已弃用!

参数:
text_splitter: 用于分割文档的TextSplitter实例。

默认为RecursiveCharacterTextSplitter。

返回:

文档列表。

Parameters

text_splitter (Optional[TextSplitter]) –

Return type

List[Document]

Examples using BiliBiliLoader