YoutubeLoader#

class langchain_community.document_loaders.youtube.YoutubeLoader(video_id: str, add_video_info: bool = False, language: str | Sequence[str] = 'en', translation: str | None = None, transcript_format: TranscriptFormat = TranscriptFormat.TEXT, continue_on_failure: bool = False, chunk_size_seconds: int = 120)[source]#

加载 YouTube 视频字幕。

使用YouTube视频ID进行初始化。

方法

__init__(video_id[, add_video_info, ...])

使用YouTube视频ID进行初始化。

alazy_load()

一个用于文档的懒加载器。

aload()

将数据加载到Document对象中。

extract_video_id(youtube_url)

从常见的YouTube URL中提取视频ID。

from_youtube_url(youtube_url, **kwargs)

给定一个YouTube URL,构造一个加载器。

lazy_load()

一个用于文档的懒加载器。

load()

将YouTube字幕加载到Document对象中。

load_and_split([text_splitter])

加载文档并将其分割成块。

Parameters:
  • video_id (str)

  • add_video_info (bool)

  • 语言 (联合[字符串, 序列[字符串]])

  • 翻译 (可选[str])

  • transcript_format (TranscriptFormat)

  • continue_on_failure (bool)

  • chunk_size_seconds (int)

__init__(video_id: str, add_video_info: bool = False, language: str | Sequence[str] = 'en', translation: str | None = None, transcript_format: TranscriptFormat = TranscriptFormat.TEXT, continue_on_failure: bool = False, chunk_size_seconds: int = 120)[来源]#

使用YouTube视频ID进行初始化。

Parameters:
  • video_id (str)

  • add_video_info (bool)

  • 语言 (str | Sequence[str])

  • 翻译 (str | None)

  • transcript_format (TranscriptFormat)

  • continue_on_failure (bool)

  • chunk_size_seconds (int)

async alazy_load() AsyncIterator[Document]#

文档的懒加载器。

Return type:

AsyncIterator[Document]

async aload() list[Document]#

将数据加载到Document对象中。

Return type:

列表[Document]

static extract_video_id(youtube_url: str) str[来源]#

从常见的YouTube URL中提取视频ID。

Parameters:

youtube_url (str)

Return type:

字符串

classmethod from_youtube_url(youtube_url: str, **kwargs: Any) YoutubeLoader[source]#

给定一个YouTube URL,构建一个加载器。 有关关键字参数的列表,请参见YoutubeLoader()构造函数。

Parameters:
  • youtube_url (str)

  • kwargs (Any)

Return type:

YoutubeLoader

lazy_load() Iterator[Document]#

文档的懒加载器。

Return type:

迭代器[文档]

load() List[Document][来源]#

将YouTube字幕加载到Document对象中。

Return type:

列表[文档]

load_and_split(text_splitter: TextSplitter | None = None) list[Document]#

加载文档并将其分割成块。块以文档形式返回。

不要重写此方法。它应该被视为已弃用!

Parameters:

text_splitter (可选[TextSplitter]) – 用于分割文档的TextSplitter实例。 默认为RecursiveCharacterTextSplitter。

Returns:

文档列表。

Return type:

列表[Document]

使用 YoutubeLoader 的示例