YoutubeLoader#
- class langchain_community.document_loaders.youtube.YoutubeLoader(video_id: str, add_video_info: bool = False, language: str | Sequence[str] = 'en', translation: str | None = None, transcript_format: TranscriptFormat = TranscriptFormat.TEXT, continue_on_failure: bool = False, chunk_size_seconds: int = 120)[source]#
加载 YouTube 视频字幕。
使用YouTube视频ID进行初始化。
方法
__init__
(video_id[, add_video_info, ...])使用YouTube视频ID进行初始化。
一个用于文档的懒加载器。
aload
()将数据加载到Document对象中。
extract_video_id
(youtube_url)从常见的YouTube URL中提取视频ID。
from_youtube_url
(youtube_url, **kwargs)给定一个YouTube URL,构造一个加载器。
一个用于文档的懒加载器。
load
()将YouTube字幕加载到Document对象中。
load_and_split
([text_splitter])加载文档并将其分割成块。
- Parameters:
video_id (str)
add_video_info (bool)
语言 (联合[字符串, 序列[字符串]])
翻译 (可选[str])
transcript_format (TranscriptFormat)
continue_on_failure (bool)
chunk_size_seconds (int)
- __init__(video_id: str, add_video_info: bool = False, language: str | Sequence[str] = 'en', translation: str | None = None, transcript_format: TranscriptFormat = TranscriptFormat.TEXT, continue_on_failure: bool = False, chunk_size_seconds: int = 120)[来源]#
使用YouTube视频ID进行初始化。
- Parameters:
video_id (str)
add_video_info (bool)
语言 (str | Sequence[str])
翻译 (str | None)
transcript_format (TranscriptFormat)
continue_on_failure (bool)
chunk_size_seconds (int)
- static extract_video_id(youtube_url: str) str [来源]#
从常见的YouTube URL中提取视频ID。
- Parameters:
youtube_url (str)
- Return type:
字符串
- classmethod from_youtube_url(youtube_url: str, **kwargs: Any) YoutubeLoader [source]#
给定一个YouTube URL,构建一个加载器。 有关关键字参数的列表,请参见YoutubeLoader()构造函数。
- Parameters:
youtube_url (str)
kwargs (Any)
- Return type:
- load_and_split(text_splitter: TextSplitter | None = None) list[Document] #
加载文档并将其分割成块。块以文档形式返回。
不要重写此方法。它应该被视为已弃用!
- Parameters:
text_splitter (可选[TextSplitter]) – 用于分割文档的TextSplitter实例。 默认为RecursiveCharacterTextSplitter。
- Returns:
文档列表。
- Return type:
列表[Document]
使用 YoutubeLoader 的示例