langchain_community.document_loaders.youtube.GoogleApiYoutubeLoader

class langchain_community.document_loaders.youtube.GoogleApiYoutubeLoader(google_api_client: GoogleApiClient, channel_name: Optional[str] = None, video_ids: Optional[List[str]] = None, add_video_info: bool = True, captions_language: str = 'en', continue_on_failure: bool = False)[source]

从`YouTube`频道加载所有视频。

要使用,您应该已安装``googleapiclient, youtube_transcript_api`` python包。 由于服务需要一个google_api_client,您首先必须初始化GoogleApiClient。

另外,您必须提供一个频道名称或一个videoids列表 “https://developers.google.com/docs/api/quickstart/python

示例:
from langchain_community.document_loaders import GoogleApiClient
from langchain_community.document_loaders import GoogleApiYoutubeLoader
google_api_client = GoogleApiClient(
    service_account_path=Path("path_to_your_sec_file.json")
)
loader = GoogleApiYoutubeLoader(
    google_api_client=google_api_client,
    channel_name = "CodeAesthetic"
)
load.load()

Attributes

add_video_info

captions_language

channel_name

continue_on_failure

video_ids

google_api_client

Methods

__init__(google_api_client[, channel_name, ...])

alazy_load()

一个用于文档的惰性加载器。

aload()

将数据加载到文档对象中。

lazy_load()

一个用于文档的惰性加载器。

load()

加载文档。

load_and_split([text_splitter])

加载文档并分割成块。块作为文档返回。

validate_channel_or_videoIds_is_set(values)

验证folder_id或document_ids中的一个已设置,但不能同时设置两者。

Parameters
  • google_api_client (GoogleApiClient) –

  • channel_name (Optional[str]) –

  • video_ids (Optional[List[str]]) –

  • add_video_info (bool) –

  • captions_language (str) –

  • continue_on_failure (bool) –

Return type

None

__init__(google_api_client: GoogleApiClient, channel_name: Optional[str] = None, video_ids: Optional[List[str]] = None, add_video_info: bool = True, captions_language: str = 'en', continue_on_failure: bool = False) None
Parameters
  • google_api_client (GoogleApiClient) –

  • channel_name (Optional[str]) –

  • video_ids (Optional[List[str]]) –

  • add_video_info (bool) –

  • captions_language (str) –

  • continue_on_failure (bool) –

Return type

None

async alazy_load() AsyncIterator[Document]

一个用于文档的惰性加载器。

Return type

AsyncIterator[Document]

async aload() List[Document]

将数据加载到文档对象中。

Return type

List[Document]

lazy_load() Iterator[Document]

一个用于文档的惰性加载器。

Return type

Iterator[Document]

load() List[Document][source]

加载文档。

Return type

List[Document]

load_and_split(text_splitter: Optional[TextSplitter] = None) List[Document]

加载文档并分割成块。块作为文档返回。

不要覆盖此方法。应该被视为已弃用!

参数:
text_splitter: 用于分割文档的TextSplitter实例。

默认为RecursiveCharacterTextSplitter。

返回:

文档列表。

Parameters

text_splitter (Optional[TextSplitter]) –

Return type

List[Document]

classmethod validate_channel_or_videoIds_is_set(values: Dict[str, Any]) Dict[str, Any][source]

验证folder_id或document_ids中的一个已设置,但不能同时设置两者。

Parameters

values (Dict[str, Any]) –

Return type

Dict[str, Any]

Examples using GoogleApiYoutubeLoader