Reddit帖子加载器#
- class langchain_community.document_loaders.reddit.RedditPostsLoader(client_id: str, client_secret: str, user_agent: str, search_queries: Sequence[str], mode: str, categories: Sequence[str] = ['new'], number_posts: int | None = 10)[来源]#
加载Reddit帖子。
阅读子版块的帖子。 首先,你需要访问 https://www.reddit.com/prefs/apps/ 并创建你的应用程序
- Initialize with client_id, client_secret, user_agent, search_queries, mode,
类别,文章数量。
示例: https://www.reddit.com/r/learnpython/
- Parameters:
client_id (str) – Reddit 客户端 ID。
client_secret (str) – Reddit 客户端密钥。
user_agent (str) – Reddit 用户代理。
search_queries (Sequence[str]) – 搜索查询。
mode (str) – 模式。
categories (Sequence[str]) – 类别。默认值:[“new”]
number_posts (可选[int]) – 帖子数量。默认值:10
方法
__init__
(client_id, client_secret, ...[, ...])使用 client_id, client_secret, user_agent, search_queries, mode 进行初始化
文档的懒加载器。
aload
()将数据加载到Document对象中。
一个用于文档的懒加载器。
load
()加载Reddit帖子。
load_and_split
([text_splitter])加载文档并将其分割成块。
- __init__(client_id: str, client_secret: str, user_agent: str, search_queries: Sequence[str], mode: str, categories: Sequence[str] = ['new'], number_posts: int | None = 10)[source]#
- Initialize with client_id, client_secret, user_agent, search_queries, mode,
类别,文章数量。
示例: https://www.reddit.com/r/learnpython/
- Parameters:
client_id (str) – Reddit 客户端 ID。
client_secret (str) – Reddit 客户端密钥。
user_agent (str) – Reddit 用户代理。
search_queries (Sequence[str]) – 搜索查询。
mode (str) – 模式。
categories (Sequence[str]) – 类别。默认值:[“new”]
number_posts (int | None) – 帖子数量。默认值:10
- load_and_split(text_splitter: TextSplitter | None = None) list[Document] #
加载文档并将其分割成块。块以文档形式返回。
不要重写此方法。它应该被视为已弃用!
- Parameters:
text_splitter (可选[TextSplitter]) – 用于分割文档的TextSplitter实例。 默认为RecursiveCharacterTextSplitter。
- Returns:
文档列表。
- Return type:
列表[Document]
使用 RedditPostsLoader 的示例