Skip to main content
Open In ColabOpen on GitHub

AWS S3 目录

Amazon Simple Storage Service (Amazon S3) 是一个对象存储服务

AWS S3 目录

这涵盖了如何从AWS S3 Directory对象加载文档对象。

%pip install --upgrade --quiet  boto3
from langchain_community.document_loaders import S3DirectoryLoader
API Reference:S3DirectoryLoader
loader = S3DirectoryLoader("testing-hwc")
loader.load()

指定前缀

您还可以指定一个前缀,以便更精细地控制要加载的文件。

loader = S3DirectoryLoader("testing-hwc", prefix="fake")
loader.load()
[Document(page_content='Lorem ipsum dolor sit amet.', lookup_str='', metadata={'source': 's3://testing-hwc/fake.docx'}, lookup_index=0)]

配置 AWS Boto3 客户端

您可以通过在创建S3DirectoryLoader时传递命名参数来配置AWS Boto3客户端。这在无法将AWS凭证设置为环境变量的情况下非常有用。请参阅可配置参数列表

loader = S3DirectoryLoader(
"testing-hwc", aws_access_key_id="xxxx", aws_secret_access_key="yyyy"
)
loader.load()

这个页面有帮助吗?