MongoDB
MongoDB 是一种 NoSQL、面向文档的数据库,支持具有动态模式的类似 JSON 的文档。
概述
MongoDB 文档加载器从 MongoDB 数据库返回 Langchain 文档列表。
加载器需要以下参数:
MongoDB 连接字符串
MongoDB 数据库名称
MongoDB 集合名称
(可选)内容过滤器字典
(可选)要包含在输出中的字段名称列表
输出采用以下格式:
pageContent= Mongo 文档
metadata={'database': '[数据库名称]', 'collection': '[集合名称]'}
加载文档加载器
# 在 Jupyter Notebook 中运行时添加此导入
import nest_asyncio
nest_asyncio.apply()
from langchain_community.document_loaders.mongodb import MongodbLoader
loader = MongodbLoader(
connection_string="mongodb://localhost:27017/",
db_name="sample_restaurants",
collection_name="restaurants",
filter_criteria={"borough": "Bronx", "cuisine": "Bakery"},
field_names=["name", "address"],
)
docs = loader.load()
len(docs)
71
docs[0]
Document(page_content="Morris Park Bake Shop {'building': '1007', 'coord': [-73.856077, 40.848447], 'street': 'Morris Park Ave', 'zipcode': '10462'}", metadata={'database': 'sample_restaurants', 'collection': 'restaurants'})