Mongodb
SimpleMongoReader #
基类: BaseReader
简易Mongo读取器。
将每个Mongo文档连接成LlamaIndex使用的Document。
参数:
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
host
|
str
|
Mongo主机。 |
None
|
port
|
int
|
Mongo端口。 |
None
|
Source code in llama-index-integrations/readers/llama-index-readers-mongodb/llama_index/readers/mongodb/base.py
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 |
|
lazy_load_data #
lazy_load_data(db_name: str, collection_name: str, field_names: List[str] = ['text'], separator: str = '', query_dict: Optional[Dict] = None, max_docs: int = 0, metadata_names: Optional[List[str]] = None, field_extractors: Optional[Dict[str, Callable[..., str]]] = None) -> Iterable[Document]
从输入目录加载数据。
参数:
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
db_name
|
str
|
数据库名称。 |
required |
collection_name
|
str
|
集合的名称。 |
required |
field_names(List[str])
|
需要连接的字段名称。 默认为 ["text"] |
required | |
separator
|
str
|
字段之间使用的分隔符。默认为"" |
''
|
query_dict
|
Optional[Dict]
|
查询以筛选文档。了解更多 |
None
|
at
|
[official docs](https
|
//www.mongodb.com/docs/manual/reference/method/db.collection.find/#std-label-method-find-query) 默认为None |
required |
max_docs
|
int
|
最大加载文档数量。 默认为0(无限制) |
0
|
metadata_names
|
Optional[List[str]]
|
要添加到文档元数据属性中的字段名称。默认为None |
None
|
field_extractors
|
Optional[Dict[str, Callable[..., str]]]
|
字典
包含字段名称和从该字段提取文本的函数。
默认的提取函数是 |
None
|
返回:
类型 | 描述 |
---|---|
Iterable[Document]
|
List[Document]: 文档列表。 |
Source code in llama-index-integrations/readers/llama-index-readers-mongodb/llama_index/readers/mongodb/base.py
46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 |
|