Steamship
SteamshipFileReader #
Bases: BaseReader
读取持久的Steamship文件并将其转换为文档。
Parameters:
Name | Type | Description | Default |
---|---|---|---|
api_key |
Optional[str]
|
Steamship API密钥。如果未提供,默认为STEAMSHIP_API_KEY值。 |
None
|
注意
需要安装steamship
包和一个有效的Steamship API密钥。
要获取Steamship API密钥,请访问: https://steamship.com/account/api。
一旦获得API密钥,请通过名为STEAMSHIP_API_KEY
的环境变量公开它,或者将其作为初始化参数(api_key
)传递。
Source code in llama_index/readers/steamship/base.py
8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 |
|
load_data #
load_data(
workspace: str,
query: Optional[str] = None,
file_handles: Optional[List[str]] = None,
collapse_blocks: bool = True,
join_str: str = "\n\n",
) -> List[Document]
从持久Steamship文件中加载数据到文档中。
Parameters:
Name | Type | Description | Default |
---|---|---|---|
workspace |
str
|
Steamship工作区的句柄 (参见: https://docs.steamship.com/workspaces/index.html) |
required |
query |
Optional[str]
|
用于检索文件的Steamship标签查询 (例如: 'filetag and value("import-id")="import-001"') |
None
|
file_handles |
Optional[List[str]]
|
Steamship文件句柄的列表
(例如: |
None
|
collapse_blocks |
bool
|
是否将单独的文件块合并为单个文档,或者分开它们。 |
True
|
join_str |
str
|
当collapse_blocks为True时,这是如何连接块文本的方式。 |
'\n\n'
|
注意
来自query
和file_handles
的文件集合将被合并。目前不支持对集合进行解决冲突
(这意味着如果一个文件既出现在查询结果集中,又作为file_handles中的句柄,它将被加载两次)。
Source code in llama_index/readers/steamship/base.py
31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 |
|