Skip to main content

rspace

这份笔记展示了如何使用 RSpace 文档加载器将研究笔记和文档从 RSpace 电子实验室笔记本导入到 Langchain 流程中。

首先,您需要一个 RSpace 账户和一个 API 密钥。

您可以在 https://community.researchspace.com 上设置一个免费账户,或者使用您的机构提供的 RSpace 账户。

您可以从您账户的个人资料页面获取 RSpace API 令牌。

%pip install --upgrade --quiet  rspace_client

最好将您的 RSpace API 密钥存储为环境变量。

RSPACE_API_KEY=<YOUR_KEY>

您还需要设置您的 RSpace 安装的 URL,例如:

RSPACE_URL=https://community.researchspace.com

如果您使用这些确切的环境变量名称,它们将被自动检测。

from langchain_community.document_loaders.rspace import RSpaceLoader

您可以从 RSpace 导入各种项目:

  • 单个 RSpace 结构化或基本文档。这将与 Langchain 文档一一对应。

  • 一个文件夹或笔记本。笔记本或文件夹中的所有文档都将作为 Langchain 文档导入。

  • 如果您在 RSpace 图库中有 PDF 文件,这些也可以单独导入。在幕后,Langchain 的 PDF 加载器将被使用,并且这将为每个 PDF 页创建一个 Langchain 文档。

## 用您自己研究笔记中的一些 ID 替换这些 ID。
## 确保使用全局 ID(带有 2 个字符的前缀)。这有助于加载器知道要进行哪些 API 调用到 RSpace API。
rspace_ids = ["NB1932027", "FL1921314", "SD1932029", "GL1932384"]
for rs_id in rspace_ids:
loader = RSpaceLoader(global_id=rs_id)
docs = loader.load()
for doc in docs:
## 名称和 ID 被添加到 'source' 元数据属性中。
print(doc.metadata)
print(doc.page_content[:500])

如果您不想像上面那样使用环境变量,您可以将这些传递给 RSpaceLoader。

loader = RSpaceLoader(
global_id=rs_id, api_key="MY_API_KEY", url="https://my.researchspace.com"
)

Was this page helpful?


You can leave detailed feedback on GitHub.