Google Drive阅读器¶
演示了我们的Google Drive数据连接器。
先决条件¶
按照这些步骤设置您的环境。
- 在您的GCP项目中启用Google Drive API。
- 为您的GCP项目配置OAuth同意屏幕。
- 如果您不在Google Workspace中,可以将其设置为“External”。
- 为您的应用程序(此笔记本)创建客户端凭据。
- 确保将应用程序类型设置为“桌面应用程序”。
- 将这些客户端凭据移动到此笔记本所在的目录,并将其命名为“credentials.json”。
如果您在colab上打开这个笔记本,您可能需要安装LlamaIndex 🦙。
In [ ]:
Copied!
%pip install llama-index llama-index-readers-google
%pip install llama-index llama-index-readers-google
In [ ]:
Copied!
import logging
import sys
logging.basicConfig(stream=sys.stdout, level=logging.INFO)
logging.getLogger().addHandler(logging.StreamHandler(stream=sys.stdout))
import logging
import sys
logging.basicConfig(stream=sys.stdout, level=logging.INFO)
logging.getLogger().addHandler(logging.StreamHandler(stream=sys.stdout))
In [ ]:
Copied!
from llama_index.core import SummaryIndex
from llama_index.readers.google import GoogleDriveReader
from IPython.display import Markdown, display
from llama_index.core import SummaryIndex
from llama_index.readers.google import GoogleDriveReader
from IPython.display import Markdown, display
选择要读取的文件夹¶
您可以通过转到Google Drive中的文件夹,然后选择URL的最后部分来找到文件夹ID。
例如,对于此URL:https://drive.google.com/drive/u/0/folders/abcdefgh12345678
,文件夹ID是abcdefgh12345678
In [ ]:
Copied!
# 用你选择的文件夹ID替换占位符folder_id = ["<your_folder_id>"]# 确保当前目录(data_connectors)中存在credentials.json文件documents = GoogleDriveReader().load_data(folder_id=folder_id)
# 用你选择的文件夹ID替换占位符folder_id = [""]# 确保当前目录(data_connectors)中存在credentials.json文件documents = GoogleDriveReader().load_data(folder_id=folder_id)
In [ ]:
Copied!
index = SummaryIndex.from_documents(documents)
index = SummaryIndex.from_documents(documents)
In [ ]:
Copied!
# 将日志级别设置为DEBUG,以获得更详细的输出query_engine = index.as_query_engine()response = query_engine.query("<query_text>")
# 将日志级别设置为DEBUG,以获得更详细的输出query_engine = index.as_query_engine()response = query_engine.query("")
In [ ]:
Copied!
display(Markdown(f"<b>{response}</b>"))
display(Markdown(f"{response}"))