跳到主要内容

网站搜索工具

!!! note "实验阶段" 网站搜索工具目前处于实验阶段。我们正在积极努力将该工具纳入我们的产品套件,并将相应更新文档。

描述

网站搜索工具旨在作为在网站内容中进行语义搜索的概念。它旨在利用像检索增强生成(RAG)这样的先进机器学习模型,以高效地浏览和提取指定 URL 中的信息。该工具旨在提供灵活性,允许用户在任何网站上执行搜索或专注于感兴趣的特定网站。请注意,网站搜索工具的当前实现细节正在开发中,所描述的功能可能尚不可访问。

安装

为了在网站搜索工具可用时准备好您的环境,您可以使用以下命令安装基础包:

pip install 'crewai[tools]'

此命令安装了必要的依赖项,以确保一旦工具完全集成,用户可以立即开始使用它。

示例用法

以下是网站搜索工具在不同场景下的使用示例。请注意,这些示例是说明性的,代表了计划中的功能:

from crewai_tools import WebsiteSearchTool

# 初始化工具,使代理可以在任何发现的网站上进行搜索
tool = WebsiteSearchTool()

# 限制搜索范围为特定网站的内容,现在代理只能在该网站内进行搜索
tool = WebsiteSearchTool(website='https://example.com')

参数

  • website:一个可选参数,用于指定专注搜索的网站 URL。该参数旨在通过在必要时允许有针对性的搜索来增强工具的灵活性。

自定义选项

默认情况下,该工具在嵌入和摘要生成方面使用 OpenAI。要自定义模型,您可以使用以下配置字典:

tool = WebsiteSearchTool(
config=dict(
llm=dict(
provider="ollama", # 或 google, openai, anthropic, llama2, ...
config=dict(
model="llama2",
# temperature=0.5,
# top_p=1,
# stream=true,
),
),
embedder=dict(
provider="google", # 或 openai, ollama, ...
config=dict(
model="models/embedding-001",
task_type="retrieval_document",
# title="Embeddings",
),
),
)
)