Exa

ExaToolSpec #

Bases: BaseToolSpec

工具规范。

Source code in llama_index/tools/exa/base.py

class ExaToolSpec(BaseToolSpec):
    """工具规范。"""

    spec_functions = [
        "search",
        "retrieve_documents",
        "search_and_retrieve_documents",
        "search_and_retrieve_highlights",
        "find_similar",
        "current_date",
    ]

    def __init__(
        self,
        api_key: str,
        verbose: bool = True,
        max_characters: int = 2000,
    ) -> None:
        """使用参数进行初始化。"""
        from exa_py import Exa

        self.client = Exa(api_key=api_key, user_agent="llama-index")
        self._verbose = verbose
        # max characters for the text field in the search_and_contents function
        self._max_characters = max_characters

    def search(
        self,
        query: str,
        num_results: Optional[int] = 10,
        include_domains: Optional[List[str]] = None,
        exclude_domains: Optional[List[str]] = None,
        start_published_date: Optional[str] = None,
        end_published_date: Optional[str] = None,
    ) -> List:
        """Exa允许您使用自然语言查询来搜索互联网。

Args:
    query（str）：作为链接提供内容答案的自然语言查询，例如：“这是关于太空的最新新闻：”
    num_results（可选[int]）：要返回的结果数量。默认为10。
    include_domains（可选[List(str)]）：限制搜索到特定站点的顶级域名列表，如["wsj.com"]。
    exclude_domains（可选[List(str)]）：要排除的顶级域名。
    start_published_date（可选[str]）：日期字符串，如“2020-06-15”。从`current_date`获取日期。
    end_published_date（可选[str]）：结束日期字符串。
"""
        response = self.client.search(
            query,
            num_results=num_results,
            include_domains=include_domains,
            exclude_domains=exclude_domains,
            start_published_date=start_published_date,
            end_published_date=end_published_date,
            use_autoprompt=True,
        )
        if self._verbose:
            print(f"[Exa Tool] Autoprompt: {response.autoprompt_string}")
        return [
            {"title": result.title, "url": result.url, "id": result.id}
            for result in response.results
        ]

    def retrieve_documents(self, ids: List[str]) -> List[Document]:
        """检索由`exa_search`返回的文档文本列表，使用ID字段。

Args:
    ids（List(str)）：要检索的文档的ID。
"""
        response = self.client.get_contents(ids)
        return [Document(text=result.text) for result in response.results]

    def find_similar(
        self,
        url: str,
        num_results: Optional[int] = 3,
        start_published_date: Optional[str] = None,
        end_published_date: Optional[str] = None,
    ) -> List:
        """获取与给定网址相似的文档列表。

Args:
    url (str): 要查找相似结果的网页
    num_results (Optional[int]): 要返回的结果数量。默认为3。
    start_published_date (Optional[str]): 一个日期字符串，如"2020-06-15"
    end_published_date (Optional[str]): 结束日期字符串
"""
        response = self.client.find_similar(
            url,
            num_results=num_results,
            start_published_date=start_published_date,
            end_published_date=end_published_date,
        )
        return [
            {"title": result.title, "url": result.url, "id": result.id}
            for result in response.results
        ]

    def search_and_retrieve_documents(
        self,
        query: str,
        num_results: Optional[int] = 10,
        include_domains: Optional[List[str]] = None,
        exclude_domains: Optional[List[str]] = None,
        start_published_date: Optional[str] = None,
        end_published_date: Optional[str] = None,
    ) -> List[Document]:
        """将`search`和`retrieve_documents`的功能结合起来。

Args:
    query (str): 自然语言查询
    num_results (Optional[int]): 结果数量，默认为10。
    include_domains (Optional[List(str)]): 要搜索的顶级域名列表，如["wsj.com"]
    exclude_domains (Optional[List(str)]): 要排除的顶级域名。
    start_published_date (Optional[str]): 日期字符串，如"2020-06-15"。
    end_published_date (Optional[str]): 结束日期字符串。
"""
        response = self.client.search_and_contents(
            query,
            num_results=num_results,
            include_domains=include_domains,
            exclude_domains=exclude_domains,
            start_published_date=start_published_date,
            end_published_date=end_published_date,
            use_autoprompt=True,
            text={"max_characters": self._max_characters},
        )
        if self._verbose:
            print(f"[Exa Tool] Autoprompt: {response.autoprompt_string}")
        return [Document(text=document.text) for document in response.results]

    def search_and_retrieve_highlights(
        self,
        query: str,
        num_results: Optional[int] = 10,
        include_domains: Optional[List[str]] = None,
        exclude_domains: Optional[List[str]] = None,
        start_published_date: Optional[str] = None,
        end_published_date: Optional[str] = None,
    ) -> List[Document]:
        """搜索并检索文档中的摘要（智能摘录）。

Args:
    query（str）：自然语言查询
    num_results（Optional[int]）：结果数量。默认为10。
    include_domains（Optional[List(str)]）：要搜索的顶级域名列表，如["wsj.com"]
    exclude_domains（Optional[List(str)]）：要排除的顶级域名。
    start_published_date（Optional[str]）：日期字符串，如"2020-06-15"。
    end_published_date（Optional[str]）：结束日期字符串
"""
        response = self.client.search_and_contents(
            query,
            num_results=num_results,
            include_domains=include_domains,
            exclude_domains=exclude_domains,
            start_published_date=start_published_date,
            end_published_date=end_published_date,
            use_autoprompt=True,
            highlights=True,
        )
        if self._verbose:
            print(f"[Exa Tool] Autoprompt: {response.autoprompt_string}")
        return [Document(text=document.highlights[0]) for document in response.results]

    def current_date(self):
        """一个返回今天日期的函数。

在调用任何需要时间戳作为参数的其他函数之前，请先调用此函数。
"""
        return datetime.date.today()

search #

search(
    query: str,
    num_results: Optional[int] = 10,
    include_domains: Optional[List[str]] = None,
    exclude_domains: Optional[List[str]] = None,
    start_published_date: Optional[str] = None,
    end_published_date: Optional[str] = None,
) -> List

Exa允许您使用自然语言查询来搜索互联网。

Source code in llama_index/tools/exa/base.py

    def search(
        self,
        query: str,
        num_results: Optional[int] = 10,
        include_domains: Optional[List[str]] = None,
        exclude_domains: Optional[List[str]] = None,
        start_published_date: Optional[str] = None,
        end_published_date: Optional[str] = None,
    ) -> List:
        """Exa允许您使用自然语言查询来搜索互联网。

Args:
    query（str）：作为链接提供内容答案的自然语言查询，例如：“这是关于太空的最新新闻：”
    num_results（可选[int]）：要返回的结果数量。默认为10。
    include_domains（可选[List(str)]）：限制搜索到特定站点的顶级域名列表，如["wsj.com"]。
    exclude_domains（可选[List(str)]）：要排除的顶级域名。
    start_published_date（可选[str]）：日期字符串，如“2020-06-15”。从`current_date`获取日期。
    end_published_date（可选[str]）：结束日期字符串。
"""
        response = self.client.search(
            query,
            num_results=num_results,
            include_domains=include_domains,
            exclude_domains=exclude_domains,
            start_published_date=start_published_date,
            end_published_date=end_published_date,
            use_autoprompt=True,
        )
        if self._verbose:
            print(f"[Exa Tool] Autoprompt: {response.autoprompt_string}")
        return [
            {"title": result.title, "url": result.url, "id": result.id}
            for result in response.results
        ]

retrieve_documents #

retrieve_documents(ids: List[str]) -> List[Document]

检索由exa_search返回的文档文本列表，使用ID字段。

Source code in llama_index/tools/exa/base.py

    def retrieve_documents(self, ids: List[str]) -> List[Document]:
        """检索由`exa_search`返回的文档文本列表，使用ID字段。

Args:
    ids（List(str)）：要检索的文档的ID。
"""
        response = self.client.get_contents(ids)
        return [Document(text=result.text) for result in response.results]

find_similar #

find_similar(
    url: str,
    num_results: Optional[int] = 3,
    start_published_date: Optional[str] = None,
    end_published_date: Optional[str] = None,
) -> List

获取与给定网址相似的文档列表。

Parameters:

Name	Type	Description	Default
`url`	`str`	要查找相似结果的网页	required
`num_results`	`Optional[int]`	要返回的结果数量。默认为3。	`3`
`start_published_date`	`Optional[str]`	一个日期字符串，如"2020-06-15"	`None`
`end_published_date`	`Optional[str]`	结束日期字符串	`None`

Source code in llama_index/tools/exa/base.py

    def find_similar(
        self,
        url: str,
        num_results: Optional[int] = 3,
        start_published_date: Optional[str] = None,
        end_published_date: Optional[str] = None,
    ) -> List:
        """获取与给定网址相似的文档列表。

Args:
    url (str): 要查找相似结果的网页
    num_results (Optional[int]): 要返回的结果数量。默认为3。
    start_published_date (Optional[str]): 一个日期字符串，如"2020-06-15"
    end_published_date (Optional[str]): 结束日期字符串
"""
        response = self.client.find_similar(
            url,
            num_results=num_results,
            start_published_date=start_published_date,
            end_published_date=end_published_date,
        )
        return [
            {"title": result.title, "url": result.url, "id": result.id}
            for result in response.results
        ]

search_and_retrieve_documents #

search_and_retrieve_documents(
    query: str,
    num_results: Optional[int] = 10,
    include_domains: Optional[List[str]] = None,
    exclude_domains: Optional[List[str]] = None,
    start_published_date: Optional[str] = None,
    end_published_date: Optional[str] = None,
) -> List[Document]

将search和retrieve_documents的功能结合起来。

Parameters:

Name	Type	Description	Default
`query`	`str`	自然语言查询	required
`num_results`	`Optional[int]`	结果数量，默认为10。	`10`
`include_domains`	`Optional[List(str)]`	要搜索的顶级域名列表，如["wsj.com"]	`None`
`exclude_domains`	`Optional[List(str)]`	要排除的顶级域名。	`None`
`start_published_date`	`Optional[str]`	日期字符串，如"2020-06-15"。	`None`
`end_published_date`	`Optional[str]`	结束日期字符串。	`None`

Source code in llama_index/tools/exa/base.py

    def search_and_retrieve_documents(
        self,
        query: str,
        num_results: Optional[int] = 10,
        include_domains: Optional[List[str]] = None,
        exclude_domains: Optional[List[str]] = None,
        start_published_date: Optional[str] = None,
        end_published_date: Optional[str] = None,
    ) -> List[Document]:
        """将`search`和`retrieve_documents`的功能结合起来。

Args:
    query (str): 自然语言查询
    num_results (Optional[int]): 结果数量，默认为10。
    include_domains (Optional[List(str)]): 要搜索的顶级域名列表，如["wsj.com"]
    exclude_domains (Optional[List(str)]): 要排除的顶级域名。
    start_published_date (Optional[str]): 日期字符串，如"2020-06-15"。
    end_published_date (Optional[str]): 结束日期字符串。
"""
        response = self.client.search_and_contents(
            query,
            num_results=num_results,
            include_domains=include_domains,
            exclude_domains=exclude_domains,
            start_published_date=start_published_date,
            end_published_date=end_published_date,
            use_autoprompt=True,
            text={"max_characters": self._max_characters},
        )
        if self._verbose:
            print(f"[Exa Tool] Autoprompt: {response.autoprompt_string}")
        return [Document(text=document.text) for document in response.results]

search_and_retrieve_highlights #

search_and_retrieve_highlights(
    query: str,
    num_results: Optional[int] = 10,
    include_domains: Optional[List[str]] = None,
    exclude_domains: Optional[List[str]] = None,
    start_published_date: Optional[str] = None,
    end_published_date: Optional[str] = None,
) -> List[Document]

搜索并检索文档中的摘要（智能摘录）。

Source code in llama_index/tools/exa/base.py

    def search_and_retrieve_highlights(
        self,
        query: str,
        num_results: Optional[int] = 10,
        include_domains: Optional[List[str]] = None,
        exclude_domains: Optional[List[str]] = None,
        start_published_date: Optional[str] = None,
        end_published_date: Optional[str] = None,
    ) -> List[Document]:
        """搜索并检索文档中的摘要（智能摘录）。

Args:
    query（str）：自然语言查询
    num_results（Optional[int]）：结果数量。默认为10。
    include_domains（Optional[List(str)]）：要搜索的顶级域名列表，如["wsj.com"]
    exclude_domains（Optional[List(str)]）：要排除的顶级域名。
    start_published_date（Optional[str]）：日期字符串，如"2020-06-15"。
    end_published_date（Optional[str]）：结束日期字符串
"""
        response = self.client.search_and_contents(
            query,
            num_results=num_results,
            include_domains=include_domains,
            exclude_domains=exclude_domains,
            start_published_date=start_published_date,
            end_published_date=end_published_date,
            use_autoprompt=True,
            highlights=True,
        )
        if self._verbose:
            print(f"[Exa Tool] Autoprompt: {response.autoprompt_string}")
        return [Document(text=document.highlights[0]) for document in response.results]

current_date #

current_date()

一个返回今天日期的函数。

在调用任何需要时间戳作为参数的其他函数之前，请先调用此函数。

Source code in llama_index/tools/exa/base.py

    def current_date(self):
        """一个返回今天日期的函数。

在调用任何需要时间戳作为参数的其他函数之前，请先调用此函数。
"""
        return datetime.date.today()