Skip to content

LlamaIndex

Trulens eval packs

Trulens eval packs

TruLensHarmlessPack #

Bases: BaseLlamaPack

TruLens-Eval Harmless LlamaPack 展示了如何对 LlamaIndex 查询引擎进行仪器化和评估。它启动一个日志数据库并在后台启动一个仪表板，对输入节点列表构建索引，并实例化和仪器化一个查询引擎。它还实例化了一套无害评估，以便对查询进行记录和评估其无害性。

注意：使用此 LlamaPack 需要通过 OPENAI_API_KEY 和 HUGGINGFACE_API_KEY 环境变量设置您的 OpenAI 和 HuggingFace API 密钥。

Source code in llama_index/packs/trulens_eval_packs/base.py

class TruLensHarmlessPack(BaseLlamaPack):
    """TruLens-Eval Harmless LlamaPack 展示了如何对 LlamaIndex 查询引擎进行仪器化和评估。它启动一个日志数据库并在后台启动一个仪表板，对输入节点列表构建索引，并实例化和仪器化一个查询引擎。它还实例化了一套无害评估，以便对查询进行记录和评估其无害性。

注意：使用此 LlamaPack 需要通过 OPENAI_API_KEY 和 HUGGINGFACE_API_KEY 环境变量设置您的 OpenAI 和 HuggingFace API 密钥。"""

    def __init__(
        self,
        nodes: List[TextNode],
        app_id: str,
        **kwargs: Any,
    ) -> None:
        """初始化TruLensEvalPack的新实例。

Args:
    nodes（List[TextNode]）：用于构建索引的节点输入列表。
    app_id（str）：TruLensEvalPack的应用程序ID。
"""
        try:
            from trulens_eval import Feedback, Tru, TruLlama
            from trulens_eval.feedback.provider.openai import OpenAI
        except ImportError:
            raise ImportError(
                "The trulens-eval package could not be found. "
                "Please install with `pip install trulens-eval`."
            )
        self.app_id = app_id
        self._tru = Tru()
        self._tru.run_dashboard()
        self._index = VectorStoreIndex(nodes, **kwargs)
        self._query_engine = self._index.as_query_engine()

        # Initialize provider class
        provider = OpenAI()

        # LLM-based feedback functions
        f_controversiality = Feedback(
            provider.controversiality_with_cot_reasons,
            name="Criminality",
            higher_is_better=False,
        ).on_output()
        f_criminality = Feedback(
            provider.criminality_with_cot_reasons,
            name="Controversiality",
            higher_is_better=False,
        ).on_output()
        f_insensitivity = Feedback(
            provider.insensitivity_with_cot_reasons,
            name="Insensitivity",
            higher_is_better=False,
        ).on_output()
        f_maliciousness = Feedback(
            provider.maliciousness_with_cot_reasons,
            name="Maliciousness",
            higher_is_better=False,
        ).on_output()

        # Moderation feedback functions
        f_hate = Feedback(
            provider.moderation_hate, name="Hate", higher_is_better=False
        ).on_output()
        f_hatethreatening = Feedback(
            provider.moderation_hatethreatening,
            name="Hate/Threatening",
            higher_is_better=False,
        ).on_output()
        f_violent = Feedback(
            provider.moderation_violence, name="Violent", higher_is_better=False
        ).on_output()
        f_violentgraphic = Feedback(
            provider.moderation_violencegraphic,
            name="Violent/Graphic",
            higher_is_better=False,
        ).on_output()
        f_selfharm = Feedback(
            provider.moderation_selfharm, name="Self Harm", higher_is_better=False
        ).on_output()

        harmless_feedbacks = [
            f_controversiality,
            f_criminality,
            f_insensitivity,
            f_maliciousness,
            f_hate,
            f_hatethreatening,
            f_violent,
            f_violentgraphic,
            f_selfharm,
        ]

        self._tru_query_engine = TruLlama(
            self._query_engine, app_id=app_id, feedbacks=harmless_feedbacks
        )

    def get_modules(self) -> Dict[str, Any]:
        """返回一个包含LlamaPack内部信息的字典。

返回：
    Dict[str, Any]: 包含LlamaPack内部信息的字典。
"""
        return {
            "session": self._tru,
            "index": self._index,
            "tru_query_engine": self._tru_query_engine,
            "query_engine": self._query_engine,
        }

    def run(self, *args: Any, **kwargs: Any) -> Any:
        """对索引运行查询。

返回：
    任何：来自查询引擎的响应。
"""
        with self._tru_query_engine as _:
            return self._query_engine.query(*args, **kwargs)

get_modules #

get_modules() -> Dict[str, Any]

返回一个包含LlamaPack内部信息的字典。

返回： Dict[str, Any]: 包含LlamaPack内部信息的字典。

Source code in llama_index/packs/trulens_eval_packs/base.py

    def get_modules(self) -> Dict[str, Any]:
        """返回一个包含LlamaPack内部信息的字典。

返回：
    Dict[str, Any]: 包含LlamaPack内部信息的字典。
"""
        return {
            "session": self._tru,
            "index": self._index,
            "tru_query_engine": self._tru_query_engine,
            "query_engine": self._query_engine,
        }

run #

run(*args: Any, **kwargs: Any) -> Any

对索引运行查询。

返回：任何：来自查询引擎的响应。

Source code in llama_index/packs/trulens_eval_packs/base.py

    def run(self, *args: Any, **kwargs: Any) -> Any:
        """对索引运行查询。

返回：
    任何：来自查询引擎的响应。
"""
        with self._tru_query_engine as _:
            return self._query_engine.query(*args, **kwargs)

TruLensHelpfulPack #

Bases: BaseLlamaPack

TruLens-Eval Helpful LlamaPack 展示了如何对 LlamaIndex 查询引擎进行仪器化和评估。它启动一个日志数据库并在后台启动一个仪表板，对输入的节点列表构建索引，并实例化和仪器化一个查询引擎。它还实例化了一套有用的评估，以便对查询进行记录和评估其有用性。

注意：使用此 LlamaPack 需要设置 OPENAI_API_KEY 和 HUGGINGFACE_API_KEY 环境变量为您的 OpenAI 和 HuggingFace API 密钥。

Source code in llama_index/packs/trulens_eval_packs/base.py

class TruLensHelpfulPack(BaseLlamaPack):
    """TruLens-Eval Helpful LlamaPack 展示了如何对 LlamaIndex 查询引擎进行仪器化和评估。它启动一个日志数据库并在后台启动一个仪表板，对输入的节点列表构建索引，并实例化和仪器化一个查询引擎。它还实例化了一套有用的评估，以便对查询进行记录和评估其有用性。

注意：使用此 LlamaPack 需要设置 OPENAI_API_KEY 和 HUGGINGFACE_API_KEY 环境变量为您的 OpenAI 和 HuggingFace API 密钥。"""

    def __init__(
        self,
        nodes: List[TextNode],
        app_id: str,
        **kwargs: Any,
    ) -> None:
        """初始化TruLensEvalPack的新实例。

Args:
    nodes（List[TextNode]）：用于构建索引的节点输入列表。
    app_id（str）：TruLensEvalPack的应用程序ID。
"""
        try:
            from trulens_eval import Feedback, Tru, TruLlama
            from trulens_eval.feedback.provider.hugs import Huggingface
            from trulens_eval.feedback.provider.openai import OpenAI
        except ImportError:
            raise ImportError(
                "The trulens-eval package could not be found. "
                "Please install with `pip install trulens-eval`."
            )
        self.app_id = app_id
        self._tru = Tru()
        self._tru.run_dashboard()
        self._index = VectorStoreIndex(nodes, **kwargs)
        self._query_engine = self._index.as_query_engine()

        # Initialize provider class
        provider = OpenAI()

        hugs_provider = Huggingface()

        # LLM-based feedback functions
        f_coherence = Feedback(
            provider.coherence_with_cot_reasons, name="Coherence"
        ).on_output()
        f_input_sentiment = Feedback(
            provider.sentiment_with_cot_reasons, name="Input Sentiment"
        ).on_input()
        f_output_sentiment = Feedback(
            provider.sentiment_with_cot_reasons, name="Output Sentiment"
        ).on_output()
        f_langmatch = Feedback(
            hugs_provider.language_match, name="Language Match"
        ).on_input_output()

        helpful_feedbacks = [
            f_coherence,
            f_input_sentiment,
            f_output_sentiment,
            f_langmatch,
        ]

        self._tru_query_engine = TruLlama(
            self._query_engine, app_id=app_id, feedbacks=helpful_feedbacks
        )

    def get_modules(self) -> Dict[str, Any]:
        """返回一个包含LlamaPack内部信息的字典。

返回：
    Dict[str, Any]: 包含LlamaPack内部信息的字典。
"""
        return {
            "session": self._tru,
            "index": self._index,
            "tru_query_engine": self._tru_query_engine,
            "query_engine": self._query_engine,
        }

    def run(self, *args: Any, **kwargs: Any) -> Any:
        """对索引运行查询。

返回：
    任何：来自查询引擎的响应。
"""
        with self._tru_query_engine as _:
            return self._query_engine.query(*args, **kwargs)

get_modules #

get_modules() -> Dict[str, Any]

返回一个包含LlamaPack内部信息的字典。

返回： Dict[str, Any]: 包含LlamaPack内部信息的字典。

Source code in llama_index/packs/trulens_eval_packs/base.py

    def get_modules(self) -> Dict[str, Any]:
        """返回一个包含LlamaPack内部信息的字典。

返回：
    Dict[str, Any]: 包含LlamaPack内部信息的字典。
"""
        return {
            "session": self._tru,
            "index": self._index,
            "tru_query_engine": self._tru_query_engine,
            "query_engine": self._query_engine,
        }

run #

run(*args: Any, **kwargs: Any) -> Any

对索引运行查询。

返回：任何：来自查询引擎的响应。

Source code in llama_index/packs/trulens_eval_packs/base.py

    def run(self, *args: Any, **kwargs: Any) -> Any:
        """对索引运行查询。

返回：
    任何：来自查询引擎的响应。
"""
        with self._tru_query_engine as _:
            return self._query_engine.query(*args, **kwargs)

TruLensRAGTriadPack #

Bases: BaseLlamaPack

TruLens-Eval RAG Triad LlamaPack 展示了如何对 LlamaIndex 查询引擎进行仪器化和评估。它启动一个日志数据库并在后台启动仪表板，构建一个索引，然后在该索引上实例化和仪器化查询引擎。它还实例化了 RAG 三元组（groundedness，context relevance，answer relevance），以便通过该三元组记录和评估查询，以检测幻觉。

注意：使用此 LlamaPack 需要通过 OPENAI_API_KEY 环境变量设置您的 OpenAI API 密钥。

Source code in llama_index/packs/trulens_eval_packs/base.py

class TruLensRAGTriadPack(BaseLlamaPack):
    """TruLens-Eval RAG Triad LlamaPack 展示了如何对 LlamaIndex 查询引擎进行仪器化和评估。它启动一个日志数据库并在后台启动仪表板，构建一个索引，然后在该索引上实例化和仪器化查询引擎。它还实例化了 RAG 三元组（groundedness，context relevance，answer relevance），以便通过该三元组记录和评估查询，以检测幻觉。

注意：使用此 LlamaPack 需要通过 OPENAI_API_KEY 环境变量设置您的 OpenAI API 密钥。"""

    def __init__(
        self,
        nodes: List[TextNode],
        app_id: str,
        **kwargs: Any,
    ) -> None:
        """初始化TruLensEvalPack的新实例。

Args:
    nodes（List[TextNode]）：用于构建索引的节点输入列表。
    app_id（str）：TruLensEvalPack的应用程序ID。
"""
        try:
            from trulens_eval import Feedback, Tru, TruLlama
            from trulens_eval.feedback import Groundedness
            from trulens_eval.feedback.provider.openai import OpenAI
        except ImportError:
            raise ImportError(
                "The trulens-eval package could not be found. "
                "Please install with `pip install trulens-eval`."
            )
        self.app_id = app_id
        self._tru = Tru()
        self._tru.run_dashboard()
        self._index = VectorStoreIndex(nodes, **kwargs)
        self._query_engine = self._index.as_query_engine()

        import numpy as np

        # Initialize provider class
        provider = OpenAI()

        grounded = Groundedness(groundedness_provider=provider)

        # Define a groundedness feedback function
        f_groundedness = (
            Feedback(
                grounded.groundedness_measure_with_cot_reasons, name="Groundedness"
            )
            .on(TruLlama.select_source_nodes().node.text.collect())
            .on_output()
            .aggregate(grounded.grounded_statements_aggregator)
        )

        # Question/answer relevance between overall question and answer.
        f_qa_relevance = Feedback(
            provider.relevance, name="Answer Relevance"
        ).on_input_output()

        # Question/statement relevance between question and each context chunk.
        f_context_relevance = (
            Feedback(provider.qs_relevance, name="Context Relevance")
            .on_input()
            .on(TruLlama.select_source_nodes().node.text.collect())
            .aggregate(np.mean)
        )

        feedbacks = [f_groundedness, f_qa_relevance, f_context_relevance]

        self._tru_query_engine = TruLlama(
            self._query_engine, app_id=app_id, feedbacks=feedbacks
        )

    def get_modules(self) -> Dict[str, Any]:
        """返回一个包含LlamaPack内部信息的字典。

返回：
    Dict[str, Any]: 包含LlamaPack内部信息的字典。
"""
        return {
            "session": self._tru,
            "index": self._index,
            "tru_query_engine": self._tru_query_engine,
            "query_engine": self._query_engine,
        }

    def run(self, *args: Any, **kwargs: Any) -> Any:
        """对索引运行查询。

返回：
    任何：来自查询引擎的响应。
"""
        with self._tru_query_engine as _:
            return self._query_engine.query(*args, **kwargs)

get_modules #

get_modules() -> Dict[str, Any]

返回一个包含LlamaPack内部信息的字典。

返回： Dict[str, Any]: 包含LlamaPack内部信息的字典。

Source code in llama_index/packs/trulens_eval_packs/base.py

    def get_modules(self) -> Dict[str, Any]:
        """返回一个包含LlamaPack内部信息的字典。

返回：
    Dict[str, Any]: 包含LlamaPack内部信息的字典。
"""
        return {
            "session": self._tru,
            "index": self._index,
            "tru_query_engine": self._tru_query_engine,
            "query_engine": self._query_engine,
        }

run #

run(*args: Any, **kwargs: Any) -> Any

对索引运行查询。

返回：任何：来自查询引擎的响应。

Source code in llama_index/packs/trulens_eval_packs/base.py

    def run(self, *args: Any, **kwargs: Any) -> Any:
        """对索引运行查询。

返回：
    任何：来自查询引擎的响应。
"""
        with self._tru_query_engine as _:
            return self._query_engine.query(*args, **kwargs)