Skip to content

Pathway

PathwayReader #

Bases: BaseReader

路径读取器。

从路径数据索引管道中检索文档。

Parameters:

Name Type Description Default
host str

Pathway当前托管的URI。

None
port str | int

Pathway正在监听的端口号。

None
另请参阅

llamaindex.retriever.pathway.PathwayRetriever 和, llamaindex.retriever.pathway.PathwayVectorServer

Source code in llama_index/readers/pathway/base.py
 98
 99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
class PathwayReader(BaseReader):
    """路径读取器。

    从路径数据索引管道中检索文档。

    Args:
        host (str): Pathway当前托管的URI。
        port (str | int): Pathway正在监听的端口号。

    另请参阅:
        llamaindex.retriever.pathway.PathwayRetriever 和,
        llamaindex.retriever.pathway.PathwayVectorServer"""

    def __init__(
        self,
        host: Optional[str] = None,
        port: Optional[int] = None,
        url: Optional[str] = None,
    ):
        """初始化路径读取客户端。"""
        self.client = _VectorStoreClient(host, port, url)

    def load_data(
        self,
        query_text: str,
        k: Optional[int] = 4,
        metadata_filter: Optional[str] = None,
    ) -> List[Document]:
        """从路径加载数据。

Args:
    query_text (str): 要获取最接近邻居的文本。
    k (int): 要返回的结果数量。
    metadata_filter (str): 要应用的过滤器。

Returns:
    List[Document]: 文档列表。
"""
        results = self.client(query_text, k, metadata_filter)
        documents = []
        for return_elem in results:
            document = Document(
                text=return_elem["text"],
                extra_info=return_elem["metadata"],
            )

            documents.append(document)

        return documents

load_data #

load_data(
    query_text: str,
    k: Optional[int] = 4,
    metadata_filter: Optional[str] = None,
) -> List[Document]

从路径加载数据。

Parameters:

Name Type Description Default
query_text str

要获取最接近邻居的文本。

required
k int

要返回的结果数量。

4
metadata_filter str

要应用的过滤器。

None

Returns:

Type Description
List[Document]

List[Document]: 文档列表。

Source code in llama_index/readers/pathway/base.py
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
    def load_data(
        self,
        query_text: str,
        k: Optional[int] = 4,
        metadata_filter: Optional[str] = None,
    ) -> List[Document]:
        """从路径加载数据。

Args:
    query_text (str): 要获取最接近邻居的文本。
    k (int): 要返回的结果数量。
    metadata_filter (str): 要应用的过滤器。

Returns:
    List[Document]: 文档列表。
"""
        results = self.client(query_text, k, metadata_filter)
        documents = []
        for return_elem in results:
            document = Document(
                text=return_elem["text"],
                extra_info=return_elem["metadata"],
            )

            documents.append(document)

        return documents