Skip to content

Hive

HiveReader #

Bases: BaseReader

从Hive中读取文档。

这些文档可以在下游的Llama索引数据结构中使用。

Args: host:HiveServer2运行的主机 port:Hive Server运行的端口。默认为10000。 auth:HiveServer2使用的hive.server2.authentication的值。默认为“NONE” database:数据库名称 password:仅在auth='LDAP'或auth='CUSTOM'时使用

Source code in llama_index/readers/hive/base.py
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
class HiveReader(BaseReader):
    """从Hive中读取文档。

这些文档可以在下游的Llama索引数据结构中使用。

Args:
host:HiveServer2运行的主机
port:Hive Server运行的端口。默认为10000。
auth:HiveServer2使用的hive.server2.authentication的值。默认为“NONE”
database:数据库名称
password:仅在auth='LDAP'或auth='CUSTOM'时使用"""

    def __init__(
        self,
        host: str,
        port: Optional[int] = None,
        database: Optional[str] = None,
        username: Optional[str] = None,
        password: Optional[str] = None,
        auth: Optional[str] = None,
    ):
        """使用参数进行初始化。"""
        try:
            from pyhive import hive
        except ImportError:
            raise ImportError(
                "`hive` package not found, please run `pip install pyhive`"
            )

        self.con = hive.Connection(
            host=host,
            port=port,
            username=username,
            database=database,
            auth=auth,
            password=password,
        )

    def load_data(self, query: str) -> List[Document]:
        """从Hive中读取数据。

Args:
    query (str): 用于从Hive查询数据的查询语句
Returns:
    List[Document]: 文档的列表。
"""
        try:
            cursor = self.con.cursor().execute(query)
            cursor.execute(query)
            rows = cursor.fetchall()
        except Exception:
            raise Exception(
                "Throws Exception in execution, please check your connection params and query "
            )

        documents = []
        for row in rows:
            documents = Document(text=row)
        return documents

load_data #

load_data(query: str) -> List[Document]

从Hive中读取数据。

Parameters:

Name Type Description Default
query str

用于从Hive查询数据的查询语句

required

Returns: List[Document]: 文档的列表。

Source code in llama_index/readers/hive/base.py
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
    def load_data(self, query: str) -> List[Document]:
        """从Hive中读取数据。

Args:
    query (str): 用于从Hive查询数据的查询语句
Returns:
    List[Document]: 文档的列表。
"""
        try:
            cursor = self.con.cursor().execute(query)
            cursor.execute(query)
            rows = cursor.fetchall()
        except Exception:
            raise Exception(
                "Throws Exception in execution, please check your connection params and query "
            )

        documents = []
        for row in rows:
            documents = Document(text=row)
        return documents