Bases: BaseReader
从Hive中读取文档。
这些文档可以在下游的Llama索引数据结构中使用。
Args:
host:HiveServer2运行的主机
port:Hive Server运行的端口。默认为10000。
auth:HiveServer2使用的hive.server2.authentication的值。默认为“NONE”
database:数据库名称
password:仅在auth='LDAP'或auth='CUSTOM'时使用
Source code in llama_index/readers/hive/base.py
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67 | class HiveReader(BaseReader):
"""从Hive中读取文档。
这些文档可以在下游的Llama索引数据结构中使用。
Args:
host:HiveServer2运行的主机
port:Hive Server运行的端口。默认为10000。
auth:HiveServer2使用的hive.server2.authentication的值。默认为“NONE”
database:数据库名称
password:仅在auth='LDAP'或auth='CUSTOM'时使用"""
def __init__(
self,
host: str,
port: Optional[int] = None,
database: Optional[str] = None,
username: Optional[str] = None,
password: Optional[str] = None,
auth: Optional[str] = None,
):
"""使用参数进行初始化。"""
try:
from pyhive import hive
except ImportError:
raise ImportError(
"`hive` package not found, please run `pip install pyhive`"
)
self.con = hive.Connection(
host=host,
port=port,
username=username,
database=database,
auth=auth,
password=password,
)
def load_data(self, query: str) -> List[Document]:
"""从Hive中读取数据。
Args:
query (str): 用于从Hive查询数据的查询语句
Returns:
List[Document]: 文档的列表。
"""
try:
cursor = self.con.cursor().execute(query)
cursor.execute(query)
rows = cursor.fetchall()
except Exception:
raise Exception(
"Throws Exception in execution, please check your connection params and query "
)
documents = []
for row in rows:
documents = Document(text=row)
return documents
|
load_data
从Hive中读取数据。
Parameters:
Name |
Type |
Description |
Default |
query |
str
|
|
required
|
Returns:
List[Document]: 文档的列表。
Source code in llama_index/readers/hive/base.py
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67 | def load_data(self, query: str) -> List[Document]:
"""从Hive中读取数据。
Args:
query (str): 用于从Hive查询数据的查询语句
Returns:
List[Document]: 文档的列表。
"""
try:
cursor = self.con.cursor().execute(query)
cursor.execute(query)
rows = cursor.fetchall()
except Exception:
raise Exception(
"Throws Exception in execution, please check your connection params and query "
)
documents = []
for row in rows:
documents = Document(text=row)
return documents
|