Skip to main content

关于Wren AI和我们的使命

Wren AI 是一个开源的 SQL AI 代理,它使数据、产品和业务团队能够通过聊天获取洞察,内置精心设计的直观用户界面和用户体验,并与 Excel 和 Google Sheets 等工具无缝集成。

为什么现在是Text-to-SQL的时代?

在快速发展的数据环境中,数据分析师扮演着至关重要的角色,他们是数据与组织内多样化业务环境之间的重要桥梁。不同的业务部门,每个都有独特的视角和需求,常常从数据中寻求特定的洞察,这使得数据分析师的角色既关键又具有挑战性。他们能够以符合各利益相关者独特需求的方式解释、翻译和传达数据,这是不可或缺的。

先进技术如大型语言模型(LLMs)和检索增强生成(RAG)的出现,通过增强业务数据分析师的能力,正在彻底改变这一领域。RAG通过整合检索到的外部信息进一步增强了这一过程,使LLMs能够生成更全面和准确的信息。

凭借对上下文的理解和自然语言处理能力,带有RAG的LLMs使分析师能够高效且细致地浏览和解释庞大的数据集。

使用RAG与LLMs查询数据库的挑战

使用RAG结合LLMs来查询数据库并不是一个新概念。已经提出了许多解决方案来解决这个问题,但它们仍然在四个关键阶段面临挑战:上下文收集、检索、SQL生成和协作。尽管尝试克服这些挑战,我们仍然在这四个阶段中苦苦挣扎。

challenges

第一阶段:上下文收集挑战

  • 跨多种来源的互操作性:为了无缝地概括和规范化来自不同来源、元数据服务和API的搜索和集成信息。
  • 数据和元数据的复杂链接:这涉及在文档存储中将数据与其元数据关联起来。它包括存储元数据、模式以及上下文,如关系、计算和聚合。

第二阶段:检索挑战

  • 向量存储的优化: 开发和实施向量存储的优化技术,如索引和分块,对于提高搜索效率和精度至关重要。
  • 语义搜索的精确度:挑战在于在上下文中理解查询的细微差别,这可能会显著影响结果的准确性。这通常涉及查询重写、重新排序等技术。

第三阶段:SQL生成挑战

  • SQL查询的准确性和可执行性:生成既准确又可执行的SQL查询是一个重大挑战。这要求LLM深入理解SQL语法、数据库模式以及不同数据库系统的特定方言。
  • 适应查询引擎方言:数据库在SQL实现中通常有独特的方言和细微差别。设计能够适应这些差异并在各种系统中生成兼容查询的LLMs,为挑战增加了另一层复杂性。

第四阶段:协作挑战

  • 集体知识积累:挑战在于创建一个能够有效收集、整合和利用来自多样化用户群体的集体见解和反馈的机制,以提高LLM检索数据的准确性和相关性。
  • 访问控制: 当我们最终检索数据时,下一个最重要的挑战是确保现有的组织数据访问政策和隐私法规也适用于新的LLM和RAG架构。

介绍Wren AI - 为数据和业务团队提供的Text-to-SQL全面解决方案。

我们在开发Wren AI时使用了一些核心设计理念。

1. 用任何语言与您的数据对话

Wren AI 会说您的语言,例如英语、德语、西班牙语、法语、日语、韩语、葡萄牙语、中文等。通过向 Wren AI 提出您的业务问题,解锁有价值的见解。它超越了表面的数据分析,揭示了有意义的信息,并简化了从潜在客户评分模板到客户细分的答案获取过程。

2. 精心设计的UI/UX的语义索引

Wren AI 已经实现了一个语义引擎架构,以提供您的业务的LLM上下文;您可以轻松地在您的数据模式上建立一个逻辑表示层,帮助LLM了解更多关于您的业务上下文。

3. 使用上下文生成SQL查询

使用Wren AI,您可以通过“建模定义语言”处理元数据、模式、术语、数据关系以及计算和聚合背后的逻辑,从而减少重复编码并简化数据连接。

4. 无需编写代码即可获取洞察

在Wren AI中开始新对话时,您的问题将用于查找最相关的表格。基于这些表格,LLM会生成三个相关问题供用户选择。您还可以提出后续问题以获得更深入的见解。

5. GenBI

GenBI功能通过AI生成的摘要赋予用户关键洞察,同时简化复杂的SQL查询数据。即时将查询结果转换为AI生成的报告和图表,将原始数据转化为清晰、可操作的视觉内容。借助GenBI,您可以轻松做出更快、更智能的决策。

6. 轻松导出和可视化您的数据

Wren AI 提供了一个无缝的端到端工作流程,使您能够轻松地将数据与流行的分析工具(如 ExcelGoogle Sheets)连接起来。这样,您的见解仍然可访问,允许使用您最熟悉的工具进行进一步分析。