除了查询功能外,PandasAI 还提供了通过图表可视化数据、通过处理缺失值来清理数据集以及通过特征生成来增强数据质量的功能,使其成为数据科学家和分析师的综合工具。

功能

  • 自然语言查询: 用自然语言向您的数据提问。
  • 数据可视化: 生成图表以可视化您的数据。
  • 数据清洗: 通过处理缺失值来清洗数据集。
  • 特征生成: 通过特征生成提高数据质量。
  • 数据连接器: 连接到各种数据源,如CSV、XLSX、PostgreSQL、MySQL、BigQuery、Databrick、Snowflake等。

PandasAI 是如何工作的?

PandasAI 使用生成式 AI 模型来理解和解释自然语言查询,并将其翻译成 Python 代码和 SQL 查询。然后,它使用该代码与数据进行交互,并将结果返回给用户。

谁应该使用PandasAI?

PandasAI 是为那些希望以更自然的方式与数据交互的数据科学家、分析师和工程师设计的。它对于那些不熟悉 SQL 或 Python 的人,或者希望在处理数据时节省时间和精力的人特别有用。对于那些熟悉 SQL 和 Python 的人也同样有用,因为它允许他们向数据提问,而无需编写任何复杂的代码。

如何开始使用PandasAI?

PandasAI 可作为 Python 库和基于网络的平台使用。您可以使用 pip 或 poetry 安装该库,并在您的 Python 代码中使用它。您还可以使用基于网络的平台以更直观的方式与您的数据进行交互。

☁️ 使用平台

PandasAI平台提供了一个基于网络的界面,以更直观的方式与您的数据进行交互。您可以用自然语言向您的数据提问,生成图表以可视化您的数据,并通过处理缺失值来清理数据集。它使用FastAPI作为后端,NextJS作为前端。

如果你想了解更多如何在本地机器上启动平台,你可以查看平台文档

📚 使用库

PandasAI库提供了一个Python接口,用于以自然语言与您的数据进行交互。您可以使用它向数据提问、生成图表、清洗数据集,并通过特征生成提高数据质量。它利用LLMs来理解和解释自然语言查询,并将其翻译成Python代码和SQL查询。

一旦你安装了PandasAI,你就可以通过导入Agent类并用你的数据实例化它来开始使用它。然后你可以使用chat方法以自然语言向你的数据提问。

import os

import pandas as pd

from pandasai import Agent



# Sample DataFrame

sales_by_country = pd.DataFrame({

    "country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],

    "sales": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000]

})



# By default, unless you choose a different LLM, it will use BambooLLM.

# You can get your free API key signing up at https://pandabi.ai (you can also configure it in your .env file)

os.environ["PANDASAI_API_KEY"] = "YOUR_API_KEY"



agent = Agent(sales_by_country)

agent.chat('Which are the top 5 countries by sales?')

## Output

# China, United States, Japan, Germany, Australia

如果你想了解更多关于如何使用该库的信息,你可以查看库文档

支持

如果您有任何问题或需要帮助,请加入我们的discord server

许可证

PandasAI 可在 MIT expat 许可证下使用,除了 pandasai/ee 目录,该目录有其 许可证在此(如果适用)。

如果您对托管的PandasAI云或自托管的企业服务感兴趣,联系我们

分析

我们已与Scarf合作,收集匿名用户统计数据,以了解我们的社区正在使用哪些功能,以及如何优先考虑未来的产品决策。要退出此数据收集,您可以设置环境变量SCARF_NO_ANALYTICS=true