跳到主要内容

💻 安装

PyCaret 3.0-rc 现已可用 。使用 pip install --pre pycaret 来尝试。查看这个示例 Notebook

安装

PyCaret 在以下 64 位系统上经过测试和支持:

  • Python 3.6 – 3.8
  • Python 3.9 仅适用于 Ubuntu
  • Ubuntu 16.04 或更高版本
  • Windows 7 或更高版本

使用 Python 的 pip 包管理器安装 PyCaret。

pip install pycaret

要安装完整版本(参见下面的依赖项):

pip install pycaret[full]

如果您想尝试我们的夜间构建(不稳定版本),可以从 pip 安装 pycaret-nightlypip install pycaret-nightly

环境

为了避免与其他软件包可能发生的冲突,强烈建议使用虚拟环境,例如 python3 的虚拟环境(参见 python3 虚拟环境文档)或者 conda 环境。使用隔离的环境可以独立安装特定版本的 pycaret 及其依赖项,而不会受到先前安装的 Python 软件包的影响。;

# 创建 conda 环境
conda create --name yourenvname python=3.8

# 激活 conda 环境
conda activate yourenvname

# 安装 pycaret
pip install pycaret

# 创建 notebook 内核
python -m ipykernel install --user --name yourenvname --display-name "display-name"
PyCaret **尚不**与 sklearn>=0.23.2 兼容。

GPU

使用 PyCaret,您可以在 GPU 上训练模型,加快工作流程速度。只需在 setup 函数中传递 use_gpu = True 即可在 GPU 上训练模型。API 的使用方式没有变化,但在某些情况下,可能需要安装其他库,因为它们不会随默认版本或完整版本一起安装。截至最新版本,以下模型可以在 GPU 上训练:

  • 极端梯度提升(无需进一步安装)
  • Catboost(无需进一步安装)
  • Light Gradient Boosting Machine 需要 GPU 安装
  • 逻辑回归、岭分类器、随机森林、K 近邻分类器、K 近邻回归器、支持向量机、线性回归、岭回归、Lasso 回归 需要 cuML >= 0.15

依赖项

选择选项卡

requirements

pandas;

scipy 1.5.4

seaborn;

matplotlib;

IPython;

joblib;

scikit-learn==0.23.2;

ipywidgets;

yellowbrick>=1.0.1;

lightgbm>=2.3.1;

plotly>=4.4.1;

wordcloud;

textblob;

cufflinks>=0.17.0;

umap-learn;

pyLDAvis;

gensim 4.0.0;

spacy 2.4.0;

nltk;

mlxtend>=0.17.0;

pyod;

pandas-profiling>=2.8.0;

kmodes>=0.10.1;

mlflow;

imbalanced-learn==0.7.0;

scikit-plot;

Boruta;

pyyaml<6.0.0;

numba<0.55

requirements-optional

shap;

interpret<=0.2.4;

tune-sklearn>=0.2.1;

ray\[tune]>=1.0.0;

hyperopt;

optuna>=2.2.0;

scikit-optimize>=0.8.1;

psutil;

catboost>=0.23.2;

xgboost>=1.1.0;

explainerdashboard;

m2cgen;

evidently;

autoviz;

fairlearn;

fastapi;

uvicorn;

gradio;

fugue>=0.6.5;

boto3;

azure-storage-blob;

google-cloud-storage

requirements-test

pytest;

moto;

codecov;

**注意:**我们正在积极努力减少下一个主要版本中的默认依赖项。我们打算在将来支持功能级别和模块特定的安装。例如:pip install pycaret[nlp]

从源代码构建

要直接从 GitHub 安装软件包(最新源代码),请使用以下命令:

pip install git+https://github.com/pycaret/pycaret.git#egg=pycaret

不要忘记包含 #egg=pycaret 部分,以明确命名项目,这样 pip 可以在没有运行 setup.py 脚本的情况下跟踪其元数据。

运行测试:

要启动测试套件,请从源代码目录外运行以下命令:

pytest pycaret

Docker

Docker 使用容器创建虚拟环境,将 PyCaret 安装与系统的其余部分隔离开来。PyCaret Docker 预装了一个 Notebook 环境,可以与主机共享资源(访问目录、使用 GPU、连接互联网等)。PyCaret Docker 镜像在每个发布版本中都经过测试。

docker run -p 8888:8888 pycaret/slim

要使用完整版本的 Docker 镜像,请运行以下命令:

docker run -p 8888:8888 pycaret/full

要了解更多信息,请查看此文档