pandas.plotting.andrews_curves#

pandas.plotting.andrews_curves(frame, class_column, ax=None, samples=200, color=None, colormap=None, **kwargs)[源代码][源代码]#

生成一个 matplotlib 图表以可视化多元数据的聚类。

Andrews 曲线具有以下函数形式:

\[f(t) = \frac{x_1}{\sqrt{2}} + x_2 \sin(t) + x_3 \cos(t) + x_4 \sin(2t) + x_5 \cos(2t) + \cdots\]

其中 \(x\) 系数对应于每个维度的值,而 \(t\) 在线性分布在 \(-\pi\)\(+\pi\) 之间。frame 的每一行对应于一条单独的曲线。

参数:
frameDataFrame

要绘制的数据,最好归一化到 (0.0, 1.0)。

class_columnlabel

包含类名的列的名称。

axaxes 对象,默认 None

要使用的轴。

示例int

每条曲线中要绘制的点数。

颜色str, list[str] 或 tuple[str], 可选

用于不同类别的颜色。颜色可以是字符串或3元素浮点型RGB值。

colormapstr 或 matplotlib 颜色映射对象,默认 None

用于选择颜色的颜色映射。如果是一个字符串,则从 matplotlib 加载具有该名称的颜色映射。

**kwargs

传递给 matplotlib 绘图方法的选项。

返回:
matplotlib.axes.Axes

示例

>>> df = pd.read_csv(
...     "https://raw.githubusercontent.com/pandas-dev/"
...     "pandas/main/pandas/tests/io/data/csv/iris.csv"
... )
>>> pd.plotting.andrews_curves(df, "Name")  
../../_images/pandas-plotting-andrews_curves-1.png