pandas.plotting.andrews_curves#
- pandas.plotting.andrews_curves(frame, class_column, ax=None, samples=200, color=None, colormap=None, **kwargs)[源代码][源代码]#
生成一个 matplotlib 图表以可视化多元数据的聚类。
Andrews 曲线具有以下函数形式:
\[f(t) = \frac{x_1}{\sqrt{2}} + x_2 \sin(t) + x_3 \cos(t) + x_4 \sin(2t) + x_5 \cos(2t) + \cdots\]其中 \(x\) 系数对应于每个维度的值,而 \(t\) 在线性分布在 \(-\pi\) 和 \(+\pi\) 之间。frame 的每一行对应于一条单独的曲线。
- 参数:
- frameDataFrame
要绘制的数据,最好归一化到 (0.0, 1.0)。
- class_columnlabel
包含类名的列的名称。
- axaxes 对象,默认 None
要使用的轴。
- 示例int
每条曲线中要绘制的点数。
- 颜色str, list[str] 或 tuple[str], 可选
用于不同类别的颜色。颜色可以是字符串或3元素浮点型RGB值。
- colormapstr 或 matplotlib 颜色映射对象,默认 None
用于选择颜色的颜色映射。如果是一个字符串,则从 matplotlib 加载具有该名称的颜色映射。
- **kwargs
传递给 matplotlib 绘图方法的选项。
- 返回:
示例
>>> df = pd.read_csv( ... "https://raw.githubusercontent.com/pandas-dev/" ... "pandas/main/pandas/tests/io/data/csv/iris.csv" ... ) >>> pd.plotting.andrews_curves(df, "Name")