mean_variance_axis#
- sklearn.utils.sparsefuncs.mean_variance_axis(X, axis, weights=None, return_sum_weights=False)#
计算CSR或CSC矩阵沿某一轴的均值和方差。
- Parameters:
- X形状为 (n_samples, n_features) 的稀疏矩阵
输入数据。可以是CSR或CSC格式。
- axis{0, 1}
应沿其计算均值和方差的轴。
- weights形状为 (n_samples,) 或 (n_features,) 的ndarray, 默认=None
如果轴设置为0,形状为 (n_samples,) 或 如果轴设置为1,形状为 (n_features,)。 如果设置为None,则样本等权重。
Added in version 0.24.
- return_sum_weightsbool, 默认=False
如果为True,则返回每个特征的权重和 如果
axis=0
或每个样本的权重和如果axis=1
。Added in version 0.24.
- Returns:
- means形状为 (n_features,) 的ndarray, dtype=floating
特征级均值。
- variances形状为 (n_features,) 的ndarray, dtype=floating
特征级方差。
- sum_weights形状为 (n_features,) 的ndarray, dtype=floating
如果
return_sum_weights
为True
,则返回。
Examples
>>> from sklearn.utils import sparsefuncs >>> from scipy import sparse >>> import numpy as np >>> indptr = np.array([0, 3, 4, 4, 4]) >>> indices = np.array([0, 1, 2, 2]) >>> data = np.array([8, 1, 2, 5]) >>> scale = np.array([2, 3, 2]) >>> csr = sparse.csr_matrix((data, indices, indptr)) >>> csr.todense() matrix([[8, 1, 2], [0, 0, 5], [0, 0, 0], [0, 0, 0]]) >>> sparsefuncs.mean_variance_axis(csr, axis=0) (array([2. , 0.25, 1.75]), array([12. , 0.1875, 4.1875]))