mean_variance_axis#

sklearn.utils.sparsefuncs.mean_variance_axis(X, axis, weights=None, return_sum_weights=False)#

计算CSR或CSC矩阵沿某一轴的均值和方差。

Parameters:
X形状为 (n_samples, n_features) 的稀疏矩阵

输入数据。可以是CSR或CSC格式。

axis{0, 1}

应沿其计算均值和方差的轴。

weights形状为 (n_samples,) 或 (n_features,) 的ndarray, 默认=None

如果轴设置为0,形状为 (n_samples,) 或 如果轴设置为1,形状为 (n_features,)。 如果设置为None,则样本等权重。

Added in version 0.24.

return_sum_weightsbool, 默认=False

如果为True,则返回每个特征的权重和 如果 axis=0 或每个样本的权重和如果 axis=1

Added in version 0.24.

Returns:
means形状为 (n_features,) 的ndarray, dtype=floating

特征级均值。

variances形状为 (n_features,) 的ndarray, dtype=floating

特征级方差。

sum_weights形状为 (n_features,) 的ndarray, dtype=floating

如果 return_sum_weightsTrue ,则返回。

Examples

>>> from sklearn.utils import sparsefuncs
>>> from scipy import sparse
>>> import numpy as np
>>> indptr = np.array([0, 3, 4, 4, 4])
>>> indices = np.array([0, 1, 2, 2])
>>> data = np.array([8, 1, 2, 5])
>>> scale = np.array([2, 3, 2])
>>> csr = sparse.csr_matrix((data, indices, indptr))
>>> csr.todense()
matrix([[8, 1, 2],
        [0, 0, 5],
        [0, 0, 0],
        [0, 0, 0]])
>>> sparsefuncs.mean_variance_axis(csr, axis=0)
(array([2.  , 0.25, 1.75]), array([12.    ,  0.1875,  4.1875]))