binarize#

sklearn.preprocessing.binarize(X, *, threshold=0.0, copy=True)#

布尔阈值处理数组类或scipy.sparse矩阵。

更多信息请参阅 用户指南

Parameters:
X{array-like, sparse matrix} of shape (n_samples, n_features)

要进行二值化的数据,逐元素处理。 scipy.sparse矩阵应为CSR或CSC格式,以避免不必要的复制。

thresholdfloat, default=0.0

特征值低于或等于此值的被替换为0,高于此值的被替换为1。 对于稀疏矩阵的操作,阈值不能小于0。

copybool, default=True

如果为False,尝试避免复制并在原地进行二值化。 这不能保证总是原地工作;例如,如果数据是一个对象dtype的numpy数组,即使copy=False也会返回一个副本。

Returns:
X_tr{ndarray, sparse matrix} of shape (n_samples, n_features)

转换后的数据。

See also

Binarizer

使用Transformer API进行二值化 (例如,作为预处理 Pipeline 的一部分)。

Examples

>>> from sklearn.preprocessing import binarize
>>> X = [[0.4, 0.6, 0.5], [0.6, 0.1, 0.2]]
>>> binarize(X, threshold=0.5)
array([[0., 1., 0.],
       [1., 0., 0.]])