binarize#
- sklearn.preprocessing.binarize(X, *, threshold=0.0, copy=True)#
布尔阈值处理数组类或scipy.sparse矩阵。
更多信息请参阅 用户指南 。
- Parameters:
- X{array-like, sparse matrix} of shape (n_samples, n_features)
要进行二值化的数据,逐元素处理。 scipy.sparse矩阵应为CSR或CSC格式,以避免不必要的复制。
- thresholdfloat, default=0.0
特征值低于或等于此值的被替换为0,高于此值的被替换为1。 对于稀疏矩阵的操作,阈值不能小于0。
- copybool, default=True
如果为False,尝试避免复制并在原地进行二值化。 这不能保证总是原地工作;例如,如果数据是一个对象dtype的numpy数组,即使copy=False也会返回一个副本。
- Returns:
- X_tr{ndarray, sparse matrix} of shape (n_samples, n_features)
转换后的数据。
Examples
>>> from sklearn.preprocessing import binarize >>> X = [[0.4, 0.6, 0.5], [0.6, 0.1, 0.2]] >>> binarize(X, threshold=0.5) array([[0., 1., 0.], [1., 0., 0.]])