BiclusterMixin#

class sklearn.base.BiclusterMixin#

Mixin类用于scikit-learn中的所有双聚类估计器。

这个mixin定义了以下功能：

biclusters_ 属性，返回行和列的指示器；
get_indices 方法，返回一个双聚类的行和列索引；
get_shape 方法，返回一个双聚类的形状；
get_submatrix 方法，返回对应于一个双聚类的子矩阵。

Examples

>>> import numpy as np
>>> from sklearn.base import BaseEstimator, BiclusterMixin
>>> class DummyBiClustering(BiclusterMixin, BaseEstimator):
...     def fit(self, X, y=None):
...         self.rows_ = np.ones(shape=(1, X.shape[0]), dtype=bool)
...         self.columns_ = np.ones(shape=(1, X.shape[1]), dtype=bool)
...         return self
>>> X = np.array([[1, 1], [2, 1], [1, 0],
...               [4, 7], [3, 5], [3, 6]])
>>> bicluster = DummyBiClustering().fit(X)
>>> hasattr(bicluster, "biclusters_")
True
>>> bicluster.get_indices(0)
(array([0, 1, 2, 3, 4, 5]), array([0, 1]))

property biclusters_#

方便地同时获取行和列指示符。

返回 rows_ 和 columns_ 成员。

get_indices(i)#

行和列索引的 i ‘th双聚类。

只有在 rows_ 和 columns_ 属性存在时才有效。

Parameters:

iint: 聚类的索引。

Returns:

row_indndarray, dtype=np.intp: 属于双聚类的数据集中的行索引。
col_indndarray, dtype=np.intp: 属于双聚类的数据集中的列索引。

get_shape(i)#

形状的第 i 个双聚类。

Parameters:

iint: 聚类的索引。

Returns:

n_rowsint: 双聚类中的行数。
n_colsint: 双聚类中的列数。

get_submatrix(i, data)#

返回对应于双聚类 i 的子矩阵。

Parameters:

iint: 聚类的索引。
dataarray-like of shape (n_samples, n_features): 数据。

Returns:

submatrixndarray of shape (n_rows, n_cols): 对应于双聚类 i 的子矩阵。

Notes

适用于稀疏矩阵。仅在 rows_ 和 columns_ 属性存在时有效。