BiclusterMixin#

class sklearn.base.BiclusterMixin#

Mixin类用于scikit-learn中的所有双聚类估计器。

这个mixin定义了以下功能:

  • biclusters_ 属性,返回行和列的指示器;

  • get_indices 方法,返回一个双聚类的行和列索引;

  • get_shape 方法,返回一个双聚类的形状;

  • get_submatrix 方法,返回对应于一个双聚类的子矩阵。

Examples

>>> import numpy as np
>>> from sklearn.base import BaseEstimator, BiclusterMixin
>>> class DummyBiClustering(BiclusterMixin, BaseEstimator):
...     def fit(self, X, y=None):
...         self.rows_ = np.ones(shape=(1, X.shape[0]), dtype=bool)
...         self.columns_ = np.ones(shape=(1, X.shape[1]), dtype=bool)
...         return self
>>> X = np.array([[1, 1], [2, 1], [1, 0],
...               [4, 7], [3, 5], [3, 6]])
>>> bicluster = DummyBiClustering().fit(X)
>>> hasattr(bicluster, "biclusters_")
True
>>> bicluster.get_indices(0)
(array([0, 1, 2, 3, 4, 5]), array([0, 1]))
property biclusters_#

方便地同时获取行和列指示符。

返回 rows_columns_ 成员。

get_indices(i)#

行和列索引的 i ‘th双聚类。

只有在 rows_columns_ 属性存在时才有效。

Parameters:
iint

聚类的索引。

Returns:
row_indndarray, dtype=np.intp

属于双聚类的数据集中的行索引。

col_indndarray, dtype=np.intp

属于双聚类的数据集中的列索引。

get_shape(i)#

形状的第 i 个双聚类。

Parameters:
iint

聚类的索引。

Returns:
n_rowsint

双聚类中的行数。

n_colsint

双聚类中的列数。

get_submatrix(i, data)#

返回对应于双聚类 i 的子矩阵。

Parameters:
iint

聚类的索引。

dataarray-like of shape (n_samples, n_features)

数据。

Returns:
submatrixndarray of shape (n_rows, n_cols)

对应于双聚类 i 的子矩阵。

Notes

适用于稀疏矩阵。仅在 rows_columns_ 属性存在时有效。