cosine_similarity#

sklearn.metrics.pairwise.cosine_similarity(X, Y=None, dense_output=True)#

计算X和Y中样本之间的余弦相似度。

余弦相似度,或余弦核,通过计算X和Y的归一化点积来计算相似度:

K(X, Y) = <X, Y> / (||X||*||Y||)

在L2归一化数据上,此函数等效于linear_kernel。

更多信息请参阅 用户指南

Parameters:
X{array-like, sparse matrix},形状为 (n_samples_X, n_features)

输入数据。

Y{array-like, sparse matrix},形状为 (n_samples_Y, n_features),默认=None

输入数据。如果为 None ,则输出将是 X 中所有样本之间的成对相似度。

dense_outputbool, 默认=True

即使输入是稀疏的,是否返回稠密输出。如果为 False ,则当两个输入数组都是稀疏时,输出是稀疏的。

Added in version 0.17: 参数 dense_output 用于稠密输出。

Returns:
similaritiesndarray 或 sparse matrix,形状为 (n_samples_X, n_samples_Y)

返回X和Y中样本之间的余弦相似度。

Examples

>>> from sklearn.metrics.pairwise import cosine_similarity
>>> X = [[0, 0, 0], [1, 1, 1]]
>>> Y = [[1, 0, 0], [1, 1, 0]]
>>> cosine_similarity(X, Y)
array([[0.     , 0.     ],
       [0.57..., 0.81...]])