mlxtend version: 0.23.1

apriori

apriori(df, min_support=0.5, use_colnames=False, max_len=None, verbose=0, low_memory=False)

获取单热编码DataFrame中的频繁项集

Parameters

Returns

pandas DataFrame,包含列['support', 'itemsets'], 所有支持度 >= min_support 且 < max_len 的项集 (如果max_len不为None). 'itemsets'列中的每个项集都是frozenset类型, 这是一种Python内置类型,其行为类似于集合, 只是它是不可变的 (更多信息,请参见 https://docs.python.org/3.6/library/stdtypes.html#frozenset).

Examples

有关使用示例,请参见 https://rasbt.github.io/mlxtend/user_guide/frequent_patterns/apriori/

association_rules

association_rules(df, metric='confidence', min_threshold=0.8, support_only=False)

生成包含指标 'score'、'confidence' 和 'lift' 的关联规则 DataFrame

Parameters

'leverage'、'conviction' 和 'zhangs_metric' 这些指标的计算方式如下:

- support(A->C) = support(A+C) [即 'support'],范围:[0, 1]

- confidence(A->C) = support(A+C) / support(A),范围:[0, 1]

- lift(A->C) = confidence(A->C) / support(C),范围:[0, inf]

- leverage(A->C) = support(A->C) - support(A)*support(C),
范围:[-1, 1]

- conviction = [1 - support(C)] / [1 - confidence(A->C)],
范围:[0, inf]

- zhangs_metric(A->C) =
leverage(A->C) / max(support(A->C)*(1-support(A)), support(A)*(support(C)-support(A->C)))
范围:[-1,1]

Returns

包含列 "antecedents" 和 "consequents" 的 pandas DataFrame 存储项集,以及评分指标列: "antecedent support"、"consequent support"、 "support"、"confidence"、"lift"、 "leverage"、"conviction" 所有满足 metric(rule) >= min_threshold 的规则. "antecedents" 和 "consequents" 列中的每个条目都是 类型 frozenset,这是 Python 内置类型, 行为类似于集合,但不可变 (更多信息请参见 https://docs.python.org/3.6/library/stdtypes.html#frozenset).

Examples

使用示例请参见 https://rasbt.github.io/mlxtend/user_guide/frequent_patterns/association_rules/

fpgrowth

fpgrowth(df, min_support=0.5, use_colnames=False, max_len=None, verbose=0)

获取单热编码DataFrame中的频繁项集

Parameters

Returns

pandas DataFrame,包含['support', 'itemsets']列的所有项集, 这些项集的支持度 >= min_support 且 < max_len (如果max_len不为None). 'itemsets'列中的每个项集是frozenset类型, 这是一种Python内置类型,行为类似于集合,但不可变 (更多信息,请参见 https://docs.python.org/3.6/library/stdtypes.html#frozenset).

Examples

使用示例请参见 https://rasbt.github.io/mlxtend/user_guide/frequent_patterns/fpgrowth/

fpmax

fpmax(df, min_support=0.5, use_colnames=False, max_len=None, verbose=0)

获取单热编码DataFrame中的最大频繁项集

Parameters

Returns

pandas DataFrame,包含列['support', 'itemsets'],其中包含所有支持度 >= min_support 且 < max_len(如果max_len不为None)的最大项集. 'itemsets'列中的每个项集是frozenset类型, 这是Python内置类型,行为类似于集合,但不可变 (更多信息请参见 https://docs.python.org/3.6/library/stdtypes.html#frozenset).

Examples

使用示例请参见 https://rasbt.github.io/mlxtend/user_guide/frequent_patterns/fpmax/

hmine

hmine(df, min_support=0.5, use_colnames=False, max_len=None, verbose=0) -> pandas.core.frame.DataFrame

获取单热编码DataFrame中的频繁项集

Parameters

Returns

pandas DataFrame,包含['support', 'itemsets']列的所有项集, 这些项集的支持度 >= min_support 且 < max_len(如果max_len不为None). 'itemsets'列中的每个项集是frozenset类型, 这是Python内置类型,行为类似于集合,但不可变 (更多信息请参见https://docs.python.org/3.6/library/stdtypes.html#frozenset).

Examples

使用示例请参见 https://rasbt.github.io/mlxtend/user_guide/frequent_patterns/hmine/