mlxtend version: 0.23.1

generalize_names

generalize_names(name, output_sep=' ', firstname_output_letters=1)

泛化一个人的姓和名.

Parameters

Returns

Examples

有关使用示例,请参见 https://rasbt.github.io/mlxtend/user_guide/text/generalize_names/

generalize_names_duplcheck

generalize_names_duplcheck(df, col_name)

泛化名称并去除重复项.

Parameters

Returns

Examples

有关使用示例,请参见 https://rasbt.github.io/mlxtend/user_guide/text/generalize_names_duplcheck/

tokenizer_emoticons

tokenizer_emoticons(text)

返回文本中的表情符号

Examples

    >>> tokenizer_emoticons('</a>This :) is :( a test :-)!')
    [':)', ':(', ':-)']

    有关使用示例,请参见
    https://rasbt.github.io/mlxtend/user_guide/text/tokenizer_emoticons/

tokenizer_words_and_emoticons

tokenizer_words_and_emoticons(text)

将文本转换为小写单词和表情符号.

Examples

    >>> tokenizer_words_and_emoticons('</a>This :) is :( a test :-)!')
    ['this', 'is', 'a', 'test', ':)', ':(', ':-)']

    更多使用示例,请参见
    https://rasbt.github.io/mlxtend/user_guide/text/tokenizer_words_and_emoticons/