分词器将原始字符串输入转换为适合 Keras Embedding 层的整数输入。 它们还可以将预测的整数序列转换回原始字符串输出。
Embedding
所有分词器都是 keras_nlp.tokenizers.Tokenizer 的子类,而它又是 keras.layers.Layer 的子类。分词器通常应在 tf.data.Dataset.map 中应用于训练,并可以包含在 keras.Model 中进行推理。
keras_nlp.tokenizers.Tokenizer
keras.layers.Layer
keras.Model