我有一个带有句子的数据,我用了countvectorizer和一个预定义的词汇表。对于一些词汇来说,即使句子中包含字典中的单词,返回值也是0。由于某种原因不起作用的词语清单如下:* 1 report* not a good fit* c levelCountVectorizer的定义如下:科尔斯是字典的地方
我确信这与令牌程序
但是,我在使用CountVectorizer测试包含未见单词的新文本字符串时遇到了困难。def trainingVectorTransformation (messages): vect = CountVectorizerVOCABULARY AND USE IT APPROPRIATELY vocabula