我正在对文本数据集进行预处理。我在里面有一些数字,比如:
是否建议在为任何模型(分类/回归)创建向量器(蝴蝶结/tf-以色列国防军)之前放弃这些数字?
任何在这方面的快速帮助都是非常感谢的。谢谢
发布于 2022-02-17 20:16:35
发布于 2020-09-01 14:26:42
是否建议在为任何模型(分类/回归)创建向量器(蝴蝶结/tf-以色列国防军)之前放弃这些数字?
这取决于问题陈述,例如,如果您想要找到趋势,并且年份具有许多独特的值,那么年份可能很重要,但是如果它是常量,那么您可以删除它。
另外,如果你在做情绪分析,那么数值变量就没有多大意义了。
https://datascience.stackexchange.com/questions/81076
复制相似问题