发布于 2021-06-25 00:27:01
我对我的回答不太确定,所以请稍许接受。
我认为你不应该太担心最初的型号被过度安装:
所以我的直觉是,如果有必要的话,就让这个模型有点过火。然而,如果模型覆盖了很多和/或太复杂,这意味着它将需要很多(可能太多)实例被标记。视具体情况而定,这可能是一个更严重的问题:初始模型应该足够体面,以便主动学习过程不需要对许多/所有实例进行标记。
发布于 2021-06-24 20:39:21
您应该在验证数据集上测试您的模型:如果验证分数是正确的,就没有过度拟合。
如果您想确保根本没有过度拟合,您将希望在几个验证数据集上测试您的模型。
https://datascience.stackexchange.com/questions/97060
复制相似问题