如果有人能为下面的项目提供一些提示和评估,我会很高兴的。(我对ML和DL比较陌生,只有一点理论知识)
我的目标是为图像中的接收角建立一个检测器。我开始创建一个包含收据图像的数据集,标签是收据的4个角点。
我的计划是用数据集训练CNN,我想知道你是否能给我一个估计,我需要多少图像在我的数据集中成功地训练它(它是几百或几千)?对于网络来说,这是一项相当简单的任务,还是由于图像中有大量的fo像素而变得复杂?
编辑:(谢谢你目前的回答!)
我开始使用pytorch进行预培训的ResNet18,并被困在以下问题上,因为任务与我迄今发现的基本分类教程不同:
发布于 2021-06-25 12:55:51
要用数据集图像训练CNN模型,无论是数百张还是数千张,您都需要在系统上具有良好的处理能力或基础设施。有了正常的配置,比如4GB RAM,您可以继续使用数百幅图像对模型进行培训,它运行良好,您还可以验证和测试您的数据。或者,您也可以通过将Google模式算法连接到托管运行时来尝试Google的运行库,因为它为单个用户分配了12 it的RAM。
发布于 2021-06-30 15:29:08
如果不知道更多的细节,就不可能说出你需要多少张图片。根据数据的多样性和用例的复杂性,您可能能够使用少于100个映像来训练一个性能良好的模型。
一般来说,机器学习应用程序是软件和数据的混合体。但是,获得正确的数据比代码本身更重要。现在培养一个模特已经相当容易了。有大量关于如何编写代码或工具的教程,您可以免费使用这些代码或工具(我个人使用hasty.ai )来快速原型。当您刚接触机器学习时,使用这些工具特别方便,因为它大大降低了复杂性。但是,创建正确的数据集是您自己需要做的事情。
https://datascience.stackexchange.com/questions/97092
复制相似问题