我有我工作场所使用的独特产品的图片。我无法想象inception数据库已经有类似的训练过的项目了。
我试着用YOLO训练一个模型。这花了很长时间。两个时期之间可能需要7分钟;由于数据量很小,我想做1000个时期。
我在1.0 GPU上使用tiny-yolov2-voc cfg/weight。我有一个项目的视频,但我把它拆成帧,以便我可以注释。然后我尝试在图像(而不是视频)上进行训练。这些产品与医疗保健相关。基本上是医院会用的任何东西。
我还在我从谷歌得到的图片上使用了inception方法。我注意到inception方法非常快,并且可以得到准确的预测。然而,我担心我的图像太独特了,不适合“盗梦空间”。
使用哪种方法最好?
如果你推荐YOLO,你能提供关于如何加快培训阶段的建议吗?
如果你推荐inception,你能解释一下为什么它会在独特的图像上工作吗?我想我在理解inception如何知道我在没有提供注释的情况下尝试训练哪个项目时遇到了问题。
提前感谢
发布于 2018-06-18 12:51:09
只是我的印象(没有推荐,甚至没有相关经验)
看一看与darknet相关的Hardware recommendations,一个假设是您可能会购买自己的硬件以获得更快的结果。
我读到了关于当前三个不同版本的YOLO,如果你下载推荐的文件,我希望有很多GFLOPS培训包括在内,但如果这些模型永远不适合你的产品,那么对你来说,它们可能永远不会有很大帮助。
我必须承认,我既不活跃于YOLO,也不活跃于Tensorflow,所以我的印象可能一点帮助都没有。
如果你看到一些YOLO的视频,你可以注意到,有时骆驼被贴上马的标签,准确性似乎很差,但这取决于应用于图像的阈值,因此视频看起来很神奇,因为它似乎识别完成得如此之快,但如果准确率更高,过程会变慢-这也取决于训练的动机。
他们从不隐藏它,他们在一张狗被标记为牛,马被标记为羊(Version 2)的图像上解释说,与darknet相结合,它变得更快,但准确性也降低了,所以使用darknet也是一个重要的方面。
关于细节的信息在YOLO的网站上看起来相当糟糕,他们呈现的更像是流行歌星,相比之下,Tensorflow的网站看起来更学术,而且是关于框架背后的数学知识。
关于Tensorflow,我不知道关于硬件的建议,但正如你写的那样,你的结果是有用的,可能是有点甚至更少。
我的印象是,YOLO主要用于(现场)视频中的实时检测,需要进行大量培训才能获得高精度。因此,根据您的用例,它可能是正确的,但您可能会投资于硬件,可能用于专业用途。
这并不是反对Tensorflow的观点,而是我必须验证更多,似乎需要更多的时间才能得到印象。关于目前的Tensorflow,我甚至不能说它是否可以用于实时检测,它的准确性如何,结果是否比YOLO更好。
我的假设是,对于这两种解决方案,这都是涉及到的元素(比如决定是否包含暗网以提高速度)、配置、训练和调整的问题。也许总会有一些东西可以提高速度和准确性,所以投资于一个识别系统将不会是一个在时间线上固定结束的静态过程,而是一个稳定的过程。
这只是我的印象的一个简短概述,我从来没有任何识别软件的经验,也很难建议你根据我的话做出任何决定。
如果你真的想使用任何识别软件专业人士,特别是实时识别,那么你可能不得不投资于硬件。
发布于 2018-11-17 09:19:18
根据我对你的问题的理解,你需要你需要具备识别你独特图像的能力的初始能力。在这种情况下,您可以在初始模型上使用迁移学习。有了迁移学习,你仍然可以训练自己的图像,同时保留以前的知识。
有关transfer-learning的更多信息
https://stackoverflow.com/questions/50902153
复制相似问题