我正在开发一个iOS应用程序,一切看起来都很好,直到我尝试捕捉数字时钟、计算器、血压监视器、电子温度计等图像。
由于某种原因,苹果视觉框架和VNRecognizeTextRequest无法识别原始液晶屏幕上的文本,比如:

您可以尝试用苹果的样本项目捕获数字,结果会失败。或者您可以尝试“视觉框架”的任何其他示例项目,但是它将无法将数字识别为文本。
作为最终框架用户,我能做什么?有解决办法吗?
发布于 2020-03-30 12:33:10
训练一个模特..。
训练自己的.mlmodel使用多达10K的图像,其中包含数字时钟、计算器、血压监视器等屏幕。为此,您可以使用Xcode Playground或Apple Create ML应用程序。
下面是可以复制并粘贴到macOS游乐场的代码:
import Foundation
import CreateML
let trainDir = URL(fileURLWithPath: "/Users/swift/Desktop/Screens/Digits")
// let testDir = URL(fileURLWithPath: "/Users/swift/Desktop/Screens/Test")
var model = try MLImageClassifier(trainingData: .labeledDirectories(at: trainDir),
parameters: .init(featureExtractor: .scenePrint(revision: nil),
validation: .none,
maxIterations: 25,
augmentationOptions: [.blur, .noise, .exposure]))
let evaluation = model.evaluation(on: .labeledDirectories(at: trainDir))
let url = URL(fileURLWithPath: "/Users/swift/Desktop/Screens/Screens.mlmodel")
try model.write(to: url)从图像中提取文本..。
如果您想知道如何使用视觉框架从图像中提取文本,请查看这个职位。
发布于 2020-03-27 20:32:31
你可以训练你自己的模型,例如鲜花
https://stackoverflow.com/questions/60855437
复制相似问题