文章/答案/技术大牛

发布

社区首页 >问答首页 >如何用CreateML正确地训练OCR模型？我的不仅不好，而且一文不值。

问如何用CreateML正确地训练OCR模型？我的不仅不好，而且一文不值。
EN

Stack Overflow用户

提问于 2018-10-13 06:40:16

回答 1查看 638关注 0票数 0

我创建了一个数据集，每个字母生成1个训练图像，每个字母大约有10个真实测试图像。

它们都是10x14px，黑白(在预处理阶段很好地进行了二进制化)。

生成的模型将所有符号识别为“1”(甚至是测试集中的实际图像)，因此基本上它根本无法工作。

谁能给我指明正确的方向？

这是CreateML输出-

Extracting image features from full data set.
Analyzing and extracting image features.
+------------------+--------------+------------------+
| Images Processed | Elapsed Time | Percent Complete |
+------------------+--------------+------------------+
| 1                | 1.74s        | 2.5%             |
| 2                | 1.96s        | 5.25%            |
| 3                | 2.17s        | 8%               |
| 4                | 2.39s        | 10.75%           |
| 5                | 2.60s        | 13.5%            |
| 10               | 3.68s        | 27%              |
| 25               | 6.90s        | 67.5%            |
| 37               | 9.48s        | 100%             |
| 36               | 9.26s        | 97.25%           |
+------------------+--------------+------------------+
Skipping automatic creation of validation set; training set has fewer than 50 points.
Beginning model training on processed features. 
Calibrating solver; this may take some time.
+-----------+--------------+-------------------+
| Iteration | Elapsed Time | Training Accuracy |
+-----------+--------------+-------------------+
| 0         | 0.038845     | 0.027027          |
| 1         | 0.139269     | 0.837838          |
| 2         | 0.268821     | 0.945946          |
| 3         | 0.317312     | 0.945946          |
| 4         | 0.367944     | 0.972973          |
| 5         | 0.422657     | 0.972973          |
| 10        | 0.713325     | 1.000000          |
| 24        | 1.495230     | 1.000000          |
+-----------+--------------+-------------------+
SUCCESS: Optimal solution found.
Extracting image features from evaluation data.
Analyzing and extracting image features.
+------------------+--------------+------------------+
| Images Processed | Elapsed Time | Percent Complete |
+------------------+--------------+------------------+
| 1                | 211.661ms    | 0.25%            |
| 2                | 425.538ms    | 0.75%            |
| 3                | 641.33ms     | 1.25%            |
| 4                | 861.215ms    | 1.75%            |
| 5                | 1.07s        | 2.25%            |
| 10               | 2.16s        | 4.75%            |
| 25               | 5.39s        | 12%              |
| 50               | 10.75s       | 24%              |
| 75               | 16.12s       | 36%              |
| 100              | 21.51s       | 48%              |
| 125              | 26.88s       | 60%              |
| 150              | 32.24s       | 72%              |
| 175              | 37.61s       | 84%              |
| 200              | 42.97s       | 96%              |
| 208              | 44.69s       | 100%             |
| 207              | 44.47s       | 99.5%            |
+------------------+--------------+------------------+
Trained model successfully saved at /mypath/ocr.mlmodel.

createml

ocr

coreml

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-10-13 10:48:08

OCR很难。
你几乎没有足够的训练例子。
Create使用了一个非常强大的“特性提取器”。这也意味着模型很容易简单地记住所有的训练数据，因为图像非常小，而且只有几个。使用Create可以做的事情不多，无法防止这种情况发生。
尝试使用诸如scikit-learn之类的软件包对您的数据进行简单的逻辑回归。它将比深度神经网络工作得好得多。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/52790243

复制

相似问题

问如何用CreateML正确地训练OCR模型？我的不仅不好，而且一文不值。
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何用CreateML正确地训练OCR模型？我的不仅不好，而且一文不值。EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何用CreateML正确地训练OCR模型？我的不仅不好，而且一文不值。
EN