文章/答案/技术大牛

发布

问验证码识别准确率低
EN

Stack Overflow用户

提问于 2017-05-13 23:14:12

回答 1查看 190关注 0票数 0

我使用以下方法生成最多4位数字的验证码：

def genData(n=30000, max_digs=4, width=150):
    capgen = ImageCaptcha()
    data = []
    target = []
    for i in range(n):
        x = np.random.randint(0, 10 ** max_digs)
        img = misc.imread(capgen.generate(str(x)))
        img = np.mean(img, axis=2)[:, :width]
        data.append(img.flatten())
        target.append(x)
    return np.array(data), np.array(target)

然后我像下面这样处理数据

train_data, train_target = genData()
test_data, test_target = genData(1000)

train_data = train_data.reshape(train_data.shape[0], 1, 150, 60)
test_data = test_data.reshape(test_data.shape[0], 1, 150, 60)
train_data = train_data.astype('float32')
test_data = test_data.astype('float32')
train_data /= 255
test_data /= 255

我的模型结构如下：

def get_model():
    # create model
    model = Sequential()
    model.add(Conv2D(30, (5, 5), input_shape=(1, 150, 60), activation='relu'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Conv2D(15, (3, 3), activation='relu'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.2))
    model.add(Flatten())
    model.add(Dense(128, activation='relu'))
    model.add(Dense(50, activation='relu'))
    model.add(Dense(10 ** 4, activation='softmax'))
    # Compile model
    model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
    return model

然后我在训练模型

model = get_model()
# Fit the model
model.fit(train_data, train_target, validation_data=(test_data, test_target), epochs=10, batch_size=200)
# Final evaluation of the model
scores = model.evaluate(test_data, test_target, verbose=0)
print("Large CNN Error: %.2f%%" % (100 - scores[1] * 100))

我不知道我做错了哪一部分，但我的准确率甚至达不到%1。

python

machine-learning

tensorflow

keras

captcha

回答 1

Stack Overflow用户

发布于 2017-05-14 22:08:38

你有10000(!)类。你训练多长时间？你每节课有多少训练数据？

你的方法几乎可以肯定是问题所在。虽然你可以像这样“蛮力”地解决问题，但这是一种非常糟糕的方式。您应该首先尝试检测单个数字，然后使用10类分类器对每个数字进行分类。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/43954712

复制

相似问题

问验证码识别准确率低
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问验证码识别准确率低EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问验证码识别准确率低
EN