就是那个让你教机器画简笔画的Sketch-RNN,他之前在GitHub上发布的旧版Sketch-RNN中,就包含了训练神经网络写汉字的部分,还写过一篇博客介绍如何用Sketch-RNN来生成汉字,所用的数据集是KanjiVG 总之,这应该是一个以Sketch-RNN的JavaScript实现为基础,用KanjiVG训练的卷积神经网络,与之前广受欢迎的Google神经网络画简笔画系列同宗同源。 ? 一是因为它并不会真的用你的笔画匹配真正的汉字,而是根据你的笔画“创造一个像汉字的图形”,很多时候写出来的都实在不像字;另一个原因呢,就在它的名字Kanji-RNN,和数据集KanjiVG里。
[来自KanjiVG数据集的示例] 我认为各种字体和手写体最好用矢量表示,而不是位图。 处理训练数据 我使用了KanjiVG数据库的数据,该数据库源于开源日语学习工具Tagaini Jisho。 KanjiVG包含大约11000汉字的SVG文件,每个SVG文件的路径元素遵循日文汉字的官方笔顺。 下面是从KanjiVG中提取的训练字符的一些训练例子: [来自KanjiVG数据集的训练实例。不同的颜色表示每个汉字的不同笔划。]
训练数据样本,不同的颜色代表了笔画顺序,来源于KanjiVG数据集 在sketch-rnn中,每一笔都用类似笔画的数据建模,其中每一步数据都包含x和y轴的偏移量,以及这一笔是落在纸上还是没有落在纸上,如果落在纸上