首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >SKFLOW中包含数值数据的RNN

SKFLOW中包含数值数据的RNN
EN

Stack Overflow用户
提问于 2016-02-18 07:12:57
回答 1查看 1.4K关注 0票数 1

我想在一些有实值的时间序列数据上尝试SKFLOW递归神经网络来解决二进制分类问题。我的数据的每一行包含57个特征(变量),我想查看前两个样本和下两个样本,以对每一行进行预测。

我的数据如下所示:

示例-2: f1,f2,f3,f4,...f57,示例-1: f1,f2,f3,f4,...f57,当前示例: f1,f2,f3,f4,...f57,示例+1: f1,f2,f3,f4,,示例+2:,

我从SKFLOW example RNN for text classification开始。

代码语言:javascript
复制
MAX_DOCUMENT_LENGTH = 10

vocab_processor = skflow.preprocessing.VocabularyProcessor(MAX_DOCUMENT_LENGTH)
X_train = np.array(list(vocab_processor.fit_transform(X_train)))
X_test = np.array(list(vocab_processor.transform(X_test)))

n_words = len(vocab_processor.vocabulary_)
print('Total words: %d' % n_words)

### Models

EMBEDDING_SIZE = 50

# Customized function to transform batched X into embeddings
def input_op_fn(X):
    # Convert indexes of words into embeddings.
    # This creates embeddings matrix of [n_words, EMBEDDING_SIZE] and then
    # maps word indexes of the sequence into [batch_size, sequence_length,
    # EMBEDDING_SIZE].
    word_vectors = skflow.ops.categorical_variable(X, n_classes=n_words,
        embedding_size=EMBEDDING_SIZE, name='words')
    # Split into list of embedding per word, while removing doc length dim.
    # word_list results to be a list of tensors [batch_size, EMBEDDING_SIZE].
    word_list = skflow.ops.split_squeeze(1, MAX_DOCUMENT_LENGTH, word_vectors)
    return word_list

# Single direction GRU with a single layer
classifier = skflow.TensorFlowRNNClassifier(rnn_size=EMBEDDING_SIZE, 
    n_classes=15, cell_type='gru', input_op_fn=input_op_fn,
    num_layers=1, bidirectional=False, sequence_length=None,
    steps=1000, optimizer='Adam', learning_rate=0.01, continue_training=True)

看起来我应该能够修改input_op_fn使其工作,但我不确定如何正确地将我的numpy数组转换为skflow.TensorFlowRNNClassifier的张量。这是文本分类示例的样子。

代码语言:javascript
复制
>>> word_vectors.get_shape() 

TensorShape([Dimension(560000), Dimension(10), Dimension(50)])

>>> len(word_list)

10

如果我正确地解释了文本问题,那么我的问题就是维度(TensorShape(#row),Dimension(57),Dimension(3))

EN

回答 1

Stack Overflow用户

发布于 2016-02-18 09:21:20

查看RNN的unit test

假设这是数字数据:data = np.array(list([[2, 1, 2, 2, 3], [2, 2, 3, 4, 5], [3, 3, 1, 2, 1], [2, 4, 5, 4, 1]]), dtype=np.float32) labels = np.array(list([1, 0, 1, 0]), dtype=np.float32)

data的形状为(4, 5),其中4是batch_size,5是sequence_length。然后,您希望在input_op_fn()中使用tf.split(1, 5, X)。希望这能有所帮助。欢迎您提交PR以添加处理此问题的示例。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/35469664

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档