文章/答案/技术大牛

发布

社区首页 >问答首页 >Tensorflow从大型数据集创建tf.ragged.constant

问Tensorflow从大型数据集创建tf.ragged.constant
EN

Stack Overflow用户

提问于 2021-03-24 21:53:50

回答 1查看 135关注 0票数 1

具有50,000个用户的DF，每个用户具有不同的行数：

                      id            feature_1  ...           feature10  feature11
0  1587712104294-4384584            -0.661835  ...           -1.768028   -0.38924
1  1587712104294-4384584            -0.661835  ...           -1.709090   -0.38924
---- User 2 starts here ----
2  1587712104294-1234584            -0.661835  ...           -1.708693   -0.38924
3  1587712104294-1234584            -0.661835  ...           -1.627594   -0.38924
4  1587712104294-1234584            -0.653476  ...           -1.329767   -0.38924

我使用以下代码来创建一个tf.ragged.constant

x_np_values = data.values
# take all columns beside the id column and use the id to group arrays 
X = np.split(x_np_values[:,1:], np.unique(x_np_values[:, 0], return_index=True)[1][1:])
X = tf.ragged.constant(X)

代码删除了id列，并创建了用户行的参差不齐的常量。然而，这只适用于数据的一小部分。对于整个数据集，它需要很长时间，有时还会使我的机器崩溃。

按id分组并从其余列创建一个参差不齐的常量的正确方法是什么？

python

numpy

tensorflow

keras

ragged-tensors

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-06-16 17:15:56

我发现这个方法在创建参差不齐的常量方面要快得多：

def get_ragged_constants(data):
    return tf.RaggedTensor.from_row_lengths(
        values=data.values,
        row_lengths=data.groupby('GROUP_ID').size())

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/66782551

复制

相似问题

问Tensorflow从大型数据集创建tf.ragged.constant
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Tensorflow从大型数据集创建tf.ragged.constantEN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Tensorflow从大型数据集创建tf.ragged.constant
EN