文章/答案/技术大牛

发布

社区首页 >问答首页 >如何为数据科学面试测试保存随机数据集

问如何为数据科学面试测试保存随机数据集
EN

Stack Overflow用户

提问于 2020-02-05 00:06:35

回答 1查看 152关注 0票数 2

我正在寻找科学知识-学习，以产生一些数据集的数据科学访问。这对我们来说是一个新的角色。

我在调查

sklearn.datasets.make_regression

有了这个开始

import numpy as np

from sklearn import linear_model, datasets


n_samples = 1000
n_outliers = 50


X, y, coef = datasets.make_regression(n_samples=n_samples, n_features=10,
                                      n_informative=1, noise=10,
                                      coef=True, random_state=0)
array = np.array(list(zip(X, y)))

array.tofile('yourfile.txt',sep=",",format="%s")

我现在所做的是做一些意想不到的事情。

-0.34791215 1.23029068 -0.38732682 0.37816252 1.20237985 -0.30230275 -1.98079647 0.15634897 0.15494743 -0.88778575，-1.2020466345326724，-0.50965218 -1.25279536 -1.61389785 -1.42001794 0.77749036 -0.21274028 1.9507754 -0.4380743 -1.04855297 -1.70627019，-5.471683206809487，2.26975462 0.04575852 1.53277921 0.6536186 -0.18718385 1.46935877 -0.74216502 -1.45436567 -2.55298982 0.8644362、-43.65842091125963、0.44386323 1.49407907 0.3130677 1.45427351 -0.20515826 -0.85409574 0.12167502 0.33367433 0.14404357 0.76103773、-5.470350015809552、1.86755799 0.95008842 -0.10321885 0.40015721 -0.15135721 0.4105985 2.2408932 -0.97727788 1.76405235 0.97873798 31.157017506093

但是如何将其输出到人类可读的CSV文件中呢？

然后，如何从这个CSV导入它，以便我可以创建一个样板设置，供候选人在配对测试期间通过？

python

scikit-learn

回答 1

Stack Overflow用户

发布于 2020-02-05 00:49:35

也许这个

np.save('data.npy', X)
X = np.load('data.npy')

编辑:这似乎更好

np.savez('mat.npz',X=X,y=y,coeff=coef)
data = np.load('mat.npz')
data['X']

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/60067286

复制

相似问题

问如何为数据科学面试测试保存随机数据集
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何为数据科学面试测试保存随机数据集EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何为数据科学面试测试保存随机数据集
EN