首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何为数据科学面试测试保存随机数据集

如何为数据科学面试测试保存随机数据集
EN

Stack Overflow用户
提问于 2020-02-05 00:06:35
回答 1查看 152关注 0票数 2

我正在寻找科学知识-学习,以产生一些数据集的数据科学访问。这对我们来说是一个新的角色。

我在调查

代码语言:javascript
复制
sklearn.datasets.make_regression

有了这个开始

代码语言:javascript
复制
import numpy as np

from sklearn import linear_model, datasets


n_samples = 1000
n_outliers = 50


X, y, coef = datasets.make_regression(n_samples=n_samples, n_features=10,
                                      n_informative=1, noise=10,
                                      coef=True, random_state=0)
array = np.array(list(zip(X, y)))

array.tofile('yourfile.txt',sep=",",format="%s")

我现在所做的是做一些意想不到的事情。

-0.34791215 1.23029068 -0.38732682 0.37816252 1.20237985 -0.30230275 -1.98079647 0.15634897 0.15494743 -0.88778575,-1.2020466345326724,-0.50965218 -1.25279536 -1.61389785 -1.42001794 0.77749036 -0.21274028 1.9507754 -0.4380743 -1.04855297 -1.70627019,-5.471683206809487,2.26975462 0.04575852 1.53277921 0.6536186 -0.18718385 1.46935877 -0.74216502 -1.45436567 -2.55298982 0.8644362、-43.65842091125963、0.44386323 1.49407907 0.3130677 1.45427351 -0.20515826 -0.85409574 0.12167502 0.33367433 0.14404357 0.76103773、-5.470350015809552、1.86755799 0.95008842 -0.10321885 0.40015721 -0.15135721 0.4105985 2.2408932 -0.97727788 1.76405235 0.97873798 31.157017506093

但是如何将其输出到人类可读的CSV文件中呢?

然后,如何从这个CSV导入它,以便我可以创建一个样板设置,供候选人在配对测试期间通过?

EN

回答 1

Stack Overflow用户

发布于 2020-02-05 00:49:35

也许这个

代码语言:javascript
复制
np.save('data.npy', X)
X = np.load('data.npy')

编辑:这似乎更好

代码语言:javascript
复制
np.savez('mat.npz',X=X,y=y,coeff=coef)
data = np.load('mat.npz')
data['X']
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60067286

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档