我想在我的anaconda项目(python 3.6.5)中使用数据集:情感、场景和酵母。我使用了下列密码:
import skmultilearn.dataset load_dataset X_train,y_train,feature_names,label_names =load_dataset(“情感”,“train”)
当我连接到互联网时,它是成功的,但当我离线时,它不工作!我已经在这样的文件夹中下载了上面命名的所有数据集:
H:\Projects\数据集
当我脱机时,如何使用此文件夹作为我的源数据集?(我在使用windows 10)
我下载的数据集的扩展是:.rar : emotions.rar、scene.rar和yeast.rar,我从:http://mulan.sourceforge.net/datasets-mlc.html下载了它们
发布于 2019-11-18 19:07:39
您可以,但首先需要知道数据集存储到的路径。要做到这一点,您可以加载一次并获得路径。此路径将永远不会更改,因此您只需执行一次以下操作即可获得所需的路径。接下来,知道路径,您可以加载脱机任何您想要的。
示例
from sklearn.datasets import load_iris
import pandas as pd, os
#get the path
path = load_iris()['filename']
print(path)
#offline load
df = pd.read_csv(path)
#the path: THIS IS WHAT YOU NEED
main_path_with_datasets = os.path.dirname(path)一旦您获得了main_path_with_datasets,即通过执行main_path_with_datasets = os.path.dirname(path),您现在就有了路径。您可以使用它加载所有可用的下载数据集。
os.listdir(main_path_with_datasets)
['digits.csv.gz',
'wine_data.csv',
'diabetes_target.csv.gz',
'iris.csv',
'breast_cancer.csv',
'diabetes_data.csv.gz',
'linnerud_physiological.csv',
'linnerud_exercise.csv',
'boston_house_prices.csv']用于skmultilearn的编辑
from skmultilearn.dataset import load_dataset_dump
path = 'C:\\Users\\myname\\scikit_ml_learn_data\\'
X, y, feature_names, label_names = load_dataset_dump(path + 'emotions-train.scikitml.bz2')https://stackoverflow.com/questions/58919771
复制相似问题