我在哪里可以找到监督分类机器学习的分类因变量的例子?
例如:
蜥蜴为昆虫,苍蝇为昆虫,蚊子为昆虫,猴子为哺乳动物,熊为哺乳动物,鲨鱼为鱼,格皮为鱼,芬兰为国家,美国为国家,日本为国家,苹果公司为公司,伯克希尔哈撒韦公司作为公司,默克公司,公司.
我已经采取了Udemy机器学习all和所有的场景是只有2个因变量(是或否,1或0)。任何人都知道在哪里可以找到Python代码或学习示例,以便将文本分类为国家、公司、昆虫等。两个以上的因变量?
谢谢
@David Dale,我试过:
import numpy as np
import pandas as pd
dataset = pd.read_csv('Test31Oct17.csv')
X = dataset.iloc[:, 0].values
y = dataset.iloc[:, 1].values
from sklearn import datasets
from sklearn.multiclass import OneVsOneClassifier
from sklearn.svm import LinearSVC
OneVsOneClassifier(LinearSVC(random_state=0)).fit(X, y).predict(X)`它没有起作用。上面写着ValueError:无法将字符串转换为浮动:‘南岗区新涌路66号14层楼’。
对于y,我已经把所有的分类改为1,2,3,4.代替鱼类、国家、哺乳动物等
发布于 2017-10-31 16:39:51
UCI机器学习库应该为您提供大量的示例,说明您所要求的内容--您可以在那里搜索两个以上类的分类问题。
发布于 2017-10-31 17:39:59
如果我理解正确的话,你问的不是多个因变量,而是一个多类因变量。
许多ML算法(从logistic回归到决策树及其集合)自然支持多类分类。其他基本形式的算法(如支持向量机)不能处理多类问题。但是,几个这样的二进制模型可以用一种对一种或一种相对于rest的方式聚合。
例如,scikit学习支座多类分类,甚至更困难的案例-多标签和多任务分类(没错,它们都是不同的问题)。
https://stackoverflow.com/questions/47039721
复制相似问题