目前,我们运行SQL报告来提取测试执行输出,这样我们就可以检查测试的成功程度,然后对要添加到回归套件中的测试做出有根据的猜测。
然而,这是很耗时的,因为它需要有人浏览所有的数据并做出某些假设。
我的任务是研究使用人工智能筛选数据的可能性,我想知道是否有人尝试过这一点,以及他们是如何实现的。
发布于 2017-02-16 18:27:52
我不确定这样做是否可行,但您可以使用Python的scikit-learn
它就像这样简单:
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.neural_network import MLPClassifier
from sklearn.pipeline import Pipeline
import pandas as pd
####DATA PREP##
data = pd.read_csv('filepath')
#Forgot the target xD
# target = pd.read_csv('target_data_filepath')
target = data.target #If target is in data
other_data = pd.read_csv('filepath_other')
###MAKE MODEL##
tfidf_vect = TfidfVectorizer()
mpl_class = MLPClassifier()
pipe = Pipeline([('Tfidf Vectorizer', tfidf_vect),('MLP Classifier', mlp_class)]
pipe.fit(data, target) #remove target from data beforehand if applies
####PREDICT###
pipe.predict(other_data)data是单独条目中的文本,每条记录的整个输出
target是你事先发现的,它是否应该包含在某个地方
other_data是您想要测试的内容
但要注意,上面只是一个样机,我不能保证我所有的方法名称都是正确的。要阅读,只需关注scikit-learn's doku,非常昂贵但内容广泛的书籍,如Building Machine Learning Systems with Python on Packt和许多其他免费的blogs like this machinelearningmastery.com
https://stackoverflow.com/questions/42268361
复制相似问题