对于我的问题的第一步、我可以使用的建模技术的建议或相关的研究(我找不到任何),我会非常感激。
我有一份配料清单(总共150份)和一份食谱列表(100份左右),其中包括每个食谱中的成分组合(每个食谱平均有4-5份)。
我的输出变量是这些菜谱(味觉、气味、外观和纹理)的4个评分指标,每个菜谱的等级为1-10。
我的目标是根据我指定的新的成分组合(从列表中挑选)来预测这4项指标。
我应该使用什么建模技术来帮助解决这个预测问题?
发布于 2020-06-16 09:20:25
以下是几个开始的想法:
一个简单的模型是使用多元线性回归(MLR)或随机森林。
如果只想根据是否使用成分进行评估,则输入数据集可能如下所示:
黄油面粉蛋..。测试气味外观纹理1 0 1 1 1 5 2 4
如果要预测每种成分中有多少成分(有些成分更好,太多成分不太好),则数据集可能如下所示:
黄油面粉蛋..。检验气味外观质地1.5 3.0 2 1 5 2 4
你可以从这个网站得到一些其他的想法:
https://machinelearningmastery.com/multi-output-regression-models-with-python/
发布于 2021-07-12 11:16:15
随机森林在这里可以很好地工作,因为它是一棵决策树。在你打电话给RandomForest之前,你将不得不OneHotEncode你的分类变量,例如黄油面粉鸡蛋.因为Regressor或分类器(无论您想要什么)都不能处理字符串和NaN值。
https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestRegressor.html
https://datascience.stackexchange.com/questions/76090
复制相似问题