腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
数据预处理和
特征
工程
我一直在读一些关于数据预处理和
特征
工程
的文章,包括
特征
选择,
特征
重要性和
特征
构造。我的理解是在数据预处理阶段
应用
了
特征
工程
。此外,在
应用
机器学习模型时,有时会检查
特征
重要性,有时会在模式内部进行检查。 我的问题是:
特征
工程
是否总是在预处理阶段实现,或者有时可以在以后的阶段执行? 谢谢你Shosho
浏览 45
提问于2021-04-28
得票数 0
1
回答
如何在具有大量
特征
的数据集中进行
特征
选择或
特征
工程
?
为了建立一个良好的ML模型,我们必须选择能够提高模型精度的
特征
,如果需要的话,还要“
工程
”
特征
(例如,如果与预测变量不线性相关,则
应用
对数或平方等函数对线性回归预测器)。我应该在不同的条件下测试每一个变量,还是有一些更简单的方法来进行
特征
选择或
特征
工程
。
浏览 0
提问于2022-03-13
得票数 1
1
回答
纸袋图在文本
特征
工程
中的
应用
关于包图在文本
特征
工程
中的
应用
,我有几个问题:当n克袋的
特征
空间随'N‘呈指数增长时,是什么(还是有?)或者,通常情况下,在将文本字段转换为文本
特征
字段时,n-gram包是否与其他功能
工程
技术一起使用?
浏览 0
提问于2022-04-10
得票数 1
回答已采纳
1
回答
是否可以在H2O无人驾驶系统中定义最终模型使用多少个变量
请理解,在功能选择/
工程
阶段,H2O能够选择要使用的变量以及要
应用
于这些变量的转换器。但是,有没有一种方法可以在H2O DAI中配置,以限制提供的列表中它可以使用的最大功能数量?例如,给定了100个
特征
,我只希望H2O DAI从中选择20个
特征
并对其
应用
特征
工程
。已尝试浏览用户手册,但到目前为止没有找到任何有关这方面的提示。 在此之前,非常感谢您。
浏览 16
提问于2021-02-02
得票数 0
回答已采纳
1
回答
如何进行实时数据的
特征
工程
?
我用以下步骤建立了一个很好的线性回归模型: 我的问题是,如果我们在生产环境中使用这个模型,那么我们如何进行实时数据的
特征
工程
,因为这个模型是用
特征
归一化和缩放的来建立的,那么如何对实时数据进行规范化和缩放以得到一个很好的预测呢?对于交叉验证和测试步骤,我们不需要显式的
特征
工程
,因为在建立模型之前,这可以在数据预处理步骤中完成。实时数据<e
浏览 2
提问于2017-03-01
得票数 0
2
回答
特征
工程
我有一个大约37,000行和54列的数据框架。在这54个列中,有两个列,即“user_id”和“mail_id”,格式非常怪异,如下所示:AR+tMy3H/E+Re8Id20zUIz+amJkv6KU12o+BrgIDin0= DQ/4I+GIOz2ZoIiK0Lg0AkwnI35XotghgUK/MYc101I= 1P4AOvdzJzhDSHi7jJ3udWv4ajpKxOn4T/rCLv4PrXU= BL3z4RtiyfIDydaRYWX2
浏览 0
修改于2020-12-25
得票数 2
2
回答
前处理前与后处理前的列车、试验分车的区别
一般来说,场景2:另一种方法是首先对整个数据集
应用
转换,然后将数据集拆分为训练、测试和验证。在预处理和
特征
工程
之前,或者在预处理和
特征
工程
之后,我对数据的选择、划分有些困惑。寻找一个很好的答案与效果和棺材。
浏览 0
修改于2019-03-07
得票数 4
回答已采纳
1
回答
基于树的算法需要什么
特征
工程
?
我理解数据卫生,这可能是最基本的特性
工程
。这意味着确保所有数据都正确加载,确保N/As被视为一个特殊值,而不是一个介于-1和1之间的数字,并正确地标记您的分类值。使用log、指数、幂变换将
特征
转化为正确的标度。但是,对于LightGBM (和随机森林)来说,这些特性的规模似乎并不重要,因为可排序的项目是有序的,然后是随机的二分法。
浏览 0
修改于2017-08-08
得票数 12
回答已采纳
1
回答
使用经过训练的ML模型作为服务进行预测的同时进行
特征
工程
但是在数据上训练模型,我做了很多
特征
工程
,比如对数盒cox变换,一次热编码,由于高度多重共线性而丢弃了几列等,现在
特征
的数量是35。我在这35个
特征
上训练了模型,检查了性能,并使用pickle保存了模型。我在flask服务中加载了我的腌制模型。但是现在模型的输入是我的原始数据的格式,它只有20列。那么,我如何对新的输入集进行所有的
特征
工程
呢?我只能保存训练好的模型,但在传递新数据进行预测之前,我如何进行所有的
特征
工程
呢?
浏览 15
修改于2021-06-04
得票数 1
回答已采纳
6
回答
自动
特征
工程
我遇到了一个机器学习软件,我不会命名它,它声称在没有领域知识的情况下,功能
工程
过程从任何来源完全自动化,这意味着数据科学家在这一步中几乎没有必要。现在,我发现这个说法有点可疑,因为它违背了我所学到的功能
工程
所包含的常识。 但考虑到这可能是缺乏知识,从我的部分到什么点,我们可以自动化的特色
工程
过程?
浏览 0
修改于2016-05-24
得票数 6
2
回答
盲
特征
工程
基于SVM的分类算法具有较好的分类精度(> 95%),但由于对列没有直觉,除了标准标度、零值替换等外,我无法在
特征
工程
或
特征
生成方面做更多的工作。或者只有当一个人拥有基于列名的直觉时,功能
工程
才真正有意义.
浏览 0
修改于2020-06-30
得票数 3
2
回答
机器学习中的预测函数是否理解分类数据?
据我所知,在进行
特征
工程
之前,必须将数据集分成训练数据和测试数据,以避免分析中的偏差。我还了解到,机器学习模型除了数字数据之外不理解数据,因此需要编码,这是
特征
工程
的一部分。
浏览 0
修改于2019-11-07
得票数 1
回答已采纳
2
回答
特征
工程
技术清单
是否有任何资源与一系列的功能
工程
技术?数据类型、模型和
特征
工程
技术的映射将成为金矿。
浏览 0
修改于2021-03-13
得票数 18
1
回答
如果为一个数据集生成一次
特征
,它可以用于任何相关的算法吗?
如果我已经使用数据集的最先进的
特征
工程
方法生成了
特征
,那么除了对
特征
进行少量的修改之外,还可以将它用于任何一种算法来构建模型,从而插入不同的算法吗? 在从数据集构建
特征
时,是否存在算法依赖关系?
浏览 0
提问于2018-06-01
得票数 -1
1
回答
我可以使用scikit-learn管道来转换一个特定的变量吗?
阅读,所有示例都将转换器
应用
于整个数据集(例如,StandardScaler,PCA)。 比方说,有没有可能只缩放数据集中的特定变量?如果这是可能的,那么我可以将我的整个
特征
工程
过程放到一个管道中,并将其
应用
于我的训练和测试集。
浏览 1
提问于2017-10-13
得票数 2
1
回答
如何在比例回归模型上执行约束优化?
假设我将高斯过程回归
应用
于我的数据。在拟合模型之前,我将执行某种
特征
工程
。在模型合适之后,我的目标是在曲线上
应用
一个最小化,我打算对一些值进行约束,以便找到最优的X。然而,问题来了,如果我对我的数据
应用
某种
特征
工程
,并将模型拟合到特定的数据集,当我
应用
约束优化时,我应该如何找出我想约束它的值,因为我改变了我的输入数据。7.51133372, 7.54435854, 4.92758927, 5.0955348 , 7.26606153, 6
浏览 1
提问于2020-03-15
得票数 6
回答已采纳
1
回答
是否应该对培训或测试集的结果进行基线比较?
我有一个分类问题,我想找出
特征
工程
是否改进了我的最终模型。交叉验证用于评估功能
工程
步骤的影响,因此没有验证集(只有训练/测试)。简言之,我的情况包括以下几点:列车基线模型列车终态模型比较基线和最终模型,我假设,可以通过在测试集中运行两个模型来完成,然后评估它们的结果的差异(如果有的话
浏览 0
提问于2020-06-17
得票数 1
回答已采纳
1
回答
PHP SVM -
特征
工程
我们有上学人数的数据。就像以前的教育水平一样。兴趣。性别。军人身份。附注,PHP SVM模块是否适合只做一些简单的建模?或者它不值得使用?
浏览 5
提问于2015-02-04
得票数 0
1
回答
大数据集R中Boruta函数的替代方案
我想对这个数据集进行
特征
工程
。以前,我使用Boruta包下的Boruta()进行功能
工程
。但是看到数据集的大小,我觉得Boruta()将需要很长时间。你能给我推荐一些替代Boruta的功能
工程
大数据集吗?
浏览 2
提问于2017-09-18
得票数 0
1
回答
如何
应用
时间序列机器学习模型预测下一个时间步长
我对单变量时间序列数据(备件使用)进行了
特征
工程
,然后将时间序列数据转化为有监督的机器学习问题。我对转换后的新数据集进行了培训和测试。我的问题是如何
应用
该模型来预测未来的一步、多步?所有
特征
都是在以前的数据点上计算的,例如滞后
特征
、移动窗口统计数据,例如最大值、最小值、平均值、中值,例如,持续5天、10天、15天。
浏览 0
提问于2019-12-06
得票数 0
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券