腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
2
回答
数据
预处理
Python
我在Python中有一个DataFrame,需要对
数据
进行
预处理
。对
数据
进行
预处理
的最佳方法是哪一种,知道一些变量具有很大的规模,而另一些则没有,
数据
也没有很大的偏差。
浏览 6
提问于2016-04-12
得票数 0
1
回答
多元
数据
预处理
我试图了解多元
数据
预处理
是如何工作的,但我脑海中有一些问题。 例如,我可以在单变量
数据
中进行
数据
平滑、转换(box,微分)、去噪(对于任何机器学习问题)。不仅是时间序列预测)。
浏览 0
提问于2022-03-31
得票数 0
1
回答
CSV
数据
预处理
我有一个类似于这种格式的.csv文件然后我想把它转换成我怎么才能和巨蟒熊猫一起做呢?
浏览 1
提问于2021-08-16
得票数 1
回答已采纳
3
回答
数据
预处理
库
只有当我需要对神经网络的
数据
进行
预处理
时,我才知道什么是科学知识。还有其他好的图书馆吗?
浏览 0
提问于2019-01-17
得票数 0
1
回答
并行
数据
预处理
是否可以并行实现
数据
预处理
步骤,如缺失值计算、孤立点检测、归一化、标签编码等?我能为
数据
预处理
实现cuda/openmp/mpi编程吗? 谢谢。
浏览 0
提问于2022-09-08
得票数 2
回答已采纳
1
回答
数据
预处理
:缺少标签
我有一个分类任务来预测{0,1}标签,但是在我的
数据
集中,我只有一个标签的
数据
。类表示买方已购买了某些产品。 特点:用户标识、产品标识和购买时间。我应该使用一些0-
数据
生成,或者有一些方法,可以正确预测没有0-
数据
?谢谢。
浏览 0
修改于2021-10-08
得票数 1
1
回答
Lasso,glmnet,
数据
预处理
我问这个问题的原因是我的
数据
集很大。它节省了大量的时间,只是这样做,而不是编码作为因素。
浏览 5
提问于2014-05-21
得票数 1
回答已采纳
1
回答
机器学习
数据
预处理
我有一个关于机器学习的
数据
预处理
的问题。特别是转换
数据
,使其具有零均值和单位方差。我已经将我的
数据
分成两个
数据
集(我知道我应该有三个
数据
集,但为了简单起见,假设我有两个
数据
集)。我应该转换我的训练
数据
集,使整个训练
数据
集具有单位方差和零均值,然后在测试模型时转换每个测试输入向量,使每个测试输入向量呈现单位方差和零均值,还是将整个
数据
集(训练和测试)转换为单位变量和零均值?我的信念是,我应该这样做,这样我就不会在测试<
浏览 0
修改于2017-02-21
得票数 1
回答已采纳
1
回答
SKlearn自动
数据
预处理
我想为滑雪板模型做一个简单的包装。其思想是包装器自动处理各种因素("object"类型的列),用目标的平均值替换它们,同时保持sklearn模型的语法。class ModelEmbedder : self.model = model self.rar
浏览 0
修改于2016-03-04
得票数 1
回答已采纳
1
回答
数据
预处理
和特征工程
我一直在读一些关于
数据
预处理
和特征工程的文章,包括特征选择,特征重要性和特征构造。我的理解是在
数据
预处理
阶段应用了特征工程。我的问题是:特征工程是否总是在
预处理
阶段实现,或者有时可以在以后的阶段执行? 谢谢你Shosho
浏览 45
提问于2021-04-28
得票数 0
1
回答
数据
聚类-
数据
预处理
我的意思是:不是用所有的
数据
来训练K-Means,也许有一种方法可以只找到重要的向量(那些对聚类影响最大的向量),并使用这些“重要”向量(来自训练
数据
)来训练算法。 我希望你能理解我。
浏览 4
提问于2013-03-12
得票数 0
回答已采纳
2
回答
基于AWS SageMaker的
数据
预处理
我有一个端点,它在AWS上运行一个经过训练的SageMaker模型,它期望
数据
具有特定的格式。最初,
数据
是在应用程序的客户端处理的,这意味着,API Gateway (接收AWS上的POST API调用)用来接收
预处理
过的
数据
,但是现在发生了变化,API Gateway将从客户端接收原始
数据
,而在发送到我们的SageMaker模型之前
预处理
这些
数据
的工作取决于我们的工作流程。在这个工作流上创建
预处理
作业的最佳方法是什么,而不需要重新训练模型?我的<em
浏览 5
提问于2020-10-08
得票数 1
回答已采纳
1
回答
电子病历中的
数据
预处理
我想要处理10PB的
数据
。输入
数据
是某种专有格式(存储在CSV中),第一个
预处理
步骤是将这些专有
数据
转换为CSV并将其移回S3。由于一些限制,我不能将
预处理
步骤与Map任务耦合。一种方法是在没有reduce任务的情况下运行单独的电子病历作业,并在映射阶段将
数据
上传到S3。有没有更好的方法来做到这一点,因为运行map-reduce作业而不使用reduce任务来
预处理
数据
看起来像是一个老生常谈的解决方案。
浏览 0
提问于2016-06-16
得票数 0
1
回答
数据
预处理
的最佳方法
我还有一个
数据
集的结构:我想在上面测试不同的机器学习方法,所以我想做的第一件事就是对
数据
进行
预处理
我的问题与国会专栏有关,因为它有一些不太适合舒适和CARD_ACCEPTED的
数据
。我应该采用什么归一化方法呢?
浏览 0
提问于2021-11-05
得票数 2
1
回答
数据
预处理
框架/库备选方案
具体来说,我目前正在研究
数据
预处理
的步骤,以及如何在训练服务倾斜的情况下以健壮的方式实现它。我已经考虑过Tensorflow变换,在经过一次运行定义的
预处理
步骤之后,生成一个可以在训练后重用的图形工件。尽管使用它的一个缺点是需要坚持Tensorflow
数据
格式。有什么好的选择吗?到目前为止,我发现的框架/库中唯一类似的例子是Keras
预处理
层和sklearn
预处理
管道。我在很多网站和博客上搜索过,但仍然没有找到类似的讨论。
浏览 0
提问于2022-01-05
得票数 2
回答已采纳
1
回答
pandas时间序列
数据
预处理
我的
数据
帧看起来像这样: text timestamp1 b 2016-06-20 14:083 d 2016-07-11 19:07我想把每个月的
数据
总结如下:count timestamp0 2 2016-062 1 2016-08 原始
数据
集(dt)可以
浏览 2
提问于2016-08-02
得票数 3
回答已采纳
1
回答
Pandas
数据
预处理
和标签
我想将我的
数据
分成标签,因为前6列决定了第7列,现在我已经选择了前6列,它工作得很好 import pandas as pdfrom
浏览 9
修改于2021-04-12
得票数 0
1
回答
多变量LSTM
数据
预处理
所显示的代码对于验证
数据
非常有效,而不是用于培训,帮助我发现错误。
浏览 1
修改于2022-02-28
得票数 0
1
回答
pandas中的
数据
预处理
我想知道,这段代码出了什么问题,因为空值没有填充我给它的值。我正在尝试用每个团队的joined的DateTime的均值填充nan。mean_joined_data = pd.pivot_table(df, values='Joined', index=['Club'], aggfunc=np.mean) df['Joined']
浏览 17
提问于2020-03-01
得票数 0
1
回答
python中的
数据
预处理
我有一个
数据
集,我正在探索
数据
,在我的
数据
的一个特定列中,我有11个不同的类别属于该特定列,但是该列的
数据
分布如下:Number of data points in class 11 : 7 ( 0.005 %) 请注意,从第3班到第11班,
数据
的百分比有了很大的下降我的问题是,我想对这些分类
数据
执行编码,是应该考虑该特定列中的所有
浏览 1
修改于2022-04-09
得票数 0
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券