腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
0
回答
数据
清洗
情感分析
假设我们有一个向量(输入):所需的输出应如下所示:本质上,y是一个数组数组,其中包含不同于“空格”字符的单词的索引(例如,“苹果”和“苹果”)。
浏览 4
修改于2017-12-05
得票数 0
1
回答
数据
清洗
.转换为tidyverse
我很好奇下面的代码是否可以转换为tidyverse代码。我试过了dplyr::变异,但一直没能让它正常工作。df$Gender[df$Gender == "Male"] <- "Man"df$Gender[df$Gender == "Female"] <- "Woman" df$Gender
浏览 0
提问于2018-03-13
得票数 0
回答已采纳
1
回答
Kylo中的
数据
清洗
我想知道是否有任何方法可以在Kylo ()中进行
数据
清理。我能够让工具使用
数据
验证规则来指出错误,但我很想知道它是否还可以执行其他功能。示例: 检测和删除
数据
中的重复列
浏览 2
提问于2018-04-05
得票数 1
2
回答
数据
清洗
-处理CSV文件
我想听听关于我的
数据
集问题的一些看法(我认为它是一个常见的问题)。SKUID PRODUCT QTY MFGDT ......SV01 04053XXXX
数据
是形状的(123078,199),而且很少有记录中的字段值是混乱的。但是,我想知道是否有某种方法来修复
数据
(例如,与列中前面的项进行模式匹配;基于dtype等)。
浏览 0
修改于2018-07-21
得票数 0
2
回答
基于Pandas的CSV
数据
清洗
0.38588 0.844293 1.01548 7295875,,,,WCT,NA NaN NaN NaN NA,,,, 默认情况下,
数据
帧的进一步输出如下有没有办法把它变成一个带有公共分隔符的
数据
帧
浏览 31
修改于2019-05-25
得票数 1
回答已采纳
2
回答
数据
清洗
.文本清洁剂澄清
def string_clean(s): cleaned_string = "".join([i for i in s if not i.isdigit()])这段代码工作得很好。但是,我想知道为什么联接方法中的for循环包含在中。另外,为什么会出现这样的语法,是否有一种方法可以根据通常遇到的基本for-循环语法来构造它。例如: if not i.isdigit():我知道这个例子充其量只是粗略的,与我的
浏览 2
修改于2022-05-07
得票数 0
1
回答
数据
清洗
、验证和测试驱动开发
数据
异步到达,应用程序的许多“组件”使用
数据
。
数据
在进入系统之前已经通过了语法验证,但是每个“组件”都根据自己的规则对
数据
是否可用有不同的定义。当考虑每个组件的测试驱动开发时,关于
数据
清理和验证的设计“最佳实践”是什么?在这里假设COMPONENT1_VALIADTION和COMPONENT_1将有单独的测试用例。如果
数据
像上面那样首先通过COMPONENT1_VALIADTION,那么测试用例和component_1,2,3的实现是否可以假定已清理的
数据
?那么,系统测
浏览 5
修改于2014-01-23
得票数 0
回答已采纳
1
回答
基于SPSS的线性回归
数据
清洗
我有大量的
数据
,我想使用自变量A和B,通过多元线性回归来预测因变量C。但现在一些A和B缺乏价值(它可能只缺少A,只缺少B,或者两者都缺少)。 我如何处理它们,以便我的
数据
能够很好地进行预测?谢谢!
浏览 2
提问于2015-03-19
得票数 0
1
回答
数据
清洗
(标记)死传感器
我有一个大的时间序列(熊猫
数据
)的风速(平均10分钟),其中包含错误
数据
(死传感器)。它怎么能被自动标记。我试着用移动平均线。一些其他的方法,然后移动平均是非常赞赏的。我已经附上了下面的样本
数据
图像。
浏览 0
提问于2018-11-15
得票数 2
回答已采纳
1
回答
用read.csv进行
数据
清洗
作为初学者,我想问您,哪种方法更优雅、更有效地清理大.csv
数据
:我尝试过两种解决方案(在help()中找到,这里和文献中),但我不确定是否有更好的解决方案(比如循环?)你可以建议我。我的(对R不太友好) .csv
数据
(523行,47列,这里只是开头):;;;Name;#1;#2;#3Date;19.09.20160,3831;0,3833v';0,5026;0,502;0,5021我只想选择一些信息( 523
浏览 0
修改于2017-05-16
得票数 1
回答已采纳
2
回答
清洗
数据
我有一个像这样的
数据
集"25/06/2002",
浏览 12
修改于2022-10-17
得票数 0
回答已采纳
1
回答
时间序列的
数据
清洗
和准备.LSTM
我需要准备我的
数据
,把它输入到LSTM中,以便预测第二天的情况。我的
数据
集是以秒为单位的时间序列,但我每天只有3-5个小时的
数据
。(我只有这个特定的
数据
集,所以不能更改它)我有Date-Time和特定的Value。我想编写一段代码,在其中提取4小时,并删除仅用于特定月份的第一个提取小时(因为这些
数据
是错误的)。我成功地编写了一个代码来提取x-Data (输入)和y-Data (输出)的2小时。
数据
集是一年的秒
数据
,6pm-11 6pm丢失。例如,8月至11月的第一个小时
浏览 0
修改于2019-05-07
得票数 0
回答已采纳
2
回答
谷歌云-什么产品的时间序列
数据
清洗
?
我有大约20 in的时间序列
数据
存储在大查询中。我目前的管道是:然后我在桶中下载了一个文件的子集: 既然
数据
已经在桶里了,我想知道谷歌最好的插值和重采样工具是什么?云
数据
代表:看起来像
浏览 3
提问于2018-04-13
得票数 1
回答已采纳
1
回答
使用时间序列进行
数据
清洗
我有一个
数据
清理问题。我在没有关掉设备的情况下连续做了两个实验。我希望实验1中的所有
数据
都在一个csv中,而实验2中的所有
数据
都在不同的csv中。另一种可能性是根据张力
数据
中的峰值来划分
数据
,然后重新组合它们。不知何故。有没有人对可能实现这一点的算法有什么想法?下面是一些模拟
数据
。时间
数据
在pandas DateTimeIndex中。
浏览 54
提问于2020-12-07
得票数 0
回答已采纳
2
回答
避免
数据
清洗
中重复的最有效方法
我有来自一个客户的
数据
,这是一个很好的混乱的复制信息。我将运行一个清理查询,该查询获取转储
数据
,进行一些清理,并最终将其放到一个新表中。当有一个新的转储
数据
时,问题就会发生。我只想买最新的东西。我想不出一种有效的方法。一个快速简单的WHERE NOT条款是行不通的(我不认为.)因为没有任何独特的
数据
列。一旦我们在这里找到了一些用户,并且
数据
追溯到一年多以前,似乎清理工作就太密集了。 或者我只是一个n00b,正在用鼹鼠造一座山。
浏览 1
修改于2013-03-22
得票数 0
1
回答
如何实现AWS中
数据
清洗
的自动化
我有一个.csv文件,其中包含13家有列的不同商店的销售
数据
:
数据
列的格式为"day - mm/dd/yyyy“,我在Python (朱庇特笔记本)中有代码,它清理
数据
并将其分割成13家商店的
数据
集--因此清理部分就被处理了。Python代码从"day - mm/dd/yyyy“中删除"day:”,并将其转换为pd.to_datetime
数据
类型,并
浏览 2
提问于2022-07-09
得票数 -1
1
回答
自动
清洗
数据
数据
使用自动
清洗
工具吗? 我的意思是类似于h2o.ai的自动ml函数,但用于预处理
数据
。或者你总是“用手”清理
数据
。
浏览 0
修改于2019-01-03
得票数 1
4
回答
如何组合、分离、测试和训练
数据
进行
数据
清洗
?
我正在开发一个ML模型,其中我已经在两个文件test.csv和train.csv中获得了
数据
。我想对两个文件一起执行
数据
清理,将它们连接起来,然后将它们分开。我知道如何连接2个
数据
文件,但是在
数据
清理之后,我将如何分离这两个文件?请帮我完成密码。
浏览 0
提问于2020-09-12
得票数 3
1
回答
R中
数据
清洗
的可能解决方案
我有一个
数据
集,其中包含两个日期和时间列。我想在同一行中对齐日期和时间列,如果第二个日期和时间列不匹配,则删除第二个日期和时间列右侧的所有内容。我的
数据
集问题的示例如下所示。注意时间1!经过清理的
数据
集最终版本如下所示: 我想删除Date.1列右边的所有内容,直到Date.1=Date和Time.1=Time为止。
浏览 4
提问于2016-05-08
得票数 1
回答已采纳
2
回答
数据
清洗
功能:用中位功率替换10的幂。
在林业中,手持测量装置经常因处理错误而产生十进制误差.如果在输入
数据
时不进行校正,就会产生明显的误差,例如一棵树的高度: 24厘米、250厘米、26厘米。
浏览 3
修改于2019-11-12
得票数 0
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券