腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
2
回答
数据
质量
. Pandas
我正在使用Python和Pandas做一个
数据
质量
项目。我有一个输入
数据
,其中每一列都是分类
数据
,我想返回一个
数据
,其中每一列包含该列中最常见的10个类别,以及所述类别的名称(即键值对或带有分类变量的元组:每个单元格中的计数)。
浏览 0
提问于2018-06-18
得票数 0
回答已采纳
1
回答
用Python检查
数据
质量
目前正在尝试编写代码,以检查
数据
质量
为7GB的
数据
文件。我试着用谷歌搜索,但没有结果。最初,代码的目的是检查有多少是nulls/NaNs,然后将其与另一个
数据
文件连接起来,并比较每个文件之间的
质量
。我想知道这里是否有人愿意使用Dask共享他们的
数据
质量
python代码。谢谢
浏览 9
提问于2022-02-21
得票数 0
回答已采纳
1
回答
数据
质量
处理.定义规则
我正在工作的
数据
质量
监测项目,这是新的我。我首先使用一个
数据
分析来分析我的
数据
,并对它有一个全局视图。接下来,我考虑定义一些
数据
质量
规则,但我对如何实现这些规则感到有点困惑。
浏览 7
提问于2021-04-19
得票数 1
2
回答
数据
质量
框架定义问题
有人能帮我定义一个
数据
质量
框架来分析某种
数据
吗?只是对它应该做什么的高级描述?只是你的想法而已。
浏览 7
修改于2015-11-07
得票数 2
2
回答
数据
质量
服务内部行为
我的问题是: DQS是一次性加载执行清理操作所需的所有
数据
,还是在清理过程中不断向
数据
源(在我的示例中为oracle)提交查询?
浏览 4
修改于2015-09-07
得票数 1
回答已采纳
1
回答
数据
质量
-缺少值(Pandas)
我正在做一个
数据
质量
项目。我正在尝试使用pandas分析profileReport生成一个
数据
质量
报告,但是当我验证该报告时,它显示我没有缺失值,而我确实有空单元格。或者你还有其他的建议吗?
浏览 15
修改于2021-04-06
得票数 1
2
回答
使用Ruby的
数据
质量
例如,gem应该将以下语句标记为true (这只是一个示例,没有必要扩展标准字符串)'woodpecker' == 'Wodpekcer' 任何用于
数据
质量
检查的红宝石
浏览 1
修改于2013-12-20
得票数 0
回答已采纳
1
回答
确保
数据
质量
的工具
有时我们会发现有些文件没有被处理,或者它们不在bigquery
数据
集中。简而言之,我想要的是能够在输入ETL之前比较源环境和目标环境/比较
数据
,以及退出ETL后的
数据
,告诉您我没有忘记任何事情,我可以编写一些脚本来完成这个任务,但是我想知道是否已经创建了一些东西。
浏览 0
修改于2023-01-02
得票数 1
2
回答
图像
数据
的
数据
质量
评价
因此,我手动清理了我的
数据
集,这是相当耗费人力和时间的。 我的方法是正确的,还是有什么工具或方法可以清除图像
数据
?实际上,这听起来很有争议,因为这个清洁工具应该为模型的构建做些什么--对图像进行分类。
浏览 0
修改于2020-01-11
得票数 2
1
回答
日期字段上的
数据
质量
我在处理字符串格式的日期字段时遇到了问题,所以我试图对基础进行清理。我的基中的默认格式日期字符串是"%d/%m/%Y",但是由于这来自csv文件,可能存在一些不需要的字符串。当我试图用以下方法进行解析时,我会遇到错误:就像这样,但是每次我运行时都会得到一个新的问题字符:处理这件事最好的方法是什么?
浏览 4
提问于2017-04-07
得票数 2
回答已采纳
1
回答
如何降低PCA的
数据
质量
我在Matlab中有一个75x60数组。我在试着做PCA。我试图通过确保eig(矩阵)返回的最大特征值与u v=svd(矩阵)中的d(1)*d(1)返回相同的内容来检查我的工作。他们太离谱了。我能看到的唯一可能出错的就是贬低。 %v is a 75x60 array avgVector= mean(v,1); v = v-muMatrix;
浏览 6
提问于2014-02-02
得票数 0
回答已采纳
2
回答
Informatica
数据
质量
匹配分析
在我们的重复分析需求中,输入
数据
有1418条记录,其中1380条记录是重复记录。
浏览 3
修改于2012-04-13
得票数 1
2
回答
Azure中的
数据
质量
服务
您了解
数据
质量
服务吗?它将于何时在Microsoft Azure中引入?或者,也许有一些服务具有相同的功能和可能性?
浏览 5
提问于2020-02-21
得票数 1
1
回答
Azure
数据
质量
分析真实示例
令人困惑的是,即使在概要分析中,也提到了
数据
清理和匹配!我的目标是在我们的项目中实现它。提到的其他点,如
数据
清理和匹配,都很简单,我们已经实现了它。
浏览 3
修改于2021-08-04
得票数 0
1
回答
CSV文件中的
数据
质量
验证
我有一个web界面,在那里用户上传csv文件,从Excel转换,与文件中的垃圾
数据
,例如一堆逗号分隔的空行后,实际
数据
结束后的文件结束。我想阻止用户上传这样的文件。
浏览 18
提问于2019-10-17
得票数 0
1
回答
培训
数据
质量
下降(Google
数据
科学博客)
该模型使用培训
数据
进行培训,我们随机向一些人展示广告,而有些人没有,并记录了他们各自的反应。 该模型的一个初步实现是实时运行,并且很好地对显示广告的人进行分类。但是,每隔几天,就会获得新的
数据
,并使用整个
数据
集(每次再培训后的
数据
集都会变大)对模型进行再培训。但人们担心,如果我们继续这样做,它的性能可能会下降,因为当前的模型实例会影响输入的新
数据
,用于训练未来的模型实例:没有随机显示广告的客户的百分比将会下降,只有当模型认为他们会购买广告上的内容时,才会显示出越来越多的客户
数据
我们担心我
浏览 0
提问于2018-10-13
得票数 1
回答已采纳
1
回答
如何检查SSIS中的
数据
质量
?
当在传输过程中转换
数据
时,我将所有被拒绝的(即失败的)转换移动到一个拒绝表中。但是,我只得到了第一个错误的条目: 示例源
数据
: Name | Salary | ZipcodePaul | 12000 | 90210 Ringo
浏览 18
提问于2019-10-16
得票数 0
1
回答
如何调试模型监控(
数据
质量
和模型
质量
)?
我已经从Studio中创建了一个
数据
质量
监控,并且还使用了Sagemaker 创建了一个模型
数据
质量
监控作业。错误: 作业输入没有
数据
从日志中,我可以看到它在后台使用Java。不知道怎么调试?
浏览 5
提问于2022-02-02
得票数 0
1
回答
定义大
数据
的
数据
质量
规则
是否有任何方法可以定义可应用于
数据
帧的
数据
质量
规则。定义规则的模板应该足够简单,任何外行都可以定义,然后我们可以将这些规则转换为pyspark代码,并在
数据
上运行它们。 我的想法如下所示。
浏览 3
提问于2020-11-27
得票数 1
2
回答
数据
仓库中的
数据
质量
算法
我正在寻找一个好的算法/方法来检查
数据
仓库中的
数据
质量
。因此,我希望有一些算法“知道”这些值的可能结构,然后检查这些值是否是这个结构的成员,然后决定它们是否正确。
浏览 2
修改于2013-06-29
得票数 1
回答已采纳
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券