搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏GiantPandaCV
VOS: Learning What You Dont Know by Virtual Outlier Synthesis
论文信息标题：VOS: Learning What You Don't Know by Virtual Outlier Synthesis 作者：Xuefeng Du, Zhaoning Wang, 是否可以生成一些outlier来辅助规范模型的边界，从而让模型可以很好地确定ID类别和OOD类别的边界？本文提出了一种新的未知感知学习框架VOS (Virtual Outlier Synthesis)，该框架优化了ID任务和OOD检测性能的双重目标。相较于其他的生成outlier的方式，也具有一定的优势。通过对energy权重的分析，也可以发现权重和物体的数量呈现非常明显的正相关。发现采用这种outlier的合成方式，通过降维可视化也的确符合预期，是在ID数据的boundary上进行采样。 5. 结论在本文中，提出了vos，一个新的未知感知的OOD检测训练框架。
1.5K10编辑于 2022-09-28
来自专栏翻译scikit-learn Cookbook
Using KMeans for outlier detection使用KMeans进行异常值检测
In this chapter, we'll look at both the debate and mechanics of KMeans for outlier detection.It can be Getting ready准备工作 In this recipe, we'll use KMeans to do outlier detections on a cluster of points. It's important to note that there are many "camps" when it comes to outliers and outlier detection. outliers;we'll work under the assumption that our choice to remove outliers is justified.The act of outlier This idea is similar to a one-class SVM that is used for outlier detection: KMeans聚类有一个单独的中心很重要，这很像是用于检测离群值的单分类支持向量机
2.3K31发布于 2019-11-26
来自专栏数据猿
美国AI分析初创公司Outlier获620万美元融资
编译 | 金又南官网 | www.datayuan.cn 微信公众号ID | datayuancn Outlier是美国一家利用AI提供分析服务的初创公司。 Outlier旨在引入一种全新的业务分析方法。公司的平台可以连接到各种系统，无论是数据库还是各类云服务如Stripe，Outlier的平台都可以使用AI自动分析内部数据。 Outlier平台适用于多种不同的用途。在线零售商可以将Outlier插入Google Analytics，以标记某些事件，例如某个来源的网站流量突然飙升。本轮融资的投资者均对Outlier的发展情况表示看好。到目前为止，公司已总共获得超过800万美元融资。来源：数据猿
76630发布于 2018-08-14
来自专栏DeepHub IMBA
Micro-Outlier Removal: 一种Kaggle快速提分的小技巧
Micro-Outlier Removal：这个词听起来不错。但是这个术语是本文的作者首创的。所以应该找不到其他相关的资料，但是看完本篇文章你就可以了解这个词的含义。在Kaggle 的《Titanic》排行榜中，作者使用这项技术获得了巨大排名飞跃- 在使用这个技术之前排名是12616 使用这个技术后排名是4057 Micro-Outlier Removal的动机现在让我们看看Micro-Outlier Removal是什么样子的 Micro-Outlier 定位方法这是作者使用的泰坦尼克数据模型训练的一些信息：只使用了以下特征:PClass, Sex, Micro-Outlier 定位方法如下: 一群非幸存者中的幸存者一群幸存者中的非幸存者下图显示了带有白色箭头的小异常值。
42330编辑于 2022-06-04
来自专栏JAVA
应对AI模型中的“Outlier Detection Failure”错误：数据清洗与预处理
应对AI模型中的“Outlier Detection Failure”错误：数据清洗与预处理导语在机器学习和深度学习的实际应用中，数据质量决定了模型的性能。而其中，异常值检测（Outlier Detection）更是数据预处理中至关重要的一环。然而，我们常常在模型训练过程中遭遇到“Outlier Detection Failure”错误，这究竟是什么原因呢？什么是“Outlier Detection Failure”错误？ ', index=False) 总结应对“Outlier Detection Failure”错误，关键在于掌握有效的数据清洗与预处理方法。
48710编辑于 2024-11-22
来自专栏深度学习|机器学习|歌声合成|语音合成
R语言实战：心血管病分析实例
$EF) # hist_outlier(input_data$Hight) # hist_outlier(input_data$Weight) # hist_outlier(input_data$BMI ) # hist_outlier(input_data$UA) # hist_outlier(input_data$Laa) # hist_outlier(input_data$Va) # hist_outlier $Llpv) # hist_outlier(input_data$Rupv) # hist_outlier(input_data$Rmpv) # hist_outlier(input_data$Lmpv ) # hist_outlier(input_data$Trunk) # hist_outlier(input_data$PAI) # hist_outlier(input_data$IAB) # hist_outlier # hist_outlier(input_data$CABG) # hist_outlier(input_data$HP) # hist_outlier(input_data$DM) # hist_outlier
1K30发布于 2021-01-14
来自专栏hsdoifh biuwedsy
Data cleaning: missing values and outliers detection
by a different mechanism From a statistics perspective: Normal (non-outlier) objects are and a contextual outlier Global outlier (or point anomaly) Object is Og if it significantly deviates (or conditional outlier) Object is Oc if it deviates significantly based on a selected context Is 5o in Melbourne an outlier? detection -it is not necessary to know Grubb’s test for outlier detection
59540发布于 2021-05-19
来自专栏HsuHeinrich
基于IF的网站异常流量检测
= model_isof.fit_predict(feature_merge) # 异常结果汇总 outlier_pd = pd.DataFrame(outlier_label,columns=[' outlier_label']) data_merge = pd.concat((data_fillna,outlier_pd),axis=1) outlier_count = data_merge.groupby '].count() return data_count.sort_values(['outlier_label'],ascending=False) # 取出异常样本 outlier_source = data_merge[data_merge['outlier_label']==-1] outlier_source_sort = cal_sample(outlier_source) # 取出正常样本 = source_merge.rename(index=str, columns={'outlier_label_x':'outlier_count','outlier_label_y':'normal_count
1.9K40编辑于 2023-05-25
来自专栏生信菜鸟团
【孟德尔随机化】GTEx数据和gwas数据可以直接MR吗？
"),] outlier_pval <- str_remove_all(presso_res[[1]][["MR-PRESSO results"]][["Outlier Test"]]$Pvalue ,"\\<") outlier_pval <- as.numeric(outlier_pval) outlier_pval <- length(which(outlier_pval < 0.05 <- outlier_pval }else{ make_result_df$outlier_estimate <- NA make_result_df$outlier_estimate_sd <- NA make_result_df$outlier_estimate_pval <- NA make_result_df$n_outlier <- NA } }else{ $outlier_estimate_sd <- NA make_result_df$outlier_estimate_pval <- NA make_result_df$n_outlier <-
1.7K10编辑于 2024-04-18
来自专栏数据科学（冷冻工厂）
Scanpy 单细胞分析：Pearson残差处理计数数据
> 5 adata_pbmc3k.obs["outlier_total"] = adata_pbmc3k.obs.total_counts > 5000 adata_pbmc3k.obs["outlier_ngenes [~adata_pbmc3k.obs["outlier_mt"], :] adata_pbmc3k = adata_pbmc3k[~adata_pbmc3k.obs["outlier_total"], [~adata_pbmc10k.obs["outlier_mt"], :] adata_pbmc10k = adata_pbmc10k[~adata_pbmc10k.obs["outlier_total ', 'outlier_total', 'outlier_ngenes' # var: 'gene_ids', 'n_cells', 'mt', 'n_cells_by_counts', 'mean_counts ', 'outlier_total', 'outlier_ngenes' # var: 'gene_ids', 'feature_types', 'n_cells', 'mt', 'n_cells_by_counts
31810编辑于 2025-08-13
来自专栏生物信息学、python、R、linux
去除箱线图中的outliers
异常值outlier：指样本中的个别值，其数值明显偏离它（或他们）所属样本的其余观测值，也称异常数据，离群值。当遇到一组数据中有少量outliers,一般是需要剔除，避免对正确的结果造成干扰。查看是否有离群值 ggplot(df, aes(x=element, y=value,color=element)) + geom_boxplot(outlier.colour="red", outlier.shape =7,outlier.size=1) ? ggplot(df2, aes(x=element, y=value,color=element)) + geom_boxplot(outlier.colour="red", outlier.shape =7,outlier.size=1) ?
5.1K20发布于 2020-12-23
来自专栏算法channel
Pandas滑动窗口，揪出刷单黄牛党！
import pandas as pd def is_outlier(time_series: pd.Series, outlier_duration=20, outlier_count=5): """ outlier_duration分钟内连续交易outlier_count次认为是异常 :param time_series: :param outlier_duration : :param outlier_count: :return: """ # 排序 time_series2 = time_series.sort_values( # 求得长度为outlier_count的滑动窗口的时间跨度 time_cumsum = time_delta.rolling(outlier_count).sum() # 若outlier_count次交易的时间小于outlier_duration，就是所定义的刷单，返回True if (time_cumsum <= outlier_duration).any()
73820编辑于 2021-12-05
来自专栏小汪Waud
只有四个数据，但图上出现五个点？
其实问题非常简单，geom_boxplot() 函数里有一批专门针对离群值 (outlier) 进行标注的参数。 outlier.colour：离群点的颜色 outlier.fill：离群点的填充色 outlier.shape：离群点的形状 outlier.size：离群点的大小 outlier.alpha：离群点的透明度如果我们使用geom_point()，实际上outlier只是对离群点进行了标注。
49430编辑于 2023-02-20
来自专栏生信小王子
Phenotype : 大规模表型数据处理工具
install.packages("Phenotype") "Phenotype"一共包含4个函数，分为"outlier"、"stat"、"histplot"和"blup"。 outlier：利用boxplot剔除数据中的异常值在之前的推送中，小编教过大家使用boxplot剔除异常值（利用箱线图巧剔异常值）。基于上述原理，开发了outlier函数，使用方法如下： ## 加载R包 library("Phenotype") ## 导入数据 df <- read.table("brix.txt", header outlier包含8个参数。 ## 查看outlier函数的参数 ?outlier ? ? 这是"Phenotype"的第一个公开版本，由于本人水平有限，包中难免有些bug存在。如大家在使用过程中遇到问题，请随时与我联系。
1.8K30发布于 2020-08-11
来自专栏R语言及实用科研软件
ggstatsplot | 一个满足你日常统计需求的高颜值R包（一）
data = dat, x = mpaa, y = rating, type = "r", # "parametric", "nonparametric", "robust", "bayes" outlier.tagging = TRUE, outlier.label = title)p2图片---3.3 当然你也可以选择画boxplot更改plot.type即可p3 <- ggbetweenstats( dat, method # ggtheme = ggthemes::theme_tufte(), package = "ggsci", palette = "default_jco", outlier.tagging = TRUE, outlier.label = title, ## arguments relevant for combine_plots annotation.args = list = TRUE, outlier.label = "title", outlier.label.args = list( list(size = 3, color = "#56B4E9
80420编辑于 2022-10-14
来自专栏R语言及实用科研软件
ggstatsplot | 一个满足你日常统计需求的高颜值R包（二）
效应值类型 sphericity.correction = FALSE, ## 不显示校正后的DFS和P值 pairwise.comparisons = TRUE, ## 显示配对比较 outlier.tagging = TRUE, ## 是否标记outlier outlier.coef = 1.5, ## Tukey's rule的系数 outlier.label = region, ## 标记outlier 的label outlier.label.color = "red", ## 标记outlier的label的颜色 mean.plotting = TRUE, ## 是否显示均值 mean.color = TRUE, outlier.label = education, k = 3, ## arguments relevant for combine_plots annotation.args = TRUE, outlier.label = "group", outlier.coef = list(2, 2, 2.5, 3), outlier.label.args =
65720编辑于 2022-10-13
来自专栏R语言及实用科研软件
🤩 ggstatsplot | 一个满足你日常统计需求的高颜值R包（二）
效应值类型 sphericity.correction = FALSE, ## 不显示校正后的DFS和P值 pairwise.comparisons = TRUE, ## 显示配对比较 outlier.tagging = TRUE, ## 是否标记outlier outlier.coef = 1.5, ## Tukey's rule的系数 outlier.label = region, ## 标记outlier 的label outlier.label.color = "red", ## 标记outlier的label的颜色 mean.plotting = TRUE, ## 是否显示均值 mean.color = TRUE, outlier.label = education, k = 3, ## arguments relevant for combine_plots annotation.args = TRUE, outlier.label = "group", outlier.coef = list(2, 2, 2.5, 3), outlier.label.args =
70420编辑于 2022-10-31
来自专栏生信菜鸟团
《单细胞最佳实践》—重新回顾质控部分的新理解
首先，我们定义一个函数 is_outlier() ，它有两个参数 metric（.obs 中的一列）和 nmads（过滤允许的 MAD 数量）： def is_outlier(adata, metric adata.obs["outlier"] = ( is_outlier(adata, "log1p_total_counts", 5) | is_outlier(adata, "log1p_n_genes_by_counts ", 5) | is_outlier(adata, "pct_counts_in_top_20_genes", 5) ) adata.obs.outlier.value_counts() outlier adata.obs["mt_outlier"] = is_outlier(adata, "pct_counts_mt", 3) | ( adata.obs["pct_counts_mt"] > 8 ) adata.obs.mt_outlier.value_counts() mt_outlier False 15240 True 1694 Name: count, dtype:
80011编辑于 2025-08-04
来自专栏大数据智能实战
离群点异常检测及可视化分析工具pyod测试
找到了一个对Outlier Detection (Anomaly Detection) 异常值检测（异常检测）的比较好的工具（https://github.com/yzhao062/Pyod），该工具集成了多个算法具体包括的算法如下： Model 1 Angle-based Outlier Detector (ABOD) Model 2 Cluster-based Local Outlier Factor (CBLOF ) Model 3 Feature Bagging Model 4 Histogram-base Outlier Detection (HBOS) Model 5 Isolation Forest Model 6 K Nearest Neighbors (KNN) Model 7 Average KNN Model 8 Median KNN Model 9 Local Outlier Factor
1.7K20发布于 2019-05-26
来自专栏CreateAMind
这个异常检测效果
We focus on finding the reason an instance is an outlier, i.e. by finding the subset of features that if ignored the rest of the input is not an outlier anymore. We showcase the ability of finding the outlier features in a variety of different corruption scenarios , and show that finding and fixing the outlier features can help in downstream tasks such as classification
39640编辑于 2023-02-14

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

VOS: Learning What You Dont Know by Virtual Outlier Synthesis

Using KMeans for outlier detection使用KMeans进行异常值检测

美国AI分析初创公司Outlier获620万美元融资

Micro-Outlier Removal: 一种Kaggle快速提分的小技巧

应对AI模型中的“Outlier Detection Failure”错误：数据清洗与预处理

R语言实战：心血管病分析实例

Data cleaning: missing values and outliers detection

基于IF的网站异常流量检测

【孟德尔随机化】GTEx数据和gwas数据可以直接MR吗？

Scanpy 单细胞分析：Pearson残差处理计数数据

去除箱线图中的outliers

Pandas滑动窗口，揪出刷单黄牛党！

只有四个数据，但图上出现五个点？

Phenotype : 大规模表型数据处理工具

ggstatsplot | 一个满足你日常统计需求的高颜值R包（一）

ggstatsplot | 一个满足你日常统计需求的高颜值R包（二）

🤩 ggstatsplot | 一个满足你日常统计需求的高颜值R包（二）

《单细胞最佳实践》—重新回顾质控部分的新理解

离群点异常检测及可视化分析工具pyod测试

这个异常检测效果

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐