搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

在R中向量上使用IF语句

因此，我试图用R编写我的欺诈检测算法，我有一个数字值(欺诈性)，与某个用户在向量中实施欺诈的可能性成正比。如何创建一个新列，说明它是高、中还是低，考虑到“欺诈性”的一些敏感性(即，如果state 6>‘舞弊’> 0.3，那么它是低的，如果在0.6到0.8 MED之间，而高如果它是0.8或更高。这是我的输入和预期输出输入(df)1 0.43 0.2输出(df) IDfr

浏览 5提问于2015-07-22得票数 1

回答已采纳

1回答

对于数据表示在线欺诈或保险(每一行代表一个事务)的问题，响应变量通常表示以美元表示的欺诈行为的价值。这样的响应值可能少于5%的非零值，表示欺诈交易。关于这样的数据集，我有两个问题：我们可以使用哪些算法来保证模型不仅可以准确地预测欺诈交易，而且还可以预测与这些欺诈相关的欺诈的价值。假设我们可以量化每个假阳性所涉及的成本(将非欺诈交易标记为欺诈性交易)和由于虚假否定而产生的成本(将欺诈性交易标记为非欺诈性交易)，我们如

浏览 0修改于2014-11-12得票数 3

1回答

如果2/3的验证器在招标造币厂是恶意的，并发生欺诈交易怎么办？

所以，我有这样的条件，2/3的验证者不诚实，他们可以进行欺诈交易。怎样才能防止它，我如何知道哪2/3是欺诈？PBFT不起作用，对吧？有解决办法吗？

浏览 0修改于2018-12-05得票数 0

回答已采纳

1回答

哪一个答案是正确的生日攻击数字签名？

(I) S可以发起生日攻击，以欺诈性消息取代mm。(II)第三方攻击者可以发起生日攻击，以欺诈性消息取代m。(3) R可以发起生日攻击，以欺诈性消息取代m。下列哪些是可能的安全违规行为？A. (1)和(2)只有B. (1)只有C (2)只有D (2)和(3)但这些陈述让我迷惑了！发送者可以执行生日攻击并向接收方发送欺诈性消息。接收者可以执行生日攻击并创建欺诈

浏览 0修改于2020-06-17得票数 2

1回答

如何使用朴素贝叶斯算法对未知记录进行分类

我知道贝叶斯的规则，但我不确定如何在我的data.My数据上实现，因为below.There在我的数据中总共有2个标签，它们都是ok，欺诈和标记为未知的测试数据。我需要通过应用朴素贝叶斯Algorithm.How将所有未知记录分类为ok或欺诈。我是否可以做到这一点？请谁来帮帮我。1,v1,p1,182,1665,unkn3,v3,p1,20393,76990,ok5,v3,p1,6164,20260未知是欺

浏览 3修改于2012-11-18得票数 2

回答已采纳

1回答

使用配置单元的不同类别的汇总统计信息

Count of Fraud100-500 610 3其次，我还需要欺诈金额的总和(其中欺诈= 1)和欺诈的计数。我需要左连接以获得欺诈列来计算它。例如，类别0-100，金额的总和是120 (50+70)，计数是2。欺诈金额的总和是70，其中欺诈是1。表a ID Amount Date 1 110 0

浏览 14修改于2020-12-09得票数 0

1回答

如何训练神经网络来检测模式的存在？

但是，我正试图训练一个神经网络来检测网站上的欺诈交易。我有很多输入参数(一天中的时间、原籍国、过去一个月的访问次数、过去一个月来自唯一IP的访问次数、交易数量、平均交易规模等)。历史上，我可以查看我的数据，并确定交易是欺诈类型A或B类型，或不欺诈性。我的训练集可能很大(数千分或数万分)。最终，我想要一个指标: A类欺诈，B型欺诈或非欺诈。一般而言，欺诈性交易往往符合一种模式。我无法准确地识别模式(这就是我使用NN的原因)。然而，没有欺诈交易可以是任何

浏览 4提问于2015-02-23得票数 2

回答已采纳

1回答

如何在我在R中形成的一个单元格中着色

result_table <- cbind(Normal = c(1,2,3), Fraud = c(4,5,6))my_df <- as.data.frame(result_table)我想把正常与正常的绿色，欺诈与欺诈的绿色，正常的与欺诈的红色，欺诈与正常的红色

浏览 0修改于2019-07-17得票数 1

1回答

减少数据集以获得更好的PCA分解是一种良好的实践吗？

在这个数据集中，只有492个欺诈(所以只有0.17%)。在这种情况下，不可能找到一个模式来确定它是否是一种欺诈。 X_scale = Stand

浏览 1提问于2017-09-12得票数 1

回答已采纳

2回答

在机器学习分类中寻找降低误报率的方法

在经典的欺诈预测问题中，有没有办法降低误报率？目前，我正在研究经典的欺诈检测。有50000个样本有真实的标签(结果是由于调查)。这些训练标签是相当平衡的。现在，当使用该模型预测新病例时，结果是50/50(欺诈和非欺诈)。有没有办法调整模型，让我们通过非欺诈案件并惩罚假阳性率，以便我们检测到较少的欺诈案件(可能少于一百万起中的200起)，但它们极有可能是欺诈。希望这一切都清楚了。

浏览 82提问于2020-12-20得票数 1

4回答

低概率分类AdaBoost的训练与测试

我有一个数据集，我想分类为欺诈/非欺诈，我有许多薄弱的学习者。我担心的是，有更多的欺诈比没有欺诈，所以我的弱学习者表现好于平均水平，但没有一个表现超过50%的准确性在成套。我的问题是，我是否应该设置测试和培训集，其中一半是欺诈，一半不是欺诈，或者我是否应该使用一个代表性的样本。

浏览 0修改于2015-06-13得票数 7

1回答

我是否可以使用橙色CN2分类器来学习一个类的规则？

默认情况下，CN2为两个类(欺诈和非欺诈)学习规则。由于我只对欺诈类规则感兴趣，学习非欺诈规则是浪费时间，特别是考虑到我需要在许多数据集中运行CN2。CN2是否可能只学习欺诈类规则，如果有，如何在脚本中配置它来完成这个任务？谢谢!

浏览 3提问于2015-06-26得票数 1

回答已采纳

2回答

此数据集的机器学习还是深度学习？

汽车保险欺诈数据集有15k个样本(文本数据)，其中约14k不是欺诈样本和1k欺诈。深入学习对这个数据集有好处吗？另外，哪些算法适合于欺诈检测？

浏览 1提问于2022-06-19得票数 -4

2回答

如何在机器学习数据集中打击不平衡的类

然而，对于另外3个班级，我每个班级总共只有300个。例如，假设我们有一个二进制类“非欺诈”和“欺诈”类。绝大多数交易将属于“非欺诈”类别，极少数交易将属于“欺诈”类别。 PS。

浏览 28修改于2019-09-09得票数 1

1回答

共线性和孤立点去除

我正在玩一个信用欺诈检测数据集在Kaggle。包含约0.1%欺诈交易的不平衡数据集。这些特性是由+ time & txn量完成的PCA练习中的28台PC，以及用于合法/欺诈txn的类变量0/1。然而，我发现个人电脑在欺诈案件中仍然是相关的(如果你将数据集分解成合法/欺诈案件)。对于使用朴素贝叶斯分类器进行欺诈检测，什么是最好的方法来最小化这种影响？然而，我似乎并不认为删除离群点是一个明智的选择，因为欺诈本身可能是一个离群点。在不删除

浏览 0提问于2018-11-16得票数 2

1回答

客户特征分析

我有信用卡欺诈数据集。有两种类型，一种是欺诈交易，另一种是非欺诈交易。你能建议我用什么ML算法来模拟这两个种群的主要特征吗？我需要创建两个配置文件：欺诈交易-金额< 90 $的交易，交易发生在一天中的特定时间不是欺诈的事务--金额大于90 $的事务，事务发生在一天中的特定时间。

浏览 0修改于2021-01-15得票数 1

1回答

如何绘制自治系统的用例图？

我正在为一家银行开发一个实时欺诈检测系统。此欺诈检测系统的任务是确定进入的交易是否欺诈。该系统不与银行客户进行交互。欺诈检测系统具有捕获传入交易数据、计算交易风险水平等用例。

浏览 0提问于2020-02-28得票数 -3

1回答

R RF不平衡类别与训练相比，未见数据的负值预测值较低

我已经建立了一个随机森林模型，用于预测客户是否正在进行与欺诈有关的操作。这是一个很大的，相当不平衡的样本，有3%的欺诈案例，我想预测少数类别(欺诈)。我平衡数据(每个50%)并构建RF。到目前为止，我有一个很好的模型，总体准确率约为80%，正确预测的欺诈率为+70%。如何提高对未见数据的欺诈检测(负预测值)？,ntree = 100,data = balanced,importance = TRUE,mtry=3,keep.inbag=TRUE) Call:

浏览 23修改于2019-01-28得票数 1

回答已采纳

1回答

利用机器学习优化参数分数

我有一个包含欺诈和非欺诈数据的数据集。该系统是一个基于规则的引擎，有20多个规则。如果总分高于某一阈值，则支付被归类为欺诈性。什么是使用机器学习优化分配给不同规则的分数的有效方法(欺诈规则)。谢谢

浏览 0修改于2018-05-20得票数 -1

回答已采纳

1回答

如何从熊猫中创建特定标准的列表？

我有一个14k条目的DataFrame，有些国家有欺诈案例，有些国家根本没有“欺诈”栏。这是在熊猫df。我怎样才能列出那些根本没有欺诈行为的国家呢？

浏览 1提问于2020-12-17得票数 0

回答已采纳

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

在R中向量上使用IF语句

当响应变量有太多的0's和很少的连续值时建模？

如果2/3的验证器在招标造币厂是恶意的，并发生欺诈交易怎么办？

哪一个答案是正确的生日攻击数字签名？

如何使用朴素贝叶斯算法对未知记录进行分类

使用配置单元的不同类别的汇总统计信息

如何训练神经网络来检测模式的存在？

如何在我在R中形成的一个单元格中着色

减少数据集以获得更好的PCA分解是一种良好的实践吗？

在机器学习分类中寻找降低误报率的方法

低概率分类AdaBoost的训练与测试

我是否可以使用橙色CN2分类器来学习一个类的规则？

此数据集的机器学习还是深度学习？

如何在机器学习数据集中打击不平衡的类

共线性和孤立点去除

客户特征分析

如何绘制自治系统的用例图？

R RF不平衡类别与训练相比，未见数据的负值预测值较低

利用机器学习优化参数分数

如何从熊猫中创建特定标准的列表？

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐