首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用于检测游戏中作弊行为的人工智能方法

用于检测游戏中作弊行为的人工智能方法
EN

Stack Overflow用户
提问于 2011-09-21 07:21:56
回答 2查看 2.4K关注 0票数 13

我的日常工作是一个基于在线浏览器的游戏,一个很小,只有很小的员工的游戏。事实上,我们的大部分员工都是志愿者。

我今天关注的是一个方面。我想创建一个人工智能系统,它将分析我们的用户数据库,并报告可能由同一用户运行的帐户--这显然违反了我们的条款和条件。这种“欺骗”是我们员工的主要时间消耗,如果我能通过给他们一份简短的名单让他们先检查一下来加快速度,我会的。

问题是,我不太精通人工智能。我了解非常非常基础的知识,但目前还没有成功地实现解决方案。我一直在研究启发式搜索,特别是A*搜索,我“认为”它可能适合我正在寻找的东西,但我不能确定。

所以我的问题是:使用A*搜索,是否有可能准确地分析两个用户帐户的数据,如用户名、密码、电子邮件、帐户之间的交互、其他帐户之间的交互、登录时间、活动时间等。如果不能,您是否知道有一个系统可以分析这么多数据,并给出两个帐户可能由同一个人运行的“概率”?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2011-09-21 13:36:26

至少在很大程度上,这是我的日常工作。从你的问题看,你似乎在考虑机器学习的学科(而不是更广泛的问题,AI)。我认为您的直觉是正确的-- ML算法非常适合于欺诈预测/检测,因为它可以在高度非线性的领域中推广,并且可以适应(随着新数据的输入)。因此,由于这两个主要特征,欺诈者更难辨别预测算法的“规则”--因为这些规则实际上是一组复杂的软约束,随着算法根据新数据进行学习,这些规则会随着时间的推移而变化。(我可能会建议把A放在一边,除非你有特殊的理由相信寻路是解决你问题的有用的启发式方法--我不愿意说这之间没有联系,但如果有,那肯定是一个非正统的问题--我从来没有见过寻路应用于这类问题)。

你提到的关于在线欺诈类型的唯一事实是,你有兴趣识别单个用户的多个帐户。毫无疑问,这里可以应用各种技术,但我将特别提到一种分析技术,因为:(i)我实际上在您提到的场景中使用了它;以及(ii)到目前为止,它超出了其他答案的范围。

该技术基于图论

前提:同一用户拥有的帐户通常不是通过他们的个人行为(点击流)识别的,而是通过他们彼此之间的关系来识别的--换句话说,通过他们的网络行为。

例如:在线扑克中的。在这里,一个人在一个扑克网站上开了多个新帐户(使用伪造的信息),然后要求每个帐户的广告奖金(例如,100美元的存款与100美元的奖金相匹配)。当然,奖金有高度限制性的“套现规则”,通常是在奖金变成现金并可以作为现金从玩家的账户中提取之前玩的牌的门槛数量。

因此,芯片抛售的目标是将这些奖金美元转化为真正的现金。一个人开了五个独立的帐户(作为五个不同的人),然后再开一个“合法”帐户(使用他们的真实身份)。这六名玩家--实际上也只是一名玩家--将在一张桌子上相互竞争,五个假账户将很快失去他们的堆栈,合法账户很快兑现他们的奖金,因为当然,奖金的套现限制只适用于他们最初获得的账户;因此套现限制被完全规避。

这种类型的方案的困难之处在于,非法行为几乎不可能在个人账户的基础上被发现--*不良行为,串通,源于一组共同拥有的账户的interaction *--换句话说,需要在网络层面上研究利益行为。

因此,图论是一种自然的分析框架。

我应用的技术是基于Chau等人的一篇学术论文。在卡内基梅隆大学,题为。

本文的核心欺诈场景是这样的: eBay上的卖家希望将非常昂贵的商品(他们甚至可能不拥有,但无论如何,都不打算发货给买家)卖给愿意的买家。为了诱使无辜的买家自愿参与交易,欺诈性的卖家首先通过向一群买家“成功”销售商品来获得非常高的(人为的)声誉;这些买家通常是由买家控制的假账户。

更具体地说,本文的作者使用马尔可夫随机场上的置信传播算法将两个级别(帐户级别和网络级别)的数据合并在一起。

顺便说一句,签名图结构被称为二分核心,它产生于一组帐户组,该组成员中的事务数量非常多,但该组之外的事务很少(即,与eBay社区的其余部分)。

票数 23
EN

Stack Overflow用户

发布于 2011-09-21 09:11:37

如果你有权访问用户的游戏动作日志,你可以使用聚类来对玩“相似”游戏的用户进行分组。一旦您有了集群,您就可以使用IP来过滤每个集群中的用户。

另一种方法可能是使用监督学习算法,如Desicion-TreesIBK等。但要做到这一点,你需要一个训练集,其中包含你已经知道的作弊用户的样本。

您可以使用Weka数据挖掘软件来发现数据中的模式。它有一个直接连接到数据库的选项。它包括聚类,决策树,ibk和许多算法来尝试。但你需要对每种算法有基本的了解,才能解释结果。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/7492940

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档