作者:桔了个仔,南洋理工大学,数据科学家 知乎丨https://zhuanlan.zhihu.com/p/148102950 本文摘要 本文将带领读者一起进行完整的建模全流程,了解银行风控是如何做的 接下来,结合完整的可以马上运行的代码,中间穿插理论,来讲解评分卡的开发流程。最后,把方法论再梳理一次,让读者在了解全流程后,在概念上理解再加深。 本文还提供了完整的全流程代码,读者打开https://www.kaggle.com/orange90/credit-scorecard-example,结合代码来读本文,会理解更深。 ? 一、评分卡的分类 在金融风控领域,无人不晓的应该是评分卡(scorecard), 无论信用卡还是贷款,都有”前中后“三个阶段。 根据风控时间点的”前中后”,一般风评分卡可以分为下面三类: A卡(Application score card)。目的在于预测申请时(申请信用卡、申请贷款)对申请人进行量化评估。
确定建模目的 在信贷领域中建立风控模型是为了找出可能会逾期的客户,根据逾期的可能性和资金的松紧程度选择是否放贷。 在支付领域建立风控模型是为了找出可能存在非法经营的商户,保证商户没有违法经营。 2. 确定好坏样本逻辑 在信贷领域中逾期大于x期(不同公司取值不同)的客户定义为坏客户(1),从未逾期的客户定义为好客户(0) 在支付风控领域中,有赌博、欺诈、套现、伪卡等行为的商户定义为坏商户(1)(具体根据模型要防控的风险决定 模型上线 在支付风控领域如果模型验证没有问题,一般会上到线上,自动生成案例。在信贷中会模型搭配规则,判断申请贷款的人是通过放贷、拒绝放贷、还是转人工处理。 本文所讲的都是大致流程,没有深入展开分析,在之后的各期中会逐步展开这里所讲的每一小点,给所有需要从事风控模型的同学一点建议。 以上都是我在建模过程中的一点经验总结,有不正之处恳请指正!
数美依托强大的AI技术与海量基础数据,为金融机构提供覆盖全业务流程的完整风控解决方案。 www.datayuan.cn 微信公众号ID | datayuancn 本产品为数据猿推出的“金融科技价值—数据驱动金融商业裂变”大型主题策划活动第一部分的文章/案例/产品征集部分;感谢 数美 的产品投递 1、产品名称 数美全业务流程风控体系 2、所属分类 金融科技 · 风控、反欺诈 3、产品介绍 数美依托强大的AI技术与海量基础数据,为金融机构提供覆盖全业务流程的完整风控解决方案。 作为反欺诈领域专业品牌,数美经过2年的实践与积累,构建了立体的全业务流程风控体系,可有效帮助金融机构进行反欺诈与风控。 2) 信贷风控云 贷款人提交申请后,信贷风控云将首先对其进行可信度分级,对于高可信度的用户,可以使用更宽松的策略甚至直接通过审核。
我们将解析腾讯云全栈式风控引擎(RCE)的技术价值,提供实施操作指南,并对比通用方案与腾讯云方案的优势,以场景化案例结束。 技术解析 核心价值与典型场景 腾讯云全栈式风控引擎(RCE)是基于人工智能技术,结合腾讯20年风控实战经验打造的风控服务。 成本控制:如何在确保风控效果的同时,控制服务成本。 操作指南 实施流程 步骤1:接入全栈式风控引擎 原理说明:通过API服务接口形式接入RCE,利用腾讯云的风控模型进行实时分析。 配置风控规则 原理说明:根据业务需求配置风控规则,如注册频率限制、登录异常检测等。 通过本文的技术指南,企业可以更好地理解腾讯云全栈式风控引擎的价值,并在业务中实现高效的风控管理。
我们这做风控模型的时候,经常是会用KS值来衡量模型的效果,这个指标也是很多领导会直接关注的指标。今天写一篇文章来全面地剖析一下这个指标,了解当中的原理以及实现,因为这些知识是必备的基本功。 不过这不影响我们去使用它,我们只需要知道在风控中是怎么实现的,并且在实际场景中怎么去使用它就可以了。就如上面我们说的,KS在风控主要是用于评估模型的好坏样本区分度高低的。什么是区分度? 可以看下图: 从业务上来说,就是越往后的箱子,客户的质量越差,rate整体上呈现单调性,从而可以把大多数的坏人,直接从箱的维度上就可以区分开来了,在后续的风控策略使用体验上十分友好。 02 KS的生成逻辑 KS的生成逻辑公式也是十分简单: 好样本累计占比坏样本累计占比 在风控领域,我们在计算KS前一般会根据我们认为的“正态分布原则”进行分箱,一般来说分成了10份,然后再进行KS的计算 03 KS的效果应用 KS的值域在0-1之间,一般来说KS是越大越有区分度的,但在风控领域并不是越大越好,到底KS值与风控模型可用性的关系如何,可看下表: 004 KS的实现 首先我们来对上面展示的例子进行
[信贷全周期行为分析]——即对用户从申请、借款到还款全流程的数据洞察,是进行[精准客群筛选]——如优质客户白名单提取与高风险欺诈拦截的关键依据。" 详细演示如何使用原生PHP(或Laravel/ThinkPHP)对接此API,重点讲解AES-128-CBC在PHP中的加解密实现以及原始数据到前端可视化报表的映射逻辑,助力开发者快速将API的数据能力转化为企业风控 六、打造敏捷风控体系:从数据接入到业务赋能通过PHP集成API的支付行为指数产品,开发者可以极低的技术成本,为现有的信贷管理系统引入大数据风控能力。 借助API,您的系统将不再只是一个简单的录单工具,而是一个具备智能筛选与风险决策能力的专业风控平台。 我们强烈建议企业在数据采集、传输(全程加密)及存储的全生命周期中建立严格的隐私保护机制。这不仅是满足监管合规的基本要求,更是构建用户信任、保障企业业务长期稳健发展的基石。
风控定义 风控是风险控制的简称,在百度百科中是这么定义风险控制的。 风控在我们日常生活中随时可见,小到账户登录验证码,都可以算是一种风控的手段。 这里我们着重了解下信贷下的风控,结合了场景的风控,则赋予了更多的意义。 信贷风控的目标是「利益最大化」,而不是没有风险,在风险和利润之间找到平衡,是信贷风控的核心。 ,以及在信贷场景下的风控如何实现,风控的目标永远是降风险,但不是一味地降,在不同场景下有不同的考虑。 文章例子参考《智能风控平台:架构、设计与实现》
「风控ML」系列文章,主要是分享一下自己多年以来做金融风控的一些事一些情,当然也包括风控建模、机器学习、大数据风控等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步! 第一次接触这两个名词是在做风控模型的时候,老师教我们可以用IV去做变量筛选,IV(Information Value),中文名是信息值,简单来说这个指标的作用就是来衡量变量的预测能力强弱的,然后IV又是 data_good == value) / len_good iv += (good_rate - bad_rate) * math.log(good_rate / bad_rate,2) 2)注意分组后是否出现某组内的响应(未响应)数量为零的情况,如果为零需要处理一下。 ...], 'col2':[value1,value2,...], ...} ----------------------------------------------------------
大家好,又见面了,我是你们的朋友全栈君。 一、当前风控模式现状 近年来,信用风险管理发展呈现出数据化、模型化、系统化、自动化和智能化的特点。传统的人工专家经验正逐步被模型与算法替代。 对信贷员的专业技能要求较高,信贷员对贷款全流程把关,一定程度上确保了项目的真实性。但又因为是以信贷员为核心,以信贷员的判断为依据,有一定的操作风险与道德风险。 2.评分卡的意义 在互联网金融风控体系中,量化分析需要贯穿始终,评分卡模型是其中非常重要的一环。 从资金的角度来看,风控模型是为了评估用户还款能力和还款意愿,反欺诈反作弊,防止用户薅羊毛和保证平台安全等功能;从行业的角度,互联网风控模型体现在消费金融/供应链金融/信用借贷/P2P/大数据征信等方面。 F.设计纬度 风控模型的设计其实就是多维度和多角度的设计方式,这里我们就简单的通过一个对于线上借贷用户进行资质审核的模型进行举例子;从下面的流程我们可以看到,风控模型的审核流程一般都是要经过机器审核和人工确认的相结合的方式
一、产品定位与核心亮点 技术定义:腾讯云天御全栈式风控引擎是为预防和解决企业业务系统在不同环节遭受黑灰产侵扰问题,提供全方位安全保障的全栈式风控产品。 核心技术属性:采用“三大防线+核心能力”架构,覆盖流量端、设备端、核心业务端全链路,集成注册保护、登录保护、营销欺诈防控等模块化能力。 第三道防线(核心业务端):专属风控实时计算引擎分析抢票流量,结合账号/环境/行为/场景构建黄牛识别模型;含蓝牙AI无感混合专家模型、第三方AI无线安全专家模型、垂直小程序生态保护、总量安全(多维度围堵黄牛 )、量身定制风控策略(订单层抽样本定策略)功能。 解决方案:使用天御三大防线(流量端/设备端/核心业务端) 全链路风控。 成效:有效拦截99%+黄牛机刷请求,订单分析验证几乎全命中。
风险管理流程都是哪5步? 风险可以被消除吗? 01.2 描述风险管理流程,识别流程中的问题和挑战 识别风险 量化和估计风险敞口,决定合适的方法来转移风险 根据转移风险的成本来分析转移风险的方法 开发风险缓释策略 avoid 不做生意,完全避免 transfer business process 价值有: 提高组织效率 更好的风险汇报 提高业务绩效 04.3 描述一个CRO的角色和职责,评估CRO如何和其他高管协作 CRO职责 1.对公司面临的所有风险负责 2. 开发和实现ERM策略 工作范围: 1.设置公司全局风险偏好 2.度量和量化风险 3.设置风险限制 4.开发风险系统 关键技能: 1.领导力 2.说服力 3.有能力保护公司资产 4.理解所有风险的技术技能 采取有理由的防范保证会员服务不用在不合适,欺骗性,违法目的 不可以故意的歪曲报道 不可以从事任何不诚实 不可以从事任何危害GARP和FRM的事情 注意文化不同,出现冲突应该应用最高标准 2 利益冲突 任何情况下保持公平
大家好,又见面了,我是你们的朋友全栈君。 支付风控涉及到多方面的内容,包括反洗钱、反欺诈、客户风险等级分类管理等。 其中最核心的功能在于对实时交易进行风险评估,或者说是欺诈检测。 二、基于规则的风控 规则是最常用的,也是相对来说比较容易上手的风控模型。从现实情况中总结出一些经验,结合名单数据,制定风控规则,简单,有效。 常见的规则有: 1. 2. 操作规则 对支付、提现、充值的频率按照用户账号、IP、设备等进行限制,一旦超出阈值,则提升风控等级。 频率需综合考虑(五)分钟、(一)小时、(一)天、(一)周等维度的数据。 比如2分钟前在中国支付的,2分钟后跑到美国去支付了。 5. 风控拦截历史规则 用户在某个业务上的消费行为被风控网关多次拦截。 规则引擎优点: 性能高: 对订单按照规则进行匹配,输出结果。 支付风控场景分析 ; 支付风控数据仓库建设 ; 支付风控模型和流程分析(本文); 支付风控系统架构 发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn
《风控建模中的样本偏差与拒绝推断》https://zhuanlan.zhihu.com/p/88624987 不过我也还是把他文章里的分类体系在这里重点再次分享一下。 展开法的实施步骤主要是: 1、拿到贷后的样本,按照一定的好坏样本定义规则打上Y值,接着就是常规操作,得到 评分卡模型A; 2、拿着评分卡模型A,去对全量样本(包含拒绝的)进行打分,得到每个样本的模型分P ,低于阈值则赋予bad标签; 5、最后利用全量样本(包括拒绝的)进行建模,得到新的评分卡模型B。 06 总结一下 本文算是一个对拒绝推断的入门介绍了,让初涉风控模型的同学有一个相对来说比较清晰的全局认识,这里面涉及到的很多算法模型上的细节并没有展开来讲,因为我觉得这也会让阅读带来比较大的负担,公众号的文章还是要控制在几分钟内读完比较合适 Reference [1] 异常检测算法分类及经典模型概览 https://blog.csdn.net/cyan_soul/article/details/101702066 [2] 风控建模中的样本偏差与拒绝推断
[信贷全周期行为分析]——即对用户从申请、借款到还款全流程的数据洞察,是进行[精准客群筛选]——如优质客户白名单提取与高风险欺诈拦截的关键依据。 详细演示如何使用原生PHP(或Laravel/ThinkPHP)对接此API,重点讲解AES-128-CBC在PHP中的加解密实现以及原始数据到前端可视化报表的映射逻辑,助力开发者快速将天远API的数据能力转化为企业风控 六、总结通过PHP集成天远API的信贷行为数据洞察产品,开发者可以极低的技术成本,为现有的信贷管理系统引入大数据风控能力。 借助天远API,您的系统将不再只是一个简单的录单工具,而是一个具备智能筛选与风险决策能力的专业风控平台。 我们强烈建议企业在数据采集、传输(全程加密)及存储的全生命周期中建立严格的隐私保护机制。这不仅是满足监管合规的基本要求,更是构建用户信任、保障企业业务长期稳健发展的基石。
今天来介绍一下风控中的异常检测,从最基础的概念开始讲起,因为本人对这块的内容平时工作也做得不多,更多滴偏向于“纸上谈兵”,有什么说得不对的地方,也欢迎各位朋友指正~谢谢。 异常检测的概念 02 异常检测的难点 03 异常检测的分类及常见算法 01 异常检测的概念 异常检测(Anomaly Detection 或 Outlier Detection),又称为离群点检测,在我们风控领域很多地方都会用到 主要有几个原因: 1)异常点和噪声会混杂在一起,机器难以具体识别开来; 2)现实中很少有异常点的标签,因为标签越多也就意味着遇到过的异常越多,也不符合常识认知; 3)对于标签的定义也是很难,比如1个金融场景 2.上下文异常:一般在时间序列中表现,某个时间点的指标相对前后时间段有较大波动的。比如某个中午交易量异常。 2、半监督DAD:半监督DAD假设所有的训练样本只有一个标签,即正样本,训练过程学习到正样本的界限,测试时,不属于正样本边界内的就划为异常。
一、产品定位与核心亮点 腾讯云天御是一款基于人工智能与大数据技术的全栈式风控引擎,为企业提供贯穿业务全链路的反黑灰产防护。 黄牛恶意抢票场景 受众:票务平台、文旅机构 痛点:黄牛通过自动化工具秒级抢占库存(如10-20秒清空票仓),引发公众负面舆情,损害品牌形象 2. 黑产利用猫池批量获取手机号、改机工具伪造设备指纹、动态IP伪装环境,污染用户数据根基 三、应用框架与核心能力 功能架构 注册保护:拦截虚假注册与注册机攻击 登录保护:防御撞库与恶意登录行为 活动防刷:防控薅羊毛 某水饮客户 背景:黑产通过自动化脚本批量兑奖,导致5-8%扫码率为虚假行为 解决方案:部署天御营销防刷模块,识别批量异常扫码行为 成效:有效拦截黑产扫码,经业务验证年节约营销费用超百万元 2. 某主题乐园 背景:黄牛机刷流量占比达99%,正常用户无法购票 解决方案:启用流量端+设备端双重防护策略 成效:成功拦截99%以上黄牛请求,订单业务分析确认近乎全命中 3.
「风控ML」系列文章,主要是分享一下自己多年以来做金融风控的一些事一些情,当然也包括风控建模、机器学习、大数据风控等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步! 一个机器学习模型的开发周期一般可以分为: 1、业务需求挖掘(Business insight) 2、数据搜集处理(Data Curation) 3、模型训练开发(Modeling) 4、部署及测试上线( 而在开始搜集数据前,需要了解几点内容: 1、模型应用节点 2、时效性要求 2、有没有预算,预算有多少 3、项目紧急程度 模型应用节点 模型的应用节点,决定了你有哪些变量是不可以用的,避免说出现“事后变量 比如:一个模型是打算应用于初审环节(贷款审批流程),因此我们在初审节点后的变量都是不能用的,比如终审环节、门店审核等等,还有一些贷后的变量都是不能用的。 最好还是通过自己总结多方特征筛选的方法,写一套自己的方法,方便自己调用; 2、如果是使用传统机器学习算法,如rf、gbdt、xgb等,建议变量个数不要太多,50个以内差不多了。
00 Index 01 GBDT和XGBoost的原理介绍 02 GBDT和XGBoost的异同点分析 03 什么风控建模场景下常用这两个明星算法? 03 什么风控建模场景下常用这两个明星算法? 交易反欺诈:A级出场率,主要是支付风控,防止客户进行薅羊毛、套现等行为。 客户流失:A级出场率。 贷后 催收告警:A级出场率。 迁徙率预测:B级出场率。 失联修复:C级出场率。 {‘auto’, ‘sqrt’, ‘log2’}, int or float, default=None。如果不填的话,默认就是用所有的特征。 ... 而关于风控模型怎么调优,我会在下一节一起讲。 风控模型怎么调优 关于风控模型的调优,先前有篇文章讲得比较细致《风控ML[7] | 风控模型调优的思路有哪些》,大家可以移步去回顾一下。
而由于合规风控处于企业核心竞争力的高度,原风控数据积累10年,数据量已超30TB。 非现场风控平台各项报表和查询生成时间逐渐拉长。夜间批量任务越来越慢,部分任务出现超时失败现象。 02 原合规风控数据库数据量巨大,原有的传统的备份手段难以实现数据的实时保护。 价值提升 1 通过QData数据库云平台大幅提升了风控系统的业务效率,风控日终调度业务从原十几个小时缩短至1.5小时,性能提升10倍以上。 2 通过多年的发展,基于沃趣QData Cloud云平台解决方案逐步拓展成数据库私有云应用场景,以Oracle为代表的数据库如:客户关系管理、风控、合规、自营交易等系统正在逐步迁移到数据库私有云平台。 坚持自主研发,助力企业数字化转型可持续发展 该行业内头部券商表示:基于沃趣产品的高性能,帮助企业实现了实时风控,全面部署了对线上全渠道、全业务、实时性的欺诈防控。
国金CTRM:期现一体化与全流程风控解决方案 国金金属网信息科技有限公司(成立于2017年,专注大宗贸易风险管理咨询、信息资讯与软件服务)推出国金CTRM(大宗商品交易与风险管理系统),以数字化技术赋能大宗行业 全流程风险管控能力:基于风控引擎、自定义脚本、全局监控,实现实时主动预警。 量化应用效果:从分散滞后到精准实时的跨越 客户价值1:搭建全业务流程风控体系(某内资贸易业务数字项目) 实现信息化建设全业务流程,打通期现一体化管理,健全权益核算体系,完成从分散到集中、从滞后到实时、从模糊到精准的数字化跨越 客户价值2:赋能高质量贸易合规发展(某国企贸易业务数字化项目) 为集团金融衍生业务管理提供数字化方案,严把“入口关”“规模关”“操作关”,建设严格管控、规范操作、风险可控的监管体系: 线上数字化覆盖 CTRM平台运营运维管理端(多租户账号权限、资源、计量等)与腾讯云TDSQL结合,业务层按内/外贸、进/出口、转口水平拆分,横向线性提升吞吐量;账务库、风控系统等采用集中式架构,保障系统稳定性与运维效率