作者:桔了个仔,南洋理工大学,数据科学家 知乎丨https://zhuanlan.zhihu.com/p/148102950 本文摘要 本文将带领读者一起进行完整的建模全流程,了解银行风控是如何做的 接下来,结合完整的可以马上运行的代码,中间穿插理论,来讲解评分卡的开发流程。最后,把方法论再梳理一次,让读者在了解全流程后,在概念上理解再加深。 本文还提供了完整的全流程代码,读者打开https://www.kaggle.com/orange90/credit-scorecard-example,结合代码来读本文,会理解更深。 ? 一、评分卡的分类 在金融风控领域,无人不晓的应该是评分卡(scorecard), 无论信用卡还是贷款,都有”前中后“三个阶段。 根据风控时间点的”前中后”,一般风评分卡可以分为下面三类: A卡(Application score card)。目的在于预测申请时(申请信用卡、申请贷款)对申请人进行量化评估。
确定建模目的 在信贷领域中建立风控模型是为了找出可能会逾期的客户,根据逾期的可能性和资金的松紧程度选择是否放贷。 在支付领域建立风控模型是为了找出可能存在非法经营的商户,保证商户没有违法经营。 确定好坏样本逻辑 在信贷领域中逾期大于x期(不同公司取值不同)的客户定义为坏客户(1),从未逾期的客户定义为好客户(0) 在支付风控领域中,有赌博、欺诈、套现、伪卡等行为的商户定义为坏商户(1)(具体根据模型要防控的风险决定 特征工程 在风控领域一直都有这样一句话 “数据决定了机器学习的上限,而算法只是尽可能逼近这个上限”,这里的数据指的就是经过特征工程得到的数据。通俗的讲就是衍生变量去捕获风险客户。 模型上线 在支付风控领域如果模型验证没有问题,一般会上到线上,自动生成案例。在信贷中会模型搭配规则,判断申请贷款的人是通过放贷、拒绝放贷、还是转人工处理。 本文所讲的都是大致流程,没有深入展开分析,在之后的各期中会逐步展开这里所讲的每一小点,给所有需要从事风控模型的同学一点建议。 以上都是我在建模过程中的一点经验总结,有不正之处恳请指正!
数美依托强大的AI技术与海量基础数据,为金融机构提供覆盖全业务流程的完整风控解决方案。 www.datayuan.cn 微信公众号ID | datayuancn 本产品为数据猿推出的“金融科技价值—数据驱动金融商业裂变”大型主题策划活动第一部分的文章/案例/产品征集部分;感谢 数美 的产品投递 1、产品名称 数美全业务流程风控体系 2、所属分类 金融科技 · 风控、反欺诈 3、产品介绍 数美依托强大的AI技术与海量基础数据,为金融机构提供覆盖全业务流程的完整风控解决方案。 作为反欺诈领域专业品牌,数美经过2年的实践与积累,构建了立体的全业务流程风控体系,可有效帮助金融机构进行反欺诈与风控。 并将多维度、多模型的组合打法贯穿业务流程始终,做到风控与反欺诈的高召回、低误杀。
我们将解析腾讯云全栈式风控引擎(RCE)的技术价值,提供实施操作指南,并对比通用方案与腾讯云方案的优势,以场景化案例结束。 技术解析 核心价值与典型场景 腾讯云全栈式风控引擎(RCE)是基于人工智能技术,结合腾讯20年风控实战经验打造的风控服务。 成本控制:如何在确保风控效果的同时,控制服务成本。 操作指南 实施流程 步骤1:接入全栈式风控引擎 原理说明:通过API服务接口形式接入RCE,利用腾讯云的风控模型进行实时分析。 毫秒级响应,支持动态扩容 安全性 需要自行管理数据安全 依托腾讯云安全体系,数据加密传输 成本 高昂的硬件和维护成本 按需付费,降低运维成本 场景化案例 电商行业:在618购物节和双十一大促期间,腾讯云全栈式风控引擎为电商企业节省上亿元的营销资金 通过本文的技术指南,企业可以更好地理解腾讯云全栈式风控引擎的价值,并在业务中实现高效的风控管理。
我们这做风控模型的时候,经常是会用KS值来衡量模型的效果,这个指标也是很多领导会直接关注的指标。今天写一篇文章来全面地剖析一下这个指标,了解当中的原理以及实现,因为这些知识是必备的基本功。 不过这不影响我们去使用它,我们只需要知道在风控中是怎么实现的,并且在实际场景中怎么去使用它就可以了。就如上面我们说的,KS在风控主要是用于评估模型的好坏样本区分度高低的。什么是区分度? 可以看下图: 从业务上来说,就是越往后的箱子,客户的质量越差,rate整体上呈现单调性,从而可以把大多数的坏人,直接从箱的维度上就可以区分开来了,在后续的风控策略使用体验上十分友好。 02 KS的生成逻辑 KS的生成逻辑公式也是十分简单: 好样本累计占比坏样本累计占比 在风控领域,我们在计算KS前一般会根据我们认为的“正态分布原则”进行分箱,一般来说分成了10份,然后再进行KS的计算 03 KS的效果应用 KS的值域在0-1之间,一般来说KS是越大越有区分度的,但在风控领域并不是越大越好,到底KS值与风控模型可用性的关系如何,可看下表: 004 KS的实现 首先我们来对上面展示的例子进行
[信贷全周期行为分析]——即对用户从申请、借款到还款全流程的数据洞察,是进行[精准客群筛选]——如优质客户白名单提取与高风险欺诈拦截的关键依据。" 详细演示如何使用原生PHP(或Laravel/ThinkPHP)对接此API,重点讲解AES-128-CBC在PHP中的加解密实现以及原始数据到前端可视化报表的映射逻辑,助力开发者快速将API的数据能力转化为企业风控 六、打造敏捷风控体系:从数据接入到业务赋能通过PHP集成API的支付行为指数产品,开发者可以极低的技术成本,为现有的信贷管理系统引入大数据风控能力。 借助API,您的系统将不再只是一个简单的录单工具,而是一个具备智能筛选与风险决策能力的专业风控平台。 我们强烈建议企业在数据采集、传输(全程加密)及存储的全生命周期中建立严格的隐私保护机制。这不仅是满足监管合规的基本要求,更是构建用户信任、保障企业业务长期稳健发展的基石。
风控定义 风控是风险控制的简称,在百度百科中是这么定义风险控制的。 风控在我们日常生活中随时可见,小到账户登录验证码,都可以算是一种风控的手段。 这里我们着重了解下信贷下的风控,结合了场景的风控,则赋予了更多的意义。 信贷风控的目标是「利益最大化」,而不是没有风险,在风险和利润之间找到平衡,是信贷风控的核心。 ,以及在信贷场景下的风控如何实现,风控的目标永远是降风险,但不是一味地降,在不同场景下有不同的考虑。 文章例子参考《智能风控平台:架构、设计与实现》
「风控ML」系列文章,主要是分享一下自己多年以来做金融风控的一些事一些情,当然也包括风控建模、机器学习、大数据风控等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步! 第一次接触这两个名词是在做风控模型的时候,老师教我们可以用IV去做变量筛选,IV(Information Value),中文名是信息值,简单来说这个指标的作用就是来衡量变量的预测能力强弱的,然后IV又是
大家好,又见面了,我是你们的朋友全栈君。 一、当前风控模式现状 近年来,信用风险管理发展呈现出数据化、模型化、系统化、自动化和智能化的特点。传统的人工专家经验正逐步被模型与算法替代。 对信贷员的专业技能要求较高,信贷员对贷款全流程把关,一定程度上确保了项目的真实性。但又因为是以信贷员为核心,以信贷员的判断为依据,有一定的操作风险与道德风险。 我们就可以采取相应的商务策略,优化业务: 流程简化:通过模型对客户分层,降低审核人员的工作量,提高审批速度。 风控优化:以客观分数代替主观评断,保证审批标准及风险偏好一致性。 F.设计纬度 风控模型的设计其实就是多维度和多角度的设计方式,这里我们就简单的通过一个对于线上借贷用户进行资质审核的模型进行举例子;从下面的流程我们可以看到,风控模型的审核流程一般都是要经过机器审核和人工确认的相结合的方式 所以说,风控模型的计算策略和机制在一个公司属于绝密,规则除了核心的员工,其他人是不能知道风控规则的。 四、风控的核心 如果说金融产品的核心是风控,那么风控的核心是什么?
一、产品定位与核心亮点 技术定义:腾讯云天御全栈式风控引擎是为预防和解决企业业务系统在不同环节遭受黑灰产侵扰问题,提供全方位安全保障的全栈式风控产品。 核心技术属性:采用“三大防线+核心能力”架构,覆盖流量端、设备端、核心业务端全链路,集成注册保护、登录保护、营销欺诈防控等模块化能力。 第三道防线(核心业务端):专属风控实时计算引擎分析抢票流量,结合账号/环境/行为/场景构建黄牛识别模型;含蓝牙AI无感混合专家模型、第三方AI无线安全专家模型、垂直小程序生态保护、总量安全(多维度围堵黄牛 )、量身定制风控策略(订单层抽样本定策略)功能。 解决方案:使用天御三大防线(流量端/设备端/核心业务端) 全链路风控。 成效:有效拦截99%+黄牛机刷请求,订单分析验证几乎全命中。
大家好,又见面了,我是你们的朋友全栈君。 支付风控涉及到多方面的内容,包括反洗钱、反欺诈、客户风险等级分类管理等。 其中最核心的功能在于对实时交易进行风险评估,或者说是欺诈检测。 二、基于规则的风控 规则是最常用的,也是相对来说比较容易上手的风控模型。从现实情况中总结出一些经验,结合名单数据,制定风控规则,简单,有效。 常见的规则有: 1. 互联网金融风控离不开机器学习,特别是支付风控。 在各种支付风控模型中,决策树模式是相对比较简单易用的模型。 如下的决策树模型,我们根据已有的数据,分析数据特征,构建出一颗决策树。 这个过程,将在下一篇的风控架构中介绍。 五、模型评估 风控本质上是对交易记录的一个分类,所以对风控模型的评估,除了性能外,还需要评估“查全率”和“查准率”。 支付风控场景分析 ; 支付风控数据仓库建设 ; 支付风控模型和流程分析(本文); 支付风控系统架构 发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn
风险管理流程都是哪5步? 风险可以被消除吗? 01.2 描述风险管理流程,识别流程中的问题和挑战 识别风险 量化和估计风险敞口,决定合适的方法来转移风险 根据转移风险的成本来分析转移风险的方法 开发风险缓释策略 avoid 不做生意,完全避免 transfer 不完全是零和游戏,B对 金融灾难和破产的成本没有考虑在完美市场理论,而不是within,C错 使用衍生品对冲需要披露信息,这是对冲的实践缺点,D错 02.2 解释决定一个公司risk appetite的顾虑和流程 practice in risk management Board相比accounting performance应该更关注economic performance Board应该促进健壮的风险管理流程
《风控建模中的样本偏差与拒绝推断》https://zhuanlan.zhihu.com/p/88624987 不过我也还是把他文章里的分类体系在这里重点再次分享一下。 后续观察其贷后表现,给未来的模型提供更丰富的数据; 方法二:指的是从其他机构或者类似产品中获得客户的贷后表现数据,从而来捞回一些拒绝的客户,给予这些客户好坏的标签,用于后续的建模; 方法三:从人工审核的流程中找到具体的拒绝原因 展开法的实施步骤主要是: 1、拿到贷后的样本,按照一定的好坏样本定义规则打上Y值,接着就是常规操作,得到 评分卡模型A; 2、拿着评分卡模型A,去对全量样本(包含拒绝的)进行打分,得到每个样本的模型分P 06 总结一下 本文算是一个对拒绝推断的入门介绍了,让初涉风控模型的同学有一个相对来说比较清晰的全局认识,这里面涉及到的很多算法模型上的细节并没有展开来讲,因为我觉得这也会让阅读带来比较大的负担,公众号的文章还是要控制在几分钟内读完比较合适 Reference [1] 异常检测算法分类及经典模型概览 https://blog.csdn.net/cyan_soul/article/details/101702066 [2] 风控建模中的样本偏差与拒绝推断
[信贷全周期行为分析]——即对用户从申请、借款到还款全流程的数据洞察,是进行[精准客群筛选]——如优质客户白名单提取与高风险欺诈拦截的关键依据。 详细演示如何使用原生PHP(或Laravel/ThinkPHP)对接此API,重点讲解AES-128-CBC在PHP中的加解密实现以及原始数据到前端可视化报表的映射逻辑,助力开发者快速将天远API的数据能力转化为企业风控 六、总结通过PHP集成天远API的信贷行为数据洞察产品,开发者可以极低的技术成本,为现有的信贷管理系统引入大数据风控能力。 借助天远API,您的系统将不再只是一个简单的录单工具,而是一个具备智能筛选与风险决策能力的专业风控平台。 我们强烈建议企业在数据采集、传输(全程加密)及存储的全生命周期中建立严格的隐私保护机制。这不仅是满足监管合规的基本要求,更是构建用户信任、保障企业业务长期稳健发展的基石。
今天来介绍一下风控中的异常检测,从最基础的概念开始讲起,因为本人对这块的内容平时工作也做得不多,更多滴偏向于“纸上谈兵”,有什么说得不对的地方,也欢迎各位朋友指正~谢谢。 异常检测的概念 02 异常检测的难点 03 异常检测的分类及常见算法 01 异常检测的概念 异常检测(Anomaly Detection 或 Outlier Detection),又称为离群点检测,在我们风控领域很多地方都会用到
一、产品定位与核心亮点 腾讯云天御是一款基于人工智能与大数据技术的全栈式风控引擎,为企业提供贯穿业务全链路的反黑灰产防护。 黑产利用猫池批量获取手机号、改机工具伪造设备指纹、动态IP伪装环境,污染用户数据根基 三、应用框架与核心能力 功能架构 注册保护:拦截虚假注册与注册机攻击 登录保护:防御撞库与恶意登录行为 活动防刷:防控薅羊毛 某主题乐园 背景:黄牛机刷流量占比达99%,正常用户无法购票 解决方案:启用流量端+设备端双重防护策略 成效:成功拦截99%以上黄牛请求,订单业务分析确认近乎全命中 3.
「风控ML」系列文章,主要是分享一下自己多年以来做金融风控的一些事一些情,当然也包括风控建模、机器学习、大数据风控等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步! 比如:一个模型是打算应用于初审环节(贷款审批流程),因此我们在初审节点后的变量都是不能用的,比如终审环节、门店审核等等,还有一些贷后的变量都是不能用的。
00 Index 01 GBDT和XGBoost的原理介绍 02 GBDT和XGBoost的异同点分析 03 什么风控建模场景下常用这两个明星算法? 03 什么风控建模场景下常用这两个明星算法? 交易反欺诈:A级出场率,主要是支付风控,防止客户进行薅羊毛、套现等行为。 客户流失:A级出场率。 贷后 催收告警:A级出场率。 迁徙率预测:B级出场率。 失联修复:C级出场率。 而关于风控模型怎么调优,我会在下一节一起讲。 风控模型怎么调优 关于风控模型的调优,先前有篇文章讲得比较细致《风控ML[7] | 风控模型调优的思路有哪些》,大家可以移步去回顾一下。
合规风控始终是公司的首要核心竞争力,该券商不断推进全面风险管理体系建设,需要全方位提升主动合规风控管理能力,进而提升风险管理精细化、智能化水平。 而由于合规风控处于企业核心竞争力的高度,原风控数据积累10年,数据量已超30TB。 非现场风控平台各项报表和查询生成时间逐渐拉长。夜间批量任务越来越慢,部分任务出现超时失败现象。 02 原合规风控数据库数据量巨大,原有的传统的备份手段难以实现数据的实时保护。 价值提升 1 通过QData数据库云平台大幅提升了风控系统的业务效率,风控日终调度业务从原十几个小时缩短至1.5小时,性能提升10倍以上。 坚持自主研发,助力企业数字化转型可持续发展 该行业内头部券商表示:基于沃趣产品的高性能,帮助企业实现了实时风控,全面部署了对线上全渠道、全业务、实时性的欺诈防控。
国金CTRM:期现一体化与全流程风控解决方案 国金金属网信息科技有限公司(成立于2017年,专注大宗贸易风险管理咨询、信息资讯与软件服务)推出国金CTRM(大宗商品交易与风险管理系统),以数字化技术赋能大宗行业 全流程风险管控能力:基于风控引擎、自定义脚本、全局监控,实现实时主动预警。 量化应用效果:从分散滞后到精准实时的跨越 客户价值1:搭建全业务流程风控体系(某内资贸易业务数字项目) 实现信息化建设全业务流程,打通期现一体化管理,健全权益核算体系,完成从分散到集中、从滞后到实时、从模糊到精准的数字化跨越 CTRM平台运营运维管理端(多租户账号权限、资源、计量等)与腾讯云TDSQL结合,业务层按内/外贸、进/出口、转口水平拆分,横向线性提升吞吐量;账务库、风控系统等采用集中式架构,保障系统稳定性与运维效率 (Ops Cost优化),支撑大宗商品合同全生命周期管理、风险规则计算与实时预警。