早期传统金融的风控主要利用了信用属性强大的金融数据,一般采用20个维度左右的数据,利用评分来识别客户的还款能力和还款意愿。 结合中国互联网发展,以及目前的征信监管要求,对可用数据及可用风控类数据做一个全面的梳理。 2.风控数据来源 2.1 数据应用逻辑 常见风控流程中,客户准入时提供的资信材料有限,业务机构风控数据体量不足,仅仅根据内部风险数据进行风险评估会非常片面,无法全面的把控某位客户的风险情况,所以通常需要依赖于第三方供应商提供数据作风控支撑 未来百行能不能有效被使用上还有待观察,但风控人员可先了解其相关的资料。百行征信涉及的模块,主要包括以下方面: 报告相关数据:报告时间;查询原因;查询结果等。 4.2 明确需求 建议:回顾第二节数据应用逻辑关于业务类型、风险类型、风控流程、风险画像等的介绍。
我们这做风控模型的时候,经常是会用KS值来衡量模型的效果,这个指标也是很多领导会直接关注的指标。今天写一篇文章来全面地剖析一下这个指标,了解当中的原理以及实现,因为这些知识是必备的基本功。 不过这不影响我们去使用它,我们只需要知道在风控中是怎么实现的,并且在实际场景中怎么去使用它就可以了。就如上面我们说的,KS在风控主要是用于评估模型的好坏样本区分度高低的。什么是区分度? 可以看下图: 从业务上来说,就是越往后的箱子,客户的质量越差,rate整体上呈现单调性,从而可以把大多数的坏人,直接从箱的维度上就可以区分开来了,在后续的风控策略使用体验上十分友好。 02 KS的生成逻辑 KS的生成逻辑公式也是十分简单: 好样本累计占比坏样本累计占比 在风控领域,我们在计算KS前一般会根据我们认为的“正态分布原则”进行分箱,一般来说分成了10份,然后再进行KS的计算 03 KS的效果应用 KS的值域在0-1之间,一般来说KS是越大越有区分度的,但在风控领域并不是越大越好,到底KS值与风控模型可用性的关系如何,可看下表: 004 KS的实现 首先我们来对上面展示的例子进行
风控定义 风控是风险控制的简称,在百度百科中是这么定义风险控制的。 风控在我们日常生活中随时可见,小到账户登录验证码,都可以算是一种风控的手段。 这里我们着重了解下信贷下的风控,结合了场景的风控,则赋予了更多的意义。 信贷风控的目标是「利益最大化」,而不是没有风险,在风险和利润之间找到平衡,是信贷风控的核心。 ,以及在信贷场景下的风控如何实现,风控的目标永远是降风险,但不是一味地降,在不同场景下有不同的考虑。 文章例子参考《智能风控平台:架构、设计与实现》
引言 在金融行业中,风险控制(风控)是核心环节之一,它直接关系到金融机构的稳健运营和可持续发展。随着云计算技术的快速发展,越来越多的金融机构开始采用云服务来提升风控能力。 本文将探讨如何利用云计算技术优化金融风控体系。 云计算在金融风控中的优势 1. 2. 弹性和可扩展性 云服务的弹性和可扩展性使得金融机构可以根据业务需求快速调整资源,无论是应对市场波动还是业务增长,都能保持风控系统的高效运行。 3. 云计算技术在金融风控中的应用 1. 大数据分析 利用云计算平台的大数据处理能力,金融机构可以对交易数据、客户数据等进行深入分析,识别潜在的风险模式。 2. 结语 金融风控是金融机构的生命线,云计算技术的应用为金融风控带来了新的机遇。我们鼓励金融机构拥抱云计算,利用其强大的数据处理、弹性伸缩、成本效益和安全性优势,构建更加智能、高效的风控体系。
部署云端业务风控引擎与一体化终端管控架构 针对内外流量与终端风险,腾讯云依托底层数据与AI能力,提供双引擎驱动的安全架构: 1. 企业微信原生协同: 实施基于企微身份的可信鉴权体系,支持PC端扫码一键登录与移动端无感免装访问。 AI辅助运营与DLP防泄密: 引入AI助手对EDR威胁事件进行结构化深度分析;基于自然语言处理(NLP)实现敏感数据智能聚类与分级分类,精准管控浏览器上传/粘贴敏感信息及源代码外发行为。 锁定毫秒级风控决策与千万级营销资金止损 基于业务系统实际运行反馈,该架构在响应速度与投资回报率(ROI)上展现出量化的业务价值: 决策延迟(Latency): RCE风控API基于亿级数据毫秒级查询,实现约 拦截多行业高频欺诈与终端合规治理实录 安全能力已在多个复杂业务场景中完成实网对抗与价值验证: 国内Top2在线旅行平台: 针对“APP注册新人礼”等促活场景,接入天御风控引擎实时判断用户风险。
「风控ML」系列文章,主要是分享一下自己多年以来做金融风控的一些事一些情,当然也包括风控建模、机器学习、大数据风控等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步! 第一次接触这两个名词是在做风控模型的时候,老师教我们可以用IV去做变量筛选,IV(Information Value),中文名是信息值,简单来说这个指标的作用就是来衡量变量的预测能力强弱的,然后IV又是 data_good == value) / len_good iv += (good_rate - bad_rate) * math.log(good_rate / bad_rate,2) 2)注意分组后是否出现某组内的响应(未响应)数量为零的情况,如果为零需要处理一下。 ...], 'col2':[value1,value2,...], ...} ----------------------------------------------------------
2.评分卡的意义 在互联网金融风控体系中,量化分析需要贯穿始终,评分卡模型是其中非常重要的一环。 直到我们和某P2P公司的风控经理实际交流后才明白这其中的含义。在传统银行信用卡业务中,是很喜欢这类少量逾期的客户的,因为他们能给银行创造罚息,但是又不是恶意违约那种客户。 另外,风控模型在不同的阶段体现的方式和功能也不一样。 从资金的角度来看,风控模型是为了评估用户还款能力和还款意愿,反欺诈反作弊,防止用户薅羊毛和保证平台安全等功能;从行业的角度,互联网风控模型体现在消费金融/供应链金融/信用借贷/P2P/大数据征信等方面。 所以说,风控模型的计算策略和机制在一个公司属于绝密,规则除了核心的员工,其他人是不能知道风控规则的。 四、风控的核心 如果说金融产品的核心是风控,那么风控的核心是什么?
天御的大模型智能风控体系 天御的基本观点是:大模型本质是一种方法论,复杂多样的模型结构只是实现载体。只要能够充分利用垂直场景知识完成训练,即可构成面向该场景的大模型。 在正式介绍金融风控大模型之前,先作一项澄清:大众语境中的“大模型”多指通识层面的生成式 AI 模型,而此处的“风控大模型”并非同类。 在整体体系上,天御的智能风控以自研风控大模型与“混元”大模型基座为基础,结合数据—模型—应用各阶段特点进行差异化应用,例如数据挖掘阶段:利用大模型进行底层特征挖掘与数据分析;在应用阶段:支持如智能投顾、 在模型层面,我们也在探索更契合风控体制的、更强大的模型架构,期待在风控任务中出现类似生成式 AI 的“知识涌现”,从而带来能力的台阶式提升。 对于生成式 AI,我们抱有明确期待:一方面通过更强的技术路线缓解“幻觉”问题并提升决策精确性,另一方面在工程上逐步构建面向风控智能体的 MCP 协议。
数美依托强大的AI技术与海量基础数据,为金融机构提供覆盖全业务流程的完整风控解决方案。 2、所属分类 金融科技 · 风控、反欺诈 3、产品介绍 数美依托强大的AI技术与海量基础数据,为金融机构提供覆盖全业务流程的完整风控解决方案。 作为反欺诈领域专业品牌,数美经过2年的实践与积累,构建了立体的全业务流程风控体系,可有效帮助金融机构进行反欺诈与风控。 2) 信贷风控云 贷款人提交申请后,信贷风控云将首先对其进行可信度分级,对于高可信度的用户,可以使用更宽松的策略甚至直接通过审核。 2) 助力金融企业服务,促进普惠金融发展 数美一直专注于大数据反欺诈领域的技术创新,通过多种反欺诈技术识别欺诈风险,借助多维度数据识别信用风险,利用多重的策略模型提升风控效果,进而打造立体的防御体系,为金融客户提供持续
周期/节奏 项目于16年10月开始,17年2月结束。 客户名称/所属分类 大型持牌消费金融公司·风控 任务/目标 由于新金融业务的迅速普惠化,金融客户也面临着崭新的挑战和需求。 一方面由于客群下沉,可获得的用户信息愈发受限,数据质量参差不齐,传统风控经验无法直接应用,急需利用先进技术来提升风控能力; 另一方面互联网金融往往小额量大,基于人工的风控成本过高,用自动化的数据智能风控体系来提升整个流程的效率也是必然的发展趋势 事实上,由于数据的不同,这相当于重构一套与传统风控体系并行的数据架构体系。 在这过程中,如何将海量稀疏、超高维、低饱和的大数据与风险挂钩?如何挖掘非结构化数据价值时穷尽风险? 实施过程/解决方案 上述三个方面的挑战贯穿风控的各条业务线,此次案例的解决方案着眼于风控核心的反欺诈和授信两个阶段来阐述如何解决这几个问题,并构建一整套完整的申请贷前风控体系。 这远远超出传统风控基于评分卡体系的建模能力范围。
business process 价值有: 提高组织效率 更好的风险汇报 提高业务绩效 04.3 描述一个CRO的角色和职责,评估CRO如何和其他高管协作 CRO职责 1.对公司面临的所有风险负责 2. 开发和实现ERM策略 工作范围: 1.设置公司全局风险偏好 2.度量和量化风险 3.设置风险限制 4.开发风险系统 关键技能: 1.领导力 2.说服力 3.有能力保护公司资产 4.理解所有风险的技术技能 采取有理由的防范保证会员服务不用在不合适,欺骗性,违法目的 不可以故意的歪曲报道 不可以从事任何不诚实 不可以从事任何危害GARP和FRM的事情 注意文化不同,出现冲突应该应用最高标准 2 利益冲突 任何情况下保持公平
二、基于规则的风控 规则是最常用的,也是相对来说比较容易上手的风控模型。从现实情况中总结出一些经验,结合名单数据,制定风控规则,简单,有效。 常见的规则有: 1. 2. 操作规则 对支付、提现、充值的频率按照用户账号、IP、设备等进行限制,一旦超出阈值,则提升风控等级。 频率需综合考虑(五)分钟、(一)小时、(一)天、(一)周等维度的数据。 比如2分钟前在中国支付的,2分钟后跑到美国去支付了。 5. 风控拦截历史规则 用户在某个业务上的消费行为被风控网关多次拦截。 规则引擎优点: 性能高: 对订单按照规则进行匹配,输出结果。 这个过程,将在下一篇的风控架构中介绍。 五、模型评估 风控本质上是对交易记录的一个分类,所以对风控模型的评估,除了性能外,还需要评估“查全率”和“查准率”。 支付风控场景分析 ; 支付风控数据仓库建设 ; 支付风控模型和流程分析(本文); 支付风控系统架构 发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn
《风控建模中的样本偏差与拒绝推断》https://zhuanlan.zhihu.com/p/88624987 不过我也还是把他文章里的分类体系在这里重点再次分享一下。 展开法的实施步骤主要是: 1、拿到贷后的样本,按照一定的好坏样本定义规则打上Y值,接着就是常规操作,得到 评分卡模型A; 2、拿着评分卡模型A,去对全量样本(包含拒绝的)进行打分,得到每个样本的模型分P cutoff一般按照业务经验来设置,就是拒绝样本中被赋予通过的样本,其badrate水平,是正常放款样本中的badrate水平的2~4倍; 4、根据步骤3设置的cutoff,高于这个阈值的赋予good标签 06 总结一下 本文算是一个对拒绝推断的入门介绍了,让初涉风控模型的同学有一个相对来说比较清晰的全局认识,这里面涉及到的很多算法模型上的细节并没有展开来讲,因为我觉得这也会让阅读带来比较大的负担,公众号的文章还是要控制在几分钟内读完比较合适 Reference [1] 异常检测算法分类及经典模型概览 https://blog.csdn.net/cyan_soul/article/details/101702066 [2] 风控建模中的样本偏差与拒绝推断
今天来介绍一下风控中的异常检测,从最基础的概念开始讲起,因为本人对这块的内容平时工作也做得不多,更多滴偏向于“纸上谈兵”,有什么说得不对的地方,也欢迎各位朋友指正~谢谢。 异常检测的概念 02 异常检测的难点 03 异常检测的分类及常见算法 01 异常检测的概念 异常检测(Anomaly Detection 或 Outlier Detection),又称为离群点检测,在我们风控领域很多地方都会用到 主要有几个原因: 1)异常点和噪声会混杂在一起,机器难以具体识别开来; 2)现实中很少有异常点的标签,因为标签越多也就意味着遇到过的异常越多,也不符合常识认知; 3)对于标签的定义也是很难,比如1个金融场景 2.上下文异常:一般在时间序列中表现,某个时间点的指标相对前后时间段有较大波动的。比如某个中午交易量异常。 2、半监督DAD:半监督DAD假设所有的训练样本只有一个标签,即正样本,训练过程学习到正样本的界限,测试时,不属于正样本边界内的就划为异常。
数据猿导读 项目以“内外部大数据的应用”、“实时风控技术的落地”、“智能化风控体系 的搭建”和“云化风控系统的探索”为基础,与客户一同形成一套整体化的新型大数据智能风控解决体系,项目落地后取得了较好的效果 本项目以“内外部大数据的应用”、“实时风控技术的落地”、“智能化风控体系的搭建”和“云化风控系统的探索”为基础,与客户一同形成一套整体化的新型大数据智能风控解决体系,项目落地后取得了较好的效果。 任务/目标 银行现有风控体系面临数据应用范围扩展、风控决策效率不匹配场景需求,本项目旨在达成如下目标: 1)探索非金融体系数据的应用:现有风控体系基于央行征信报告设计,内部数据集成项目正在进行过程中,时间不可匹配业务 ,外部数据(征信数据除外)尚未有接入经验; 2)提升风控决策效率:传统风控系统单笔订单审批时间超过半小时,但消费金融场景客户填写资料后就在现场等,需要做到“实时”或“准实时”放贷; 3)尝试风控体系自动化优化 :需要针对消费金融场景独立构建分析体系、风控体系自优化等内容; 4)探索风控系统的云模式:以消费金融业务为试点,探索风控系统云化的可能性。
「风控ML」系列文章,主要是分享一下自己多年以来做金融风控的一些事一些情,当然也包括风控建模、机器学习、大数据风控等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步! 一个机器学习模型的开发周期一般可以分为: 1、业务需求挖掘(Business insight) 2、数据搜集处理(Data Curation) 3、模型训练开发(Modeling) 4、部署及测试上线( 而在开始搜集数据前,需要了解几点内容: 1、模型应用节点 2、时效性要求 2、有没有预算,预算有多少 3、项目紧急程度 模型应用节点 模型的应用节点,决定了你有哪些变量是不可以用的,避免说出现“事后变量 具体可以参考我先前的一篇文章内容《分享8点超级有用的Python编程建议》 搞到数据后,需要做的事情大概可以分为: 1、消化所有的数据含义、逻辑; 2、对数据进行各种清洗,变成你熟悉的结构; 3、对数据进行质量控制 最好还是通过自己总结多方特征筛选的方法,写一套自己的方法,方便自己调用; 2、如果是使用传统机器学习算法,如rf、gbdt、xgb等,建议变量个数不要太多,50个以内差不多了。
00 Index 01 GBDT和XGBoost的原理介绍 02 GBDT和XGBoost的异同点分析 03 什么风控建模场景下常用这两个明星算法? 03 什么风控建模场景下常用这两个明星算法? 交易反欺诈:A级出场率,主要是支付风控,防止客户进行薅羊毛、套现等行为。 客户流失:A级出场率。 贷后 催收告警:A级出场率。 迁徙率预测:B级出场率。 失联修复:C级出场率。 {‘auto’, ‘sqrt’, ‘log2’}, int or float, default=None。如果不填的话,默认就是用所有的特征。 ... 而关于风控模型怎么调优,我会在下一节一起讲。 风控模型怎么调优 关于风控模型的调优,先前有篇文章讲得比较细致《风控ML[7] | 风控模型调优的思路有哪些》,大家可以移步去回顾一下。
AI审计系统利用自然语言处理(NLP)技术,能像人一样“阅读”和理解海量的合同、邮件、公告、新闻,甚至聊天记录。 风险的“预言家”这是AI审计最核心的价值。它不只是“找茬”,更是“预警”。 通过机器学习,AI系统可以学习企业历史上所有的风险案例和违规行为,构建出复杂的风险预测模型。 三个驱动力,让AI审计从“概念”走向“刚需”: 数据够多了: 企业数字化转型,产生了海量数据,为AI提供了充足的“燃料”。 AI智能审计系统,不仅仅是一个产品,更是一个充满挑战和机遇的技术新大陆。 总而言之,AI智能审计系统,正在将审计师从“账房先生”升级为“风险策略师”,将企业的风险管理从“被动防御”升级为“主动智能”。
合规风控始终是公司的首要核心竞争力,该券商不断推进全面风险管理体系建设,需要全方位提升主动合规风控管理能力,进而提升风险管理精细化、智能化水平。 而由于合规风控处于企业核心竞争力的高度,原风控数据积累10年,数据量已超30TB。 非现场风控平台各项报表和查询生成时间逐渐拉长。夜间批量任务越来越慢,部分任务出现超时失败现象。 02 原合规风控数据库数据量巨大,原有的传统的备份手段难以实现数据的实时保护。 价值提升 1 通过QData数据库云平台大幅提升了风控系统的业务效率,风控日终调度业务从原十几个小时缩短至1.5小时,性能提升10倍以上。 2 通过多年的发展,基于沃趣QData Cloud云平台解决方案逐步拓展成数据库私有云应用场景,以Oracle为代表的数据库如:客户关系管理、风控、合规、自营交易等系统正在逐步迁移到数据库私有云平台。
在金融行业,风险控制(风控)是核心环节,它关乎资产安全、合规性以及机构的长期稳健发展。随着大数据时代的到来,金融机构面临着前所未有的数据量和复杂性。 在这样的背景下,风控领域特征工程应运而生,成为连接原始数据与精准风险评估的桥梁。 特征工程,简而言之,是对数据的一种深度加工,它通过一系列技术手段,将原始数据转化为对风险预测有用的信息。 在风控领域,特征工程的核心目标是构建出能够准确反映个体或实体风险水平的特征集。 此外,良好的特征工程实践还能促进模型的解释性,为风控决策提供更加透明的依据。 随着技术的发展,特征工程的方法也在不断创新。 通过综合运用这些特征衍生方法,风控领域的特征工程能够更全面地挖掘数据潜力,为风险评估提供多维度的视角。