首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏全栈程序员必看

    支付模型

    这就需要对模型进行合理的设计。一般来说,要提升的拦截效率,就需要考虑更多的维度,但这也会带来计算性能的下降。在效率和性能之间需要进行平衡。 二、基于规则的 规则是最常用的,也是相对来说比较容易上手的模型。从现实情况中总结出一些经验,结合名单数据,制定规则,简单,有效。 常见的规则有: 1. 互联网金融离不开机器学习,特别是支付。 在各种支付模型中,决策树模式是相对比较简单易用的模型。 如下的决策树模型,我们根据已有的数据,分析数据特征,构建出一颗决策树。 五、模型评估 本质上是对交易记录的一个分类,所以对模型的评估,除了性能外,还需要评估“查全率”和“查准率”。 支付场景分析 ; 支付数据仓库建设 ; 支付模型和流程分析(本文); 支付系统架构 发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn

    4.2K22编辑于 2022-08-11
  • 来自专栏全栈程序员必看

    信贷模型搭建及核心模式分类

    另外,模型在不同的阶段体现的方式和功能也不一样。 从资金的角度来看,模型是为了评估用户还款能力和还款意愿,反欺诈反作弊,防止用户薅羊毛和保证平台安全等功能;从行业的角度,互联网模型体现在消费金融/供应链金融/信用借贷/P2P/大数据征信等方面。 F.设计纬度 模型的设计其实就是多维度和多角度的设计方式,这里我们就简单的通过一个对于线上借贷用户进行资质审核的模型进行举例子;从下面的流程我们可以看到,模型的审核流程一般都是要经过机器审核和人工确认的相结合的方式 所以说,模型的计算策略和机制在一个公司属于绝密,规则除了核心的员工,其他人是不能知道规则的。 四、的核心 如果说金融产品的核心是,那么的核心是什么? 五、模型的设计步骤 总体来说模型的设计主要可以分为以下的几个步骤: 1.获取数据 信用评估来自于用户数据,模型规则其实就是用户数据规则,信息的纬度也比较广泛,大致可以分为基本信息/行为信息

    4.1K11编辑于 2022-08-14
  • 来自专栏全栈程序员必看

    模型–Odds含义

    发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/141728.html原文链接:https://javaforall.cn

    1.7K20编辑于 2022-09-01
  • 来自专栏全栈程序员必看

    信贷模型开发—-模型简介

    第一章 模型简介 1.1 为什么要建模 1.2 什么是信用评分 1.3 常用的模型 1.4 概念解析:M0,M1,M2的定义 下一章预告 参考文献 第一章 模型简介 本系列文章为笔者对信贷领域建模的一些学习研究心得汇总 ,以及一些代码示例,尽量会将信贷领域的一些基本概念阐述明白。 1.3 常用的模型 业界常说的有A卡、B卡、C卡,A卡就是申请评分卡。 在你申请的时候就会站出来,决定放不放款,B卡,也就是贷中行为评分卡,监控你的信用状况,决定给不给你提额度,或者中不中断你的贷款,C卡就是贷后评分卡,一般有三种:账龄迁移模型、还款率模型和失联预警模型。 还款率模型:注意这个模型不是为了预测你还不还钱,而是预测未来经过催收动作后,还款的概率。

    1.5K10编辑于 2022-09-05
  • 来自专栏机器学习AI算法工程

    拍拍贷预测模型

    拍拍贷“魔镜系统”从平均400个数据维度评估用户当前的信用状态,给每个借款人打出当前状态的信用分,在此基础上,再结合新发标的信息,打出对于每个标的6个月内逾期率的预测,为投资人提供了关键的决策依据 统计模型的选择长期看似乎是风水轮流转,逻辑回归是最经典的线性分类模型,XGBoost是目前在机器学习竞赛表现普遍很好的集成决策树类模型,神经网络现在如此热门,但是今后也说不定有更强大的模型,况且大家都是对现实的规律进行某种形态的假设和拟合 ,不同模型的优势点不一样。 除了单纯的精度之外,其实我们重要的是了解各个模型的原理,如何利用它们的特点和优势,为我们的数据预测工具箱服务。 ? 不论什么模型,交叉验证在增加稳健性、减少过拟合方面是模型训练中少不了的经典之作。 与其跟着不同模型包和语言学习调用不同的交叉验证函数,我们不妨在模型训练前就为模型搭建统一的交叉验证拆分数据和训练方法。 ?

    3K81发布于 2018-03-13
  • 来自专栏全栈程序员必看

    模型评价指标总结

    下表为我在日常建模过程中,评价模型经常用到的一些指标。现在整理出来分享给大家,如果大家想知道每种指标的具体意义,还请大家查阅相关大佬的博文。小弟就不在这里班门弄斧了。

    72730编辑于 2022-09-01
  • 来自专栏SAMshare

    ML | 模型报告以及上线后需要监控的内容

    一个优秀的模型上线报告以及一个优秀的上线后模型监控报表,在我们日常建模中是非常的常用并且有用的,今天这个话题就来和大家聊聊怎么去制作优秀的模型上线报告以及上线后的模型监控报表,主要聊聊思路,先要有一个全局的感受 以下内容均基于自己浅薄的经历提炼的,如有纰漏,欢迎指正或补充哦,欢迎交流~ 00 Index 01 聊聊为什么要做这件事 02 标配的模型上线报告应具备哪些内容 0201 模型现状 0202 KS值与各种曲线 02 标配的模型上线报告应具备哪些内容 0201 模型现状 想要突出你模型的好,你得先分析旧模型的不好。 比如说,把目前线上模型的实际表现进行统计,如KS值、分组排序性、PSI等基础指标。 0202 KS值与各种曲线 我们需要描述模型的效果,在领域最直接的指标就是KS值,我们一般会认为KS>0.3才具备最基本的上线要求,而且我们要保证训练集、测试集以及跨时间测试集都需要达到标准哦! 3)Lift曲线: Lift曲线,简单理解,就是对比在不使用模型的情况下,预测能力提升了多少,其计算公式如下: 0203 模型分组排序性 分组排序性在模型中的重要性不言而喻了,所以这个指标也是领导需要着重看的

    4.4K21编辑于 2022-04-12
  • 来自专栏全栈程序员必看

    模型的基础知识

    一、 模型的A卡、B卡、C卡 模型根据设定的y变量与可获得的x变量不同,大致可以分为三类:即A卡,B卡,C卡。今天就让我们聊聊三者的区别。 1、A卡(Application score card) A卡即申请评分模型,此类模型的目的在于预测申请时点(申请信用卡、申请贷款)未来一定时间内逾期的概率。 2、B卡(Behavior score card) B卡即行为评分模型,此类模型的目的在于预测使用时点(获得贷款、信用卡的使用期间)未来一定时间内逾期的概率。 3、C卡(Collection score card) C卡即催收评分模型,此类模型的目的在于预测进入催收阶段后未来一定时间内还款的概率。 二、表现期&观察期 何为目标(即所谓的y值),在模型的门类中一般就是指某个客户或账户是否逾期(通常以0,1)来区分。我们在建立风险模型的时候,不能简单地将逾期客户定为1,未逾期客户定义为0。

    2.6K20编辑于 2022-09-02
  • 来自专栏SAMshare

    学习周报20200621 | 模型、回顾

    这周因为一些原因需要整理一些建模的知识点,顺便在这里整理一下,一起来回顾回顾。 一、评分卡开发过程 1、信用评分卡分为:申请评分卡和行为评分卡。 2、典型的评分卡开发流程包括:问题准备、数据获取与整合、EDA、数据准备、变量选择、模型开发、模型检验和评价、评分卡实施、模型检测。 可以参考:MLK | 机器学习常见算法优缺点了解一下 8、模型评估的常用方法有哪些? 3、全面了解风指标体系 https://mp.weixin.qq.com/s/-posovos49MGleNgSXHFWw 概述:非常全面地梳理了一遍指标,从贷前到贷后,很适合系统了解这块知识。 ,PCA-算法面经 8、关键数据Vintage、滚动率、迁移率的讲解应用 https://www.sohu.com/a/305129117_99917536 讲解了必须要了解的几个关键指标的原理和应用案例

    2.3K20发布于 2020-06-24
  • 来自专栏SAMshare

    ML | 建模的KS

    我们这做模型的时候,经常是会用KS值来衡量模型的效果,这个指标也是很多领导会直接关注的指标。今天写一篇文章来全面地剖析一下这个指标,了解当中的原理以及实现,因为这些知识是必备的基本功。 我将会从下面几个方面来展开讲解一下KS: KS的概念 KS的生成逻辑 KS的效果应用 KS的实现 01 KS的概念 KS的全称叫“Kolmogorov-Smirnov“,我知道的是苏联数学家提出来的一个检验方法,后面怎么地就用到了模型的区分度评估就不知道咯 不过这不影响我们去使用它,我们只需要知道在中是怎么实现的,并且在实际场景中怎么去使用它就可以了。就如上面我们说的,KS在主要是用于评估模型的好坏样本区分度高低的。什么是区分度? 可以看下图: 从业务上来说,就是越往后的箱子,客户的质量越差,rate整体上呈现单调性,从而可以把大多数的坏人,直接从箱的维度上就可以区分开来了,在后续的策略使用体验上十分友好。 03 KS的效果应用 KS的值域在0-1之间,一般来说KS是越大越有区分度的,但在领域并不是越大越好,到底KS值与模型可用性的关系如何,可看下表: 004 KS的实现 首先我们来对上面展示的例子进行

    6.2K31编辑于 2022-02-25
  • 来自专栏全栈程序员必看

    模型基本概念和方法

    该训练营第一期为主题,培训内容十分紧凑,非常好,推荐:CDA数据科学家训练营 —————————————————————————————————————————— 一、建模流程以及分类模型建设 2、分类模型种类与区别 与其他领域一样,分类模型主要分为两大类:排序类、决策类、标注类(文本、自然语言处理)。 一般来说领域在意的是前两个模型种类,排序类以及决策类。 (1)ROC曲线 对角线模型,最差,喜欢的指标。由决策类指标的灵敏度(召回率/覆盖率)与特异度(负灵敏度、负召回率)来构造。 求覆盖率等指标,需要指定一个阈值(threshold)。 将概率从大到小铺开x,提升度可以有一些“忽悠”的成本,哈哈~可以微调,可以自己调节提升度的区间 (3)K-S曲线 喜欢的指标。K-S曲线的最大值代表K-S统计量。 (4)洛伦兹曲线gini 喜欢的指标,TP率给了一个累积比,跟提升度差不多。

    2.1K11编辑于 2022-08-11
  • 来自专栏机器学习AI算法工程

    4步教你开发评分模型

    “你的模型准么?” “你的模型真的有用么?” “你的模型有价值么?” 在为P2P公司建立评分模型过程中,这是最常见的问题。 在互联网金融体系中,量化分析需要贯穿始终,评分卡模型是其中非常重要的一环。 在互联网金融评分卡开发过程中,我们仔细研究了企业操作流程,反复推敲了模型构建步骤,最后我们认为从业务应用角度,评分卡开发应用应遵循: 业务定义 -> 风险定义-> 风险分解 -> 风险策略 这几个步骤 我们就可以采取相应的商务策略,优化业务: - 流程简化:通过模型对客户分层,降低审核人员的工作量,提高审批速度。 - 优化:以客观分数代替主观评断,保证审批标准及风险偏好一致性。 经过跟对方的接触,证实在该时间点该P2P公司确实做过有关申请界面、必填字段、等的相关调整。

    4.3K81发布于 2018-03-13
  • 来自专栏全栈程序员必看

    一文看懂模型所有

    模型,是在策略达到平衡之际,实现风险精分差异化的必备武器。 模型,广义上代表任何运用数据构建的风险管理模式,狭义上讲,是运用统计、机器学习甚至深度学习等算法开发的数学模型。 目录 一.模型概要 二.建模/算法工程师 三.速览评分模型搭建 四.细说评分模型搭建全流程 1)A、B、C广义三种评分模型 2)数据业务理解 3)数据探索分析 4 02 建模/算法工程师 模型开发人员,相较于数据分析、策略分析人员,对于统计分析方法、大数据机器学习算法都要有更深入的理解。 从字面意义就可以发现,建模工程师工作核心还是以模型的开发为主,更多的工作落脚点在构造有效特征,应用一些模型算法进行数据训练和测试。 对于没有接触或者未从事模型设计开发工作的读者朋友们,不妨也了解下设计思路,便于提升策略等其他工作的风险管理效能,毕竟,评分模型、策略规则甚至产品设计,彼此不分家!

    9K32编辑于 2022-09-06
  • 来自专栏LieBrother

    何为

    定义 是风险控制的简称,在百度百科中是这么定义风险控制的。 在我们日常生活中随时可见,小到账户登录验证码,都可以算是一种的手段。 这里我们着重了解下信贷下的,结合了场景的,则赋予了更多的意义。 信贷的目标是「利益最大化」,而不是没有风险,在风险和利润之间找到平衡,是信贷的核心。 ,以及在信贷场景下的如何实现,的目标永远是降风险,但不是一味地降,在不同场景下有不同的考虑。 文章例子参考《智能平台:架构、设计与实现》

    2.8K21编辑于 2022-12-20
  • 来自专栏SAMshare

    ML | 建模的WOE与IV

    ML」系列文章,主要是分享一下自己多年以来做金融的一些事一些情,当然也包括建模、机器学习、大数据等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步! 第一次接触这两个名词是在做模型的时候,老师教我们可以用IV去做变量筛选,IV(Information Value),中文名是信息值,简单来说这个指标的作用就是来衡量变量的预测能力强弱的,然后IV又是

    4.7K20发布于 2021-11-30
  • 来自专栏全栈程序员必看

    模型及特征的上线部署方法

    序言: 作为年后的首篇实操干货文章,番茄一如既往向业内小伙伴输出相关的干货文章。有实操能落地,有数据可撸码,继续将会是番茄提供给各位小伙伴的业内标配内容。 近期,我们花费了时间容整理了目前业内各位小伙伴关心的内容,本次文章是其中一个问题就是模型跟规则在现有的系统内是如何规范上线的,基于此,我们给大家带来了这样的一篇内容。 4.2.特征和模型分的一致性校验 正文: 模型线下开发好后,接下来就是上线部署的流程,上线部署关系到模型的稳定性和可控性,是需要去规范化,细心做的一个环节。 如下图所示),这种方式相当于把底层数据源清洗,创建中间表,特征开发都放在数仓里进行,建模同学在数仓里完成开发工作后,可以让管理数仓的同学设置定时跑批任务,例如每天(T+1)在凌晨跑出一批用户的特征供当天使用 3.决策平台或算法平台部署,例如蚂蚁金服的PAI机器学习平台,可通过workflow的方式自助式搭建模型,实现快速部署。

    1.8K12编辑于 2022-08-19
  • 来自专栏全栈程序员必看

    大数据模型是什么?有哪些?

    其实,做大数据是一个挺细致的事儿,大数据,重要的不是数据本身,而是对数据的理解。 大数据模型是什么 指标体系 大数据圈流行一句话:数据决定了数据分析的上限,而模型做的是逼近这个上限。 模型 大数据更多应用与小微互金贷款,因此更多是还款意愿的控制,欺诈风险会比较高,因此构建好的反欺诈模型就非常重要,目前一般分三种: 1. 机器学习模型:利用聚类等模型发现一些违反常识的规则,反推,在应用于后续的客户验证。 另外,传统信贷中非常关注的信用风险,大数据同样非常重视。 评分模型最常使用的就是LR模型,现在大数据在此基础上补充了XGboost,FFM等模型来尝试新的方向,不过据了解,目前还是LR模型最稳定常用,新的机器学习模型或许还需要一段时间的实践和迭代。

    1.9K20编辑于 2022-09-05
  • 来自专栏全栈程序员必看

    互联网金融模型「建议收藏」

    一、市场调研 目前市面主流的模型 1、互联网金融前10名排行榜(数据截止日期2017-09-12) 互联网金融公司排名分别是蚂蚁金服、陆金所、京东金融、苏宁金融、百度金融、腾讯理财通、宜信、钱大掌柜 数据还有很长的路要走,如量化投资风险评估与运营也属范畴,也可和推荐领域相结合。 因此风显的更加尤为重要。通过模型获取优质的资产。 二、模型 模型应该是从两个角度去考虑,第一个角度是资产端策略,第二个角度是资金端策略。 考虑主要出发点应该是从贷前、袋中、贷后三个方向去考虑,结合传统业务的模型和互联用户的行为数据。针对资金,资产进行风险等级划分,防欺诈系统、袋中的舆情监控、贷后的权重叠加。 根据贷后的状态进行预警、等级划分 四、技术实现 用户画像、人脸识别、推荐系统、智能语音、数据挖掘、模型

    3.5K10编辑于 2022-07-01
  • 来自专栏用户3246163的专栏

    1.1 原则

    风险管理的目标是减少和消除EL,但是更concern UL,A对 承担风险的数量和潜在损失的大小不是绝对相关的,B错 风险管理的最后一步是监控,C错 风险是不确定性,不确定性是不会消失的,采用风险转移只是把风险转给了别的公司,D错

    3.2K60发布于 2018-09-14
  • 来自专栏SAMshare

    ML | 建模中怎么做拒绝推断

    建模中的样本偏差与拒绝推断》https://zhuanlan.zhihu.com/p/88624987 不过我也还是把他文章里的分类体系在这里重点再次分享一下。 展开法的实施步骤主要是: 1、拿到贷后的样本,按照一定的好坏样本定义规则打上Y值,接着就是常规操作,得到 评分卡模型A; 2、拿着评分卡模型A,去对全量样本(包含拒绝的)进行打分,得到每个样本的模型分P 如果加入拒绝推断后的模型可以带来更好的效果(比如放款率高且坏账率低),则代表模型有效! 06 总结一下 本文算是一个对拒绝推断的入门介绍了,让初涉模型的同学有一个相对来说比较清晰的全局认识,这里面涉及到的很多算法模型上的细节并没有展开来讲,因为我觉得这也会让阅读带来比较大的负担,公众号的文章还是要控制在几分钟内读完比较合适 Reference [1] 异常检测算法分类及经典模型概览 https://blog.csdn.net/cyan_soul/article/details/101702066 [2] 建模中的样本偏差与拒绝推断

    3K30编辑于 2022-11-14
领券