首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏大数据架构师成长之路

    数据体系-简介

    早期传统金融的主要利用了信用属性强大的金融数据,一般采用20个维度左右的数据,利用评分来识别客户的还款能力和还款意愿。 结合中国互联网发展,以及目前的征信监管要求,对可用数据及可用类数据做一个全面的梳理。 2.数据来源 2.1 数据应用逻辑 常见流程中,客户准入时提供的资信材料有限,业务机构数据体量不足,仅仅根据内部风险数据进行风险评估会非常片面,无法全面的把某位客户的风险情况,所以通常需要依赖于第三方供应商提供数据作风支撑 未来百行能不能有效被使用上还有待观察,但人员可先了解其相关的资料。百行征信涉及的模块,主要包括以下方面: 报告相关数据:报告时间;查询原因;查询结果等。 4.2 明确需求 建议:回顾第二节数据应用逻辑关于业务类型、风险类型、流程、风险画像等的介绍。

    6.5K67发布于 2020-06-29
  • 来自专栏SAMshare

    ML | 建模的KS

    我们这做模型的时候,经常是会用KS值来衡量模型的效果,这个指标也是很多领导会直接关注的指标。今天写一篇文章来全面地剖析一下这个指标,了解当中的原理以及实现,因为这些知识是必备的基本功。 不过这不影响我们去使用它,我们只需要知道在中是怎么实现的,并且在实际场景中怎么去使用它就可以了。就如上面我们说的,KS在主要是用于评估模型的好坏样本区分度高低的。什么是区分度? 可以看下图: 从业务上来说,就是越往后的箱子,客户的质量越差,rate整体上呈现单调性,从而可以把大多数的坏人,直接从箱的维度上就可以区分开来了,在后续的策略使用体验上十分友好。 02 KS的生成逻辑 KS的生成逻辑公式也是十分简单: 好样本累计占比坏样本累计占比 在领域,我们在计算KS前一般会根据我们认为的“正态分布原则”进行分箱,一般来说分成了10份,然后再进行KS的计算 03 KS的效果应用 KS的值域在0-1之间,一般来说KS是越大越有区分度的,但在领域并不是越大越好,到底KS值与模型可用性的关系如何,可看下表: 004 KS的实现 首先我们来对上面展示的例子进行

    6.1K31编辑于 2022-02-25
  • 来自专栏LieBrother

    何为

    定义 是风险控制的简称,在百度百科中是这么定义风险控制的。 在我们日常生活中随时可见,小到账户登录验证码,都可以算是一种的手段。 这里我们着重了解下信贷下的,结合了场景的,则赋予了更多的意义。 信贷的目标是「利益最大化」,而不是没有风险,在风险和利润之间找到平衡,是信贷的核心。 ,以及在信贷场景下的如何实现,的目标永远是降风险,但不是一味地降,在不同场景下有不同的考虑。 文章例子参考《智能平台:架构、设计与实现》

    2.8K21编辑于 2022-12-20
  • 如何利用云计算技术优化金融体系

    引言 在金融行业中,风险控制()是核心环节之一,它直接关系到金融机构的稳健运营和可持续发展。随着云计算技术的快速发展,越来越多的金融机构开始采用云服务来提升能力。 本文将探讨如何利用云计算技术优化金融体系。 云计算在金融中的优势 1. 弹性和可扩展性 云服务的弹性和可扩展性使得金融机构可以根据业务需求快速调整资源,无论是应对市场波动还是业务增长,都能保持系统的高效运行。 3. 机器学习 通过部署机器学习模型,金融机构可以预测市场趋势和客户行为,提前预警风险,做出更精准的决策。 3. 结语 金融是金融机构的生命线,云计算技术的应用为金融带来了新的机遇。我们鼓励金融机构拥抱云计算,利用其强大的数据处理、弹性伸缩、成本效益和安全性优势,构建更加智能、高效的体系

    42010编辑于 2025-07-29
  • 构建AI驱动的全链路流量与零信任办公防护体系

    部署云端业务引擎与一体化终端管架构 针对内外流量与终端风险,腾讯云依托底层数据与AI能力,提供双引擎驱动的安全架构: 1. 企业微信原生协同: 实施基于企微身份的可信鉴权体系,支持PC端扫码一键登录与移动端无感免装访问。 AI辅助运营与DLP防泄密: 引入AI助手对EDR威胁事件进行结构化深度分析;基于自然语言处理(NLP)实现敏感数据智能聚类与分级分类,精准管浏览器上传/粘贴敏感信息及源代码外发行为。 锁定毫秒级决策与千万级营销资金止损 基于业务系统实际运行反馈,该架构在响应速度与投资回报率(ROI)上展现出量化的业务价值: 决策延迟(Latency): RCEAPI基于亿级数据毫秒级查询,实现约 拦截多行业高频欺诈与终端合规治理实录 安全能力已在多个复杂业务场景中完成实网对抗与价值验证: 国内Top2在线旅行平台: 针对“APP注册新人礼”等促活场景,接入天御引擎实时判断用户风险。

    27110编辑于 2026-04-24
  • 来自专栏SAMshare

    ML | 建模的WOE与IV

    ML」系列文章,主要是分享一下自己多年以来做金融的一些事一些情,当然也包括建模、机器学习、大数据等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步! 第一次接触这两个名词是在做模型的时候,老师教我们可以用IV去做变量筛选,IV(Information Value),中文名是信息值,简单来说这个指标的作用就是来衡量变量的预测能力强弱的,然后IV又是 Blank')[labels == 0] value_list = set(data_bad.unique()) | set(data_good.unique()) value_list Step3

    4.7K20发布于 2021-11-30
  • 来自专栏全栈程序员必看

    信贷模型搭建及核心模式分类

    3.大数据模式 大数据模式是指通过对海量的、多样化的、实时的、有价值的数据进行采集、整理、分析和挖掘,并运用大数据技术重新设计征信评价模型算法,多维度刻画信用主体的“画像”,向信息使用者呈现信用主体的违约率和信用状况 2.评分卡的意义 在互联网金融体系中,量化分析需要贯穿始终,评分卡模型是其中非常重要的一环。 3.评分卡的开发应用 在互联网金融评分卡开发过程中,我们仔细研究了企业操作流程,反复推敲了模型构建步骤,最后我们认为从业务应用角度,评分卡开发应用应遵循: 业务定义➡️风险定义 ➡️风险分解➡️ 所以说,模型的计算策略和机制在一个公司属于绝密,规则除了核心的员工,其他人是不能知道规则的。 四、的核心 如果说金融产品的核心是,那么的核心是什么? 3.调整指标分数,给出评分 在模型建立的后期,我们必须要输入个人信息进行模型的测试,前面我们建立每个指标的评分规则,但是我们并不知道这些规则是否真的适用于市场。

    4K11编辑于 2022-08-14
  • 来自专栏深度学习与python

    融合知识的大模型体系建设与应用实践

    天御的大模型智能体系 天御的基本观点是:大模型本质是一种方法论,复杂多样的模型结构只是实现载体。只要能够充分利用垂直场景知识完成训练,即可构成面向该场景的大模型。 在正式介绍金融大模型之前,先作一项澄清:大众语境中的“大模型”多指通识层面的生成式 AI 模型,而此处的“大模型”并非同类。 在整体体系上,天御的智能以自研大模型与“混元”大模型基座为基础,结合数据—模型—应用各阶段特点进行差异化应用,例如数据挖掘阶段:利用大模型进行底层特征挖掘与数据分析;在应用阶段:支持如智能投顾、 在模型层面,我们也在探索更契合体制的、更强大的模型架构,期待在任务中出现类似生成式 AI 的“知识涌现”,从而带来能力的台阶式提升。 对于生成式 AI,我们抱有明确期待:一方面通过更强的技术路线缓解“幻觉”问题并提升决策精确性,另一方面在工程上逐步构建面向智能体的 MCP 协议。

    1.2K10编辑于 2025-11-26
  • 来自专栏数据猿

    金融科技&大数据产品推荐: 数美金融—构建立体的全业务流程体系

    数美依托强大的AI技术与海量基础数据,为金融机构提供覆盖全业务流程的完整风解决方案。 微信公众号ID | datayuancn 本产品为数据猿推出的“金融科技价值—数据驱动金融商业裂变”大型主题策划活动第一部分的文章/案例/产品征集部分;感谢 数美 的产品投递 1、产品名称 数美全业务流程体系 2、所属分类 金融科技 · 、反欺诈 3、产品介绍 数美依托强大的AI技术与海量基础数据,为金融机构提供覆盖全业务流程的完整风解决方案。 作为反欺诈领域专业品牌,数美经过2年的实践与积累,构建了立体的全业务流程体系,可有效帮助金融机构进行反欺诈与3) 短通通 贷款申请环节中,在用户授权的情况下,短通通产品会获取设备的短信、通讯录、通话记录。对其进行自动的分析挖掘,补充数据维度。

    3.7K30发布于 2018-04-24
  • 来自专栏数据猿

    【案例】大型持牌消费金融公司——智能体系构建

    一方面由于客群下沉,可获得的用户信息愈发受限,数据质量参差不齐,传统经验无法直接应用,急需利用先进技术来提升能力; 另一方面互联网金融往往小额量大,基于人工的成本过高,用自动化的数据智能体系来提升整个流程的效率也是必然的发展趋势 因此,如何在线上信用贷场景搭建一整套从数据到算法到平台的数据架构体系,并在反欺诈和授信业务中得到具体的落地应用是本次案例的最终目标。 事实上,由于数据的不同,这相当于重构一套与传统体系并行的数据架构体系。 在这过程中,如何将海量稀疏、超高维、低饱和的大数据与风险挂钩?如何挖掘非结构化数据价值时穷尽风险? 实施过程/解决方案 上述三个方面的挑战贯穿的各条业务线,此次案例的解决方案着眼于核心的反欺诈和授信两个阶段来阐述如何解决这几个问题,并构建一整套完整的申请贷前体系。 这远远超出传统基于评分卡体系的建模能力范围。

    2.1K81发布于 2018-04-24
  • 来自专栏SAMshare

    ML | 建模中怎么做拒绝推断

    建模中的样本偏差与拒绝推断》https://zhuanlan.zhihu.com/p/88624987 不过我也还是把他文章里的分类体系在这里重点再次分享一下。 其中,数据法中提到的3种方式都是比较好理解的。 cutoff一般按照业务经验来设置,就是拒绝样本中被赋予通过的样本,其badrate水平,是正常放款样本中的badrate水平的2~4倍; 4、根据步骤3设置的cutoff,高于这个阈值的赋予good标签 06 总结一下 本文算是一个对拒绝推断的入门介绍了,让初涉模型的同学有一个相对来说比较清晰的全局认识,这里面涉及到的很多算法模型上的细节并没有展开来讲,因为我觉得这也会让阅读带来比较大的负担,公众号的文章还是要控制在几分钟内读完比较合适 Reference [1] 异常检测算法分类及经典模型概览 https://blog.csdn.net/cyan_soul/article/details/101702066 [2] 建模中的样本偏差与拒绝推断

    3K30编辑于 2022-11-14
  • 来自专栏用户3246163的专栏

    1.1 原则

    提高业务绩效 04.3 描述一个CRO的角色和职责,评估CRO如何和其他高管协作 CRO职责 1.对公司面临的所有风险负责 2.开发和实现ERM策略 工作范围: 1.设置公司全局风险偏好 2.度量和量化风险 3. 设置风险限制 4.开发风险系统 关键技能: 1.领导力 2.说服力 3.有能力保护公司资产 4.理解所有风险的技术技能 5.教育board和业务条线的顾问技能 和其他高管合作: 汇报给CEO/CFO,还有和 不可以故意的歪曲报道 不可以从事任何不诚实 不可以从事任何危害GARP和FRM的事情 注意文化不同,出现冲突应该应用最高标准 2 利益冲突 任何情况下保持公平,公开所有冲突 全面和公平的公开所有问题 3

    3.2K60发布于 2018-09-14
  • 来自专栏全栈程序员必看

    支付模型

    二、基于规则的 规则是最常用的,也是相对来说比较容易上手的模型。从现实情况中总结出一些经验,结合名单数据,制定规则,简单,有效。 常见的规则有: 1. 3. 业务规则 和特定各业务相关的一些规则,比如: 同一个人绑定银行卡张数超过10张。 同一张银行卡被超过5个人绑定。 同一个手机号被5个人绑定。 互联网金融离不开机器学习,特别是支付。 在各种支付模型中,决策树模式是相对比较简单易用的模型。 如下的决策树模型,我们根据已有的数据,分析数据特征,构建出一颗决策树。 这个过程,将在下一篇的架构中介绍。 五、模型评估 本质上是对交易记录的一个分类,所以对模型的评估,除了性能外,还需要评估“查全率”和“查准率”。 支付场景分析 ; 支付数据仓库建设 ; 支付模型和流程分析(本文); 支付系统架构 发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn

    4.2K22编辑于 2022-08-11
  • 来自专栏SAMshare

    ML | 中的异常检测原理与应用

    今天来介绍一下中的异常检测,从最基础的概念开始讲起,因为本人对这块的内容平时工作也做得不多,更多滴偏向于“纸上谈兵”,有什么说得不对的地方,也欢迎各位朋友指正~谢谢。 异常检测的概念 02 异常检测的难点 03 异常检测的分类及常见算法 01 异常检测的概念 异常检测(Anomaly Detection 或 Outlier Detection),又称为离群点检测,在我们领域很多地方都会用到 3.集合异常:某一堆的数据集合,整体表现异常,但看单个个体又没那么异常的,比如说地方性团伙骗贷。 好了,讲完了异常点的分类,来讲一下异常检测算法的分类吧。 0301 基于统计检验与分布算法 说起异常点检测,最容易想到的就是这个正态分布图了,3倍方差之外的数据属于异常数据。 利用时间序列分解算法(STL、STAMP、X12-ARIMA)将时间序列分成3条拟合曲线:Trend(趋势)、Seasonal(周期)和Residual(残差)。

    4.4K20编辑于 2022-04-12
  • 来自专栏数据猿

    【案例】某城商银行——消费金融大数据智能体系应用

    数据猿导读 项目以“内外部大数据的应用”、“实时风技术的落地”、“智能化体系 的搭建”和“云化系统的探索”为基础,与客户一同形成一套整体化的新型大数据智能解决体系,项目落地后取得了较好的效果 本项目以“内外部大数据的应用”、“实时风技术的落地”、“智能化体系的搭建”和“云化系统的探索”为基础,与客户一同形成一套整体化的新型大数据智能解决体系,项目落地后取得了较好的效果。 任务/目标 银行现有体系面临数据应用范围扩展、决策效率不匹配场景需求,本项目旨在达成如下目标: 1)探索非金融体系数据的应用:现有体系基于央行征信报告设计,内部数据集成项目正在进行过程中,时间不可匹配业务 ,外部数据(征信数据除外)尚未有接入经验; 2)提升决策效率:传统系统单笔订单审批时间超过半小时,但消费金融场景客户填写资料后就在现场等,需要做到“实时”或“准实时”放贷; 3)尝试体系自动化优化 :需要针对消费金融场景独立构建分析体系体系自优化等内容; 4)探索系统的云模式:以消费金融业务为试点,探索系统云化的可能性。

    3.6K41发布于 2018-04-19
  • 来自专栏算法进阶

    3句话总结信贷的特征

    信贷是数据挖掘算法最成功的业务场景,简单来说就是判断一个人的还款能力及还款意愿,并以此为信任依据提高金融业务效率。 业界通常的做法是基于挖掘多维度的特征建立一套规则及模型,一个好的特征,对于模型和规则都是至关重要的,验证中经常可以发现,如果踢掉某类特征模型也就废了。 本文就梳理总结下信贷常用的特征,可以总结到以下3句话: 1、信贷历史类: 信贷交易次数及额度、查询征信次数、信贷历史长度、新开信贷账户数、额度使用率、逾期次数及额度、信贷产品类型、被追偿信息。 (信贷交易类的特征重要程度往往是最高的,少了这部分历史还款能力及意愿的信息,模型通常直接就废了。) 3、公共负面记录类: 如破产负债、民事判决、行政处罚、法院强制执行、涉赌涉诈黑名单等 (这类特征通常缺失度比较高,对模型贡献一般,更多的是从还款意愿、欺诈维度的考虑)

    79610编辑于 2022-06-02
  • 来自专栏SAMshare

    ML | 建模老司机的几点思考与总结

    ML」系列文章,主要是分享一下自己多年以来做金融的一些事一些情,当然也包括建模、机器学习、大数据等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步! 一个机器学习模型的开发周期一般可以分为: 1、业务需求挖掘(Business insight) 2、数据搜集处理(Data Curation) 3、模型训练开发(Modeling) 4、部署及测试上线( 而在开始搜集数据前,需要了解几点内容: 1、模型应用节点 2、时效性要求 2、有没有预算,预算有多少 3、项目紧急程度 模型应用节点 模型的应用节点,决定了你有哪些变量是不可以用的,避免说出现“事后变量 具体可以参考我先前的一篇文章内容《分享8点超级有用的Python编程建议》 搞到数据后,需要做的事情大概可以分为: 1、消化所有的数据含义、逻辑; 2、对数据进行各种清洗,变成你熟悉的结构; 3、对数据进行质量控制 3、对于模型算法的选择,如果不知道选啥,可以都试试看看效果最直接。

    2.2K30发布于 2021-11-30
  • 来自专栏SAMshare

    ML | 建模中GBDT和XGBoost怎么调优

    00 Index 01 GBDT和XGBoost的原理介绍 02 GBDT和XGBoost的异同点分析 03 什么建模场景下常用这两个明星算法? 03 什么建模场景下常用这两个明星算法? 交易反欺诈:A级出场率,主要是支付,防止客户进行薅羊毛、套现等行为。 客户流失:A级出场率。 贷后 催收告警:A级出场率。 迁徙率预测:B级出场率。 失联修复:C级出场率。 而关于模型怎么调优,我会在下一节一起讲。 模型怎么调优 关于模型的调优,先前有篇文章讲得比较细致《ML[7] | 模型调优的思路有哪些》,大家可以移步去回顾一下。

    2.6K30编辑于 2022-11-14
  • AI智能审计系统,企业的“超级大脑”

    AI审计系统利用自然语言处理(NLP)技术,能像人一样“阅读”和理解海量的合同、邮件、公告、新闻,甚至聊天记录。 风险的“预言家”这是AI审计最核心的价值。它不只是“找茬”,更是“预警”。 通过机器学习,AI系统可以学习企业历史上所有的风险案例和违规行为,构建出复杂的风险预测模型。 三个驱动力,让AI审计从“概念”走向“刚需”: 数据够多了: 企业数字化转型,产生了海量数据,为AI提供了充足的“燃料”。 AI智能审计系统,不仅仅是一个产品,更是一个充满挑战和机遇的技术新大陆。 总而言之,AI智能审计系统,正在将审计师从“账房先生”升级为“风险策略师”,将企业的风险管理从“被动防御”升级为“主动智能”。

    67710编辑于 2025-10-11
  • 来自专栏沃趣科技

    为本创新驱动,券商如何实现智能加速?

    合规始终是公司的首要核心竞争力,该券商不断推进全面风险管理体系建设,需要全方位提升主动合规控管理能力,进而提升风险管理精细化、智能化水平。 而由于合规处于企业核心竞争力的高度,原数据积累10年,数据量已超30TB。 非现场平台各项报表和查询生成时间逐渐拉长。夜间批量任务越来越慢,部分任务出现超时失败现象。 02 原合规数据库数据量巨大,原有的传统的备份手段难以实现数据的实时保护。 价值提升 1 通过QData数据库云平台大幅提升了系统的业务效率,日终调度业务从原十几个小时缩短至1.5小时,性能提升10倍以上。 3 通过沃趣科技提供的专业的架构规划方案和完善的服务支撑,大大降低了数据中心的运维成本及风险,支持该券商在数据驱动和科技金融的创新上持续前行。

    2.1K10发布于 2021-10-12
领券