首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏大数据架构师成长之路

    数据体系-简介

    早期传统金融的主要利用了信用属性强大的金融数据,一般采用20个维度左右的数据,利用评分来识别客户的还款能力和还款意愿。 结合中国互联网发展,以及目前的征信监管要求,对可用数据及可用类数据做一个全面的梳理。 2.数据来源 2.1 数据应用逻辑 常见流程中,客户准入时提供的资信材料有限,业务机构数据体量不足,仅仅根据内部风险数据进行风险评估会非常片面,无法全面的把某位客户的风险情况,所以通常需要依赖于第三方供应商提供数据作风支撑 未来百行能不能有效被使用上还有待观察,但人员可先了解其相关的资料。百行征信涉及的模块,主要包括以下方面: 报告相关数据:报告时间;查询原因;查询结果等。 4.2 明确需求 建议:回顾第二节数据应用逻辑关于业务类型、风险类型、流程、风险画像等的介绍。

    6.5K67发布于 2020-06-29
  • 来自专栏SAMshare

    ML | 建模的KS

    我们这做模型的时候,经常是会用KS值来衡量模型的效果,这个指标也是很多领导会直接关注的指标。今天写一篇文章来全面地剖析一下这个指标,了解当中的原理以及实现,因为这些知识是必备的基本功。 不过这不影响我们去使用它,我们只需要知道在中是怎么实现的,并且在实际场景中怎么去使用它就可以了。就如上面我们说的,KS在主要是用于评估模型的好坏样本区分度高低的。什么是区分度? 可以看下图: 从业务上来说,就是越往后的箱子,客户的质量越差,rate整体上呈现单调性,从而可以把大多数的坏人,直接从箱的维度上就可以区分开来了,在后续的策略使用体验上十分友好。 02 KS的生成逻辑 KS的生成逻辑公式也是十分简单: 好样本累计占比坏样本累计占比 在领域,我们在计算KS前一般会根据我们认为的“正态分布原则”进行分箱,一般来说分成了10份,然后再进行KS的计算 03 KS的效果应用 KS的值域在0-1之间,一般来说KS是越大越有区分度的,但在领域并不是越大越好,到底KS值与模型可用性的关系如何,可看下表: 004 KS的实现 首先我们来对上面展示的例子进行

    6.1K31编辑于 2022-02-25
  • 来自专栏LieBrother

    何为

    定义 是风险控制的简称,在百度百科中是这么定义风险控制的。 在我们日常生活中随时可见,小到账户登录验证码,都可以算是一种的手段。 这里我们着重了解下信贷下的,结合了场景的,则赋予了更多的意义。 信贷的目标是「利益最大化」,而不是没有风险,在风险和利润之间找到平衡,是信贷的核心。 ,以及在信贷场景下的如何实现,的目标永远是降风险,但不是一味地降,在不同场景下有不同的考虑。 文章例子参考《智能平台:架构、设计与实现》

    2.8K21编辑于 2022-12-20
  • 如何利用云计算技术优化金融体系

    引言 在金融行业中,风险控制()是核心环节之一,它直接关系到金融机构的稳健运营和可持续发展。随着云计算技术的快速发展,越来越多的金融机构开始采用云服务来提升能力。 本文将探讨如何利用云计算技术优化金融体系。 云计算在金融中的优势 1. 2. 弹性和可扩展性 云服务的弹性和可扩展性使得金融机构可以根据业务需求快速调整资源,无论是应对市场波动还是业务增长,都能保持系统的高效运行。 3. 云计算技术在金融中的应用 1. 大数据分析 利用云计算平台的大数据处理能力,金融机构可以对交易数据、客户数据等进行深入分析,识别潜在的风险模式。 2. 结语 金融是金融机构的生命线,云计算技术的应用为金融带来了新的机遇。我们鼓励金融机构拥抱云计算,利用其强大的数据处理、弹性伸缩、成本效益和安全性优势,构建更加智能、高效的体系

    42010编辑于 2025-07-29
  • 构建AI驱动的全链路流量与零信任办公防护体系

    部署云端业务引擎与一体化终端管架构 针对内外流量与终端风险,腾讯云依托底层数据与AI能力,提供双引擎驱动的安全架构: 1. 企业微信原生协同: 实施基于企微身份的可信鉴权体系,支持PC端扫码一键登录与移动端无感免装访问。 AI辅助运营与DLP防泄密: 引入AI助手对EDR威胁事件进行结构化深度分析;基于自然语言处理(NLP)实现敏感数据智能聚类与分级分类,精准管浏览器上传/粘贴敏感信息及源代码外发行为。 锁定毫秒级决策与千万级营销资金止损 基于业务系统实际运行反馈,该架构在响应速度与投资回报率(ROI)上展现出量化的业务价值: 决策延迟(Latency): RCEAPI基于亿级数据毫秒级查询,实现约 拦截多行业高频欺诈与终端合规治理实录 安全能力已在多个复杂业务场景中完成实网对抗与价值验证: 国内Top2在线旅行平台: 针对“APP注册新人礼”等促活场景,接入天御引擎实时判断用户风险。

    26910编辑于 2026-04-24
  • 来自专栏SAMshare

    ML | 建模的WOE与IV

    ML」系列文章,主要是分享一下自己多年以来做金融的一些事一些情,当然也包括建模、机器学习、大数据等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步! 第一次接触这两个名词是在做模型的时候,老师教我们可以用IV去做变量筛选,IV(Information Value),中文名是信息值,简单来说这个指标的作用就是来衡量变量的预测能力强弱的,然后IV又是 data_good == value) / len_good iv += (good_rate - bad_rate) * math.log(good_rate / bad_rate,2) 2)注意分组后是否出现某组内的响应(未响应)数量为零的情况,如果为零需要处理一下。 ...], 'col2':[value1,value2,...], ...} ----------------------------------------------------------

    4.7K20发布于 2021-11-30
  • 来自专栏全栈程序员必看

    信贷模型搭建及核心模式分类

    2.评分卡的意义 在互联网金融体系中,量化分析需要贯穿始终,评分卡模型是其中非常重要的一环。 直到我们和某P2P公司的经理实际交流后才明白这其中的含义。在传统银行信用卡业务中,是很喜欢这类少量逾期的客户的,因为他们能给银行创造罚息,但是又不是恶意违约那种客户。 另外,模型在不同的阶段体现的方式和功能也不一样。 从资金的角度来看,模型是为了评估用户还款能力和还款意愿,反欺诈反作弊,防止用户薅羊毛和保证平台安全等功能;从行业的角度,互联网模型体现在消费金融/供应链金融/信用借贷/P2P/大数据征信等方面。 所以说,模型的计算策略和机制在一个公司属于绝密,规则除了核心的员工,其他人是不能知道规则的。 四、的核心 如果说金融产品的核心是,那么的核心是什么?

    4K11编辑于 2022-08-14
  • 来自专栏深度学习与python

    融合知识的大模型体系建设与应用实践

    天御的大模型智能体系 天御的基本观点是:大模型本质是一种方法论,复杂多样的模型结构只是实现载体。只要能够充分利用垂直场景知识完成训练,即可构成面向该场景的大模型。 在正式介绍金融大模型之前,先作一项澄清:大众语境中的“大模型”多指通识层面的生成式 AI 模型,而此处的“大模型”并非同类。 在整体体系上,天御的智能以自研大模型与“混元”大模型基座为基础,结合数据—模型—应用各阶段特点进行差异化应用,例如数据挖掘阶段:利用大模型进行底层特征挖掘与数据分析;在应用阶段:支持如智能投顾、 在模型层面,我们也在探索更契合体制的、更强大的模型架构,期待在任务中出现类似生成式 AI 的“知识涌现”,从而带来能力的台阶式提升。 对于生成式 AI,我们抱有明确期待:一方面通过更强的技术路线缓解“幻觉”问题并提升决策精确性,另一方面在工程上逐步构建面向智能体的 MCP 协议。

    1.2K10编辑于 2025-11-26
  • 来自专栏数据猿

    金融科技&大数据产品推荐: 数美金融—构建立体的全业务流程体系

    数美依托强大的AI技术与海量基础数据,为金融机构提供覆盖全业务流程的完整风解决方案。 2、所属分类 金融科技 · 、反欺诈 3、产品介绍 数美依托强大的AI技术与海量基础数据,为金融机构提供覆盖全业务流程的完整风解决方案。 作为反欺诈领域专业品牌,数美经过2年的实践与积累,构建了立体的全业务流程体系,可有效帮助金融机构进行反欺诈与2) 信贷云 贷款人提交申请后,信贷云将首先对其进行可信度分级,对于高可信度的用户,可以使用更宽松的策略甚至直接通过审核。 2) 助力金融企业服务,促进普惠金融发展 数美一直专注于大数据反欺诈领域的技术创新,通过多种反欺诈技术识别欺诈风险,借助多维度数据识别信用风险,利用多重的策略模型提升效果,进而打造立体的防御体系,为金融客户提供持续

    3.7K30发布于 2018-04-24
  • 来自专栏数据猿

    【案例】大型持牌消费金融公司——智能体系构建

    周期/节奏 项目于16年10月开始,17年2月结束。 客户名称/所属分类 大型持牌消费金融公司· 任务/目标 由于新金融业务的迅速普惠化,金融客户也面临着崭新的挑战和需求。 一方面由于客群下沉,可获得的用户信息愈发受限,数据质量参差不齐,传统经验无法直接应用,急需利用先进技术来提升能力; 另一方面互联网金融往往小额量大,基于人工的成本过高,用自动化的数据智能体系来提升整个流程的效率也是必然的发展趋势 事实上,由于数据的不同,这相当于重构一套与传统体系并行的数据架构体系。 在这过程中,如何将海量稀疏、超高维、低饱和的大数据与风险挂钩?如何挖掘非结构化数据价值时穷尽风险? 实施过程/解决方案 上述三个方面的挑战贯穿的各条业务线,此次案例的解决方案着眼于核心的反欺诈和授信两个阶段来阐述如何解决这几个问题,并构建一整套完整的申请贷前体系。 这远远超出传统基于评分卡体系的建模能力范围。

    2.1K81发布于 2018-04-24
  • 来自专栏用户3246163的专栏

    1.1 原则

    business process 价值有: 提高组织效率 更好的风险汇报 提高业务绩效 04.3 描述一个CRO的角色和职责,评估CRO如何和其他高管协作 CRO职责 1.对公司面临的所有风险负责 2. 开发和实现ERM策略 工作范围: 1.设置公司全局风险偏好 2.度量和量化风险 3.设置风险限制 4.开发风险系统 关键技能: 1.领导力 2.说服力 3.有能力保护公司资产 4.理解所有风险的技术技能 采取有理由的防范保证会员服务不用在不合适,欺骗性,违法目的 不可以故意的歪曲报道 不可以从事任何不诚实 不可以从事任何危害GARP和FRM的事情 注意文化不同,出现冲突应该应用最高标准 2 利益冲突 任何情况下保持公平

    3.2K60发布于 2018-09-14
  • 来自专栏全栈程序员必看

    支付模型

    二、基于规则的 规则是最常用的,也是相对来说比较容易上手的模型。从现实情况中总结出一些经验,结合名单数据,制定规则,简单,有效。 常见的规则有: 1. 2. 操作规则 对支付、提现、充值的频率按照用户账号、IP、设备等进行限制,一旦超出阈值,则提升等级。 频率需综合考虑(五)分钟、(一)小时、(一)天、(一)周等维度的数据。 比如2分钟前在中国支付的,2分钟后跑到美国去支付了。 5. 拦截历史规则 用户在某个业务上的消费行为被网关多次拦截。 规则引擎优点: 性能高: 对订单按照规则进行匹配,输出结果。 这个过程,将在下一篇的架构中介绍。 五、模型评估 本质上是对交易记录的一个分类,所以对模型的评估,除了性能外,还需要评估“查全率”和“查准率”。 支付场景分析 ; 支付数据仓库建设 ; 支付模型和流程分析(本文); 支付系统架构 发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn

    4.2K22编辑于 2022-08-11
  • 来自专栏SAMshare

    ML | 建模中怎么做拒绝推断

    建模中的样本偏差与拒绝推断》https://zhuanlan.zhihu.com/p/88624987 不过我也还是把他文章里的分类体系在这里重点再次分享一下。 展开法的实施步骤主要是: 1、拿到贷后的样本,按照一定的好坏样本定义规则打上Y值,接着就是常规操作,得到 评分卡模型A; 2、拿着评分卡模型A,去对全量样本(包含拒绝的)进行打分,得到每个样本的模型分P cutoff一般按照业务经验来设置,就是拒绝样本中被赋予通过的样本,其badrate水平,是正常放款样本中的badrate水平的2~4倍; 4、根据步骤3设置的cutoff,高于这个阈值的赋予good标签 06 总结一下 本文算是一个对拒绝推断的入门介绍了,让初涉模型的同学有一个相对来说比较清晰的全局认识,这里面涉及到的很多算法模型上的细节并没有展开来讲,因为我觉得这也会让阅读带来比较大的负担,公众号的文章还是要控制在几分钟内读完比较合适 Reference [1] 异常检测算法分类及经典模型概览 https://blog.csdn.net/cyan_soul/article/details/101702066 [2] 建模中的样本偏差与拒绝推断

    3K30编辑于 2022-11-14
  • 来自专栏SAMshare

    ML | 中的异常检测原理与应用

    今天来介绍一下中的异常检测,从最基础的概念开始讲起,因为本人对这块的内容平时工作也做得不多,更多滴偏向于“纸上谈兵”,有什么说得不对的地方,也欢迎各位朋友指正~谢谢。 异常检测的概念 02 异常检测的难点 03 异常检测的分类及常见算法 01 异常检测的概念 异常检测(Anomaly Detection 或 Outlier Detection),又称为离群点检测,在我们领域很多地方都会用到 主要有几个原因: 1)异常点和噪声会混杂在一起,机器难以具体识别开来; 2)现实中很少有异常点的标签,因为标签越多也就意味着遇到过的异常越多,也不符合常识认知; 3)对于标签的定义也是很难,比如1个金融场景 2.上下文异常:一般在时间序列中表现,某个时间点的指标相对前后时间段有较大波动的。比如某个中午交易量异常。 2、半监督DAD:半监督DAD假设所有的训练样本只有一个标签,即正样本,训练过程学习到正样本的界限,测试时,不属于正样本边界内的就划为异常。

    4.4K20编辑于 2022-04-12
  • 来自专栏数据猿

    【案例】某城商银行——消费金融大数据智能体系应用

    数据猿导读 项目以“内外部大数据的应用”、“实时风技术的落地”、“智能化体系 的搭建”和“云化系统的探索”为基础,与客户一同形成一套整体化的新型大数据智能解决体系,项目落地后取得了较好的效果 本项目以“内外部大数据的应用”、“实时风技术的落地”、“智能化体系的搭建”和“云化系统的探索”为基础,与客户一同形成一套整体化的新型大数据智能解决体系,项目落地后取得了较好的效果。 任务/目标 银行现有体系面临数据应用范围扩展、决策效率不匹配场景需求,本项目旨在达成如下目标: 1)探索非金融体系数据的应用:现有体系基于央行征信报告设计,内部数据集成项目正在进行过程中,时间不可匹配业务 ,外部数据(征信数据除外)尚未有接入经验; 2)提升决策效率:传统系统单笔订单审批时间超过半小时,但消费金融场景客户填写资料后就在现场等,需要做到“实时”或“准实时”放贷; 3)尝试体系自动化优化 :需要针对消费金融场景独立构建分析体系体系自优化等内容; 4)探索系统的云模式:以消费金融业务为试点,探索系统云化的可能性。

    3.6K41发布于 2018-04-19
  • 来自专栏SAMshare

    ML | 建模老司机的几点思考与总结

    ML」系列文章,主要是分享一下自己多年以来做金融的一些事一些情,当然也包括建模、机器学习、大数据等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步! 一个机器学习模型的开发周期一般可以分为: 1、业务需求挖掘(Business insight) 2、数据搜集处理(Data Curation) 3、模型训练开发(Modeling) 4、部署及测试上线( 而在开始搜集数据前,需要了解几点内容: 1、模型应用节点 2、时效性要求 2、有没有预算,预算有多少 3、项目紧急程度 模型应用节点 模型的应用节点,决定了你有哪些变量是不可以用的,避免说出现“事后变量 具体可以参考我先前的一篇文章内容《分享8点超级有用的Python编程建议》 搞到数据后,需要做的事情大概可以分为: 1、消化所有的数据含义、逻辑; 2、对数据进行各种清洗,变成你熟悉的结构; 3、对数据进行质量控制 最好还是通过自己总结多方特征筛选的方法,写一套自己的方法,方便自己调用; 2、如果是使用传统机器学习算法,如rf、gbdt、xgb等,建议变量个数不要太多,50个以内差不多了。

    2.2K30发布于 2021-11-30
  • 来自专栏SAMshare

    ML | 建模中GBDT和XGBoost怎么调优

    00 Index 01 GBDT和XGBoost的原理介绍 02 GBDT和XGBoost的异同点分析 03 什么建模场景下常用这两个明星算法? 03 什么建模场景下常用这两个明星算法? 交易反欺诈:A级出场率,主要是支付,防止客户进行薅羊毛、套现等行为。 客户流失:A级出场率。 贷后 催收告警:A级出场率。 迁徙率预测:B级出场率。 失联修复:C级出场率。 {‘auto’, ‘sqrt’, ‘log2’}, int or float, default=None。如果不填的话,默认就是用所有的特征。 ... 而关于模型怎么调优,我会在下一节一起讲。 模型怎么调优 关于模型的调优,先前有篇文章讲得比较细致《ML[7] | 模型调优的思路有哪些》,大家可以移步去回顾一下。

    2.6K30编辑于 2022-11-14
  • AI智能审计系统,企业的“超级大脑”

    AI审计系统利用自然语言处理(NLP)技术,能像人一样“阅读”和理解海量的合同、邮件、公告、新闻,甚至聊天记录。 风险的“预言家”这是AI审计最核心的价值。它不只是“找茬”,更是“预警”。 通过机器学习,AI系统可以学习企业历史上所有的风险案例和违规行为,构建出复杂的风险预测模型。 三个驱动力,让AI审计从“概念”走向“刚需”: 数据够多了: 企业数字化转型,产生了海量数据,为AI提供了充足的“燃料”。 AI智能审计系统,不仅仅是一个产品,更是一个充满挑战和机遇的技术新大陆。 总而言之,AI智能审计系统,正在将审计师从“账房先生”升级为“风险策略师”,将企业的风险管理从“被动防御”升级为“主动智能”。

    67710编辑于 2025-10-11
  • 来自专栏沃趣科技

    为本创新驱动,券商如何实现智能加速?

    合规始终是公司的首要核心竞争力,该券商不断推进全面风险管理体系建设,需要全方位提升主动合规控管理能力,进而提升风险管理精细化、智能化水平。 而由于合规处于企业核心竞争力的高度,原数据积累10年,数据量已超30TB。 非现场平台各项报表和查询生成时间逐渐拉长。夜间批量任务越来越慢,部分任务出现超时失败现象。 02 原合规数据库数据量巨大,原有的传统的备份手段难以实现数据的实时保护。 价值提升 1 通过QData数据库云平台大幅提升了系统的业务效率,日终调度业务从原十几个小时缩短至1.5小时,性能提升10倍以上。 2 通过多年的发展,基于沃趣QData Cloud云平台解决方案逐步拓展成数据库私有云应用场景,以Oracle为代表的数据库如:客户关系管理、、合规、自营交易等系统正在逐步迁移到数据库私有云平台。

    2.1K10发布于 2021-10-12
  • 来自专栏AI科技时讯

    领域特征工程

    在金融行业,风险控制()是核心环节,它关乎资产安全、合规性以及机构的长期稳健发展。随着大数据时代的到来,金融机构面临着前所未有的数据量和复杂性。 在这样的背景下,领域特征工程应运而生,成为连接原始数据与精准风险评估的桥梁。 特征工程,简而言之,是对数据的一种深度加工,它通过一系列技术手段,将原始数据转化为对风险预测有用的信息。 在领域,特征工程的核心目标是构建出能够准确反映个体或实体风险水平的特征集。 此外,良好的特征工程实践还能促进模型的解释性,为决策提供更加透明的依据。 随着技术的发展,特征工程的方法也在不断创新。 通过综合运用这些特征衍生方法,领域的特征工程能够更全面地挖掘数据潜力,为风险评估提供多维度的视角。

    2.2K11编辑于 2024-08-20
领券