首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 远大数据个人风险报告技术实现全解析

    关键词:个人风险报告, 大数据风控, 技术实现, Python, Vue.js, 系统架构, API接口, 远大数据一、引言:从数据孤岛到综合风险画像在数字化风控时代,单一维度的信用数据已无法满足精准决策的需求 现代大数据风控平台致力于解决这一痛点,其核心的个人风险报告,通过整合海量、多维度的合规数据,为用户提供一站式的风险洞察服务。 本文将以一份典型的报告数据结构为蓝本,深入剖析其技术生命周期,看这类系统是如何实现其强大功能的。二、数据基石:合规API接口与模块化聚合一份专业个人风险报告的价值,在于其丰富的数据维度。 这些数据通过调用一系列稳定、合规的API数据接口聚合而成。 实现引流:在发布的版本中,可以将文中的泛指(如"某风控平台")替换为自己的品牌名(如"远大数据"),并将首次出现的品牌关键词制作成一个指向官网产品页的锚文本链接。

    91800编辑于 2025-06-21
  • 远大数据 - 企业风险报告(专业版)API接口文档

    int", "message": "string", "transaction_id": "string", // 流水号 "data": "string"}data 字段为加密的数据 解密过程:解密时,首先从 Base64 解码后的数据中提取前 16 字节作为 IV。然后使用提取的 IV,通过 AES-CBC 模式解密剩余部分的密文。解密后去除 PKCS7 填充,即可得到原始明文。 注销信息参数名类型说明URLstring关联内容STK_PAWN_DATEstring注销日期STK_PAWN_RESstring注销原因2.1.2.29 抽查检查参数名类型说明ISP_TYPEstring数据类型 分涉案金额评分:根据金额等级加分(0-20分)重要字段说明:案件进展阶段:反映案件当前状态,是评估风险的重要依据涉案金额:反映案件的经济影响程度失信记录:反映企业的信用状况限高记录:反映企业的履约能力数据更新周期 :案件信息:每日更新失信记录:实时更新限高记录:实时更新风险评估:每日更新注意事项:部分案件信息可能因保密需要未被公开金额统计可能存在四舍五入的误差历史案件可能因数据迁移等原因缺失部分字段风险评估仅供参考

    27710编辑于 2025-08-23
  • 来自专栏云云众生s

    如何让平台团队实现远大目标

    第一部分:假如我是 CTO ,我会这样推动平台工程 第二部分:建立平台工程组织 第三部分:平台团队如何实现远大目标 第四部分:平台团队成功的箴言 第五部分:引导平台团队树立产品思维 第六部分:超越数字, 这三者都关联数据与企业价值。设立远大而可实现的目标需要在授权、一致和清晰之间取得平衡。在平台工程中,重点不仅在设置目标,还在确保目标带来有意义的变革。 指标:平均接入时间()。 KPI:每月接入团队数量。 3. 提升扩展性 目标:在未来 8 个月提升平台基础设施,在不增加延迟的情况下处理用户量增加一倍。 既然我们已经理解平台团队如何实现远大目标,让我们进入博客系列第四部分,探讨如何优先处理、专注和交付。

    27710编辑于 2024-03-28
  • 来自专栏生信技能树

    论号召大家宅家抗疫功效,Pornhub远大于R语言

    前面我在生信技能树旗下各大公众号平台号召过粉丝在家里看视频搞学习,分享了 华清大学、京北大学联合发现:#学习R语言之数据挖掘可抑制新型冠状病毒#,因为确实宅家是目前有效的防范冠状病毒的手段之一。 50万学习量的免费视频教程合辑 其中学习播放量最高的是R语言,早在生信分析人员如何系统入门R(2019更新版) 里面我给初学者整理了知识点路线图如下: 了解常量和变量概念 加减乘除等运算(计算器) 多种数据类型 (数值,字符,逻辑,因子) 多种数据结构(向量,矩阵,数组,数据框,列表) 文件读取和写出 简单统计可视化 无限量函数学习 而且我专门为R语言建立了 GitHub 仓库存放相关学习路线指导资料:https

    4K41发布于 2020-04-27
  • 翼云——挂载数据

    步骤 步骤还是十分简单的,就是日常的一些linux命令,不要忘记创建挂载点了哈,比如本文中的/scrm 创建分区 先查看数据盘是否挂载上来,挂载上来后直接创建分区就好,然后查看下是否创建完成。

    93110编辑于 2024-08-16
  • 来自专栏好奇心Log

    擎读取EC数据

    最近我们在试用擎,测试了从擎读取EC数据,请求数据的程序来自擎网站(见下图),数据传输的速度和稳定度都相当不错,尤其是可以按需求请求数据,避免了“一个馒头搭块糕”式的打包式下载数据对于时间和存储空间的极大浪费 请求江苏地区要素场时,数据基本秒出,感觉畅爽无比 ? ? 这里有必要提一点的是,我们的调用程序有时候会出现之前还可以顺利调用,最近却会报错的情况。 serviceNodeId=%s&" # 数据读取URL(基本路径) http://ip:port/music-ws/api?

    2.7K10发布于 2021-03-25
  • 来自专栏数据库相关

    使用kettle按抽取数据

    需求背景:    因xx需求要导出数据,研发给到一个A JOIN B JOIN C + dependent query 的复杂查询。直接查询的话,特别慢(可能小时级别都出不来结果)。 分析了下这个查询中,如果在where条件中拼上个驱动表的索引列(例如主键列或者create_time列之类), 可以将join的数据集控制在一个很小的范围内。 下面是用kettle 按去跑的案例, 为了演示做了很多精简。 1、生成一个按的序列(可以参考这个方法 http://blog.csdn.net/neweastsun/article/details/43866599) 2、将day传到查询sql中,得到某一个的数据集 3、将step2的数据集写到一个临时的表里面 4、重复执行step2、step3 5、最后将临时表的数据导出 job如下图: 注意的是,中文乱码的问题解决方法: 1、修改数据源的选项,加上字符集设置

    2.2K50编辑于 2022-09-23
  • 来自专栏好派笔记

    mysql查询今天、昨天、7、近30、本月数据

    mysql查询今天、昨天、7、近30、本月数据        今天 select * from 表名 where to_days(时间字段名)=to_days(now()); 昨天 SELECT * TO_DAYS(NOW()) – TO_DAYS(时间字段名) = 1; /*DATEDIFF(now() , FROM_UNIXTIME(`时间字段名`)) = 1; //时间字段 存储类型为时间戳*/ 7 INTERVAL 7 DAY) <= date(时间字段名); /*DATEDIFF(now() , FROM_UNIXTIME(`时间字段名`)) = 7; //时间字段 存储类型为时间戳*/ 近30

    2.4K20发布于 2021-11-02
  • 来自专栏程序猿DD

    被国人长期“霸榜”的 GitHub Trending 即将下架,噪音远大于价值!

    他们也不认同所谓 “使用率低” 的说法,而且 GitHub 官方也没有公开相关数据来支撑自己的决定。 Trending 进行引流的渠道: via Twitter Apache SkyWalking 创始人吴晟也发表了自己的看法,他认为无论 GitHub Trending 页面的使用率低或高,它产生的噪音远大于价值 这跟“爱国”没关系),所以出现了噪音远大于价值的现象。 那么您是否支持GitHub的这波操作呢?留言区说说你的看法吧!

    95520编辑于 2022-09-08
  • 来自专栏CSDN技术头条

    说实话,分布式系统的复杂度远大于它的好处

    要知道,它的复杂度远远大于它的好处。 (本翻译仅代表个人观点,有异议留言区见~) 为什么这么说呢? 分布式系统的优势有目共睹,稳定性强,能够解决高并发情况下的很多问题,保障业务顺利安全地进行。 基于 XA 协议的两阶段提交方案 交易中间件与数据库通过 XA 接口规范,使用两阶段提交来完成一个全局事务, XA 规范的基础是两阶段提交协议。 两阶段提交方案应用非常广泛,几乎所有商业 OLTP 数据库都支持 XA 协议。但是两阶段提交方案锁定资源时间长,对性能影响很大,基本不适合解决微服务事务问题。 TCC 方案让应用自己定义数据库操作的粒度,使得降低锁冲突、提高吞吐量成为可能。 当然 TCC 方案也有不足之处,集中表现在以下两个方面: 对应用的侵入性强。 基于消息的最终一致性方案 消息一致性方案是通过消息中间件保证上、下游应用数据操作的一致性。基本思路是将本地操作和发送消息放在一个事务中,保证本地操作和消息发送要么两者都成功或者都失败。

    1.8K21发布于 2018-07-30
  • 来自专栏数据挖掘学习

    数据挖掘第三数据结构)

    矩阵只允许一种数据类型,数据框的每一列只允许一种数据类型 一、数据框来源 (1)用代码新建 图片 (2)由已有数据转换或处理得到 (3)读取表格文件 (4)R语言内置数据 二、数据框取子集 用“$”符号 ,TRUE对应的行/列留下,FALSE对应的行/列丢掉 #筛选score > 0的行,筛选的是行,是score>0的行 df1$score #先筛选df1数据框里score这一列 [1] 5 3 gene change score 1 gene1 up 5 2 gene2 up 3 取数据框最后1列#数据框由N列,最后一列就是第N列 df1[,ncol(df1)] #最后一行用nrow代替 [1] 5 3 -2 -4, 数据框修改:取值+赋值 修改行名和列名,其实就是修改向量,要修改全部行名就给全部赋值,如果要改一个列名就给取子集赋值。 0.01 r2 gene2 up 3 0.02 r3 gene3 down -2 0.07 r4 gene4 down -4 0.05 两个数据框连接

    60920编辑于 2023-03-11
  • 来自专栏GEE数据专栏,GEE学习专栏,GEE错误集等专栏

    Google Earth Engine ——LANDSAT 7 TOA系列数据 832和年际数据

    校准系数从图像元数据中提取。关于TOA计算的细节,见Chander等人(2009)。 Landsat数据集是联邦创建的数据,因此属于公共领域,可以在没有版权限制的情况下使用、转让或复制。 对美国地质调查局作为数据来源的确认或信用,应通过包括一行文字引用来提供,如下面的例子。 (产品、图像、照片或数据集名称)由美国地质调查局提供。 例子。

    27310编辑于 2024-02-02
  • 来自专栏小林coding

    数据结构一速成

    绝大部分学校的数据结构课程应该是: ? 链表的基本单位是节点,每个节点拥有一个数据区和一个next指针,其中数据区用于存放数据,next指针指向下一个节点。 归并排序主要分为两步,第一步把大数据集分成N个小数据集,并使用任意一种内部排序法对每一个小数据集进行排序;第二步是每次将其中的K个已经有序的小数据集进行合并(称为K路归并)。 归并排序的平均复杂度是O(MNlogN),其中M为每个小数据集中数据的个数,N为小数据集的数量,log的底数为K。 基数排序则是最无聊的一种排序法。 链式存储的二叉树十分直接,每个节点包含一个数据区和两个孩子指针。数据区用于存储数据,孩子指针分别指向两个孩子,如果没有孩子就悬空。这一节的重难点其实在二叉树的线性存储,即将二叉树保存在顺序表中。

    65920发布于 2021-07-07
  • 来自专栏数据挖掘学习

    数据挖掘第二

    数据结构:向量、数据框、矩阵、列表 数据框约等于“表格”,数据框里的每一列只能同一种数据类型,单独拿出一列是向量,是为一个整体 一、向量的生成: 1、用c()逐一放到一起 > c(2,5,6,2,9) T) #####2.3.对两个向量进行的操作##### x = c(1,3,5,1) y = c(3,2,5,6) 重复的定义:从左往右数过去,第2次或多次出现的元素是重复 数据类型转换的优先顺序

    52040编辑于 2023-03-09
  • 来自专栏学习笔记ol

    数据结构-Java逆操作

    相同数据类型:线性表中的元素具有相同的数据类型,即它们具有相同的属性和操作。 线性表可以用多种方式来表示和实现,常见的实现方式包括顺序表和链表两种。 注意 线性表作为数据结构中的基本概念,广泛应用于各个领域的算法和程序设计中。掌握线性表的定义和实现方式, 能够帮助我们更好地理解和应用其他数据结构和算法。 线性表是一种常见的数据结构,它由一系列元素组成,这些元素之间存在着一对一的前后关系。线性表中的元 素可以是任何类型的数据,如整数、字符或对象等。 数组作为一种静态数据结构,需要提前声明一个固定大小 的空间来存储元素,操作灵活性较差。 总之,线性表是一种简单、常用的数据结构,能够有效地组织和处理大量的数据,广泛应用于各个领域的算法 与程序设计中。 代码实现 在Java中,我们可以使用数组或链表来实现线性表。

    29630编辑于 2023-10-11
  • 来自专栏CSDN

    Mysql 查询最近90数据

    Mysql 查询最近90数据 SELECT * FROM qs_study_user_credit_log WHERE is_valid=1 AND user_extend_id=1 AND create_time

    50710编辑于 2024-03-28
  • 来自专栏木东居士的专栏

    ​《七数据可视化之旅》第三数据图表的选择(中)

    《七数据可视化之旅》第三数据图表的选择(中) Destiny,某物流公司数据产品经理,目前从事数据平台搭建和可视化相关的工作。持续学习中,期望与大家多多交流数据相关的技术和实际应用,共同成长。 0x00 前言 数据图表的选择(上),分享了「时序数据」和「比例数据」的可视化图表方案。 不同的数据类型、不同的阐述目的,决定了数据可视化展现形式的差异。 「对比型数据」: 对比两组或两组以上数据的差异。 「分布型数据」: 研究数据分布的集中趋势、离散程度、偏态和峰度等。 ? 业务数据分析: 带有地理信息属性的数据、或者离散时间属性的数据,也可以使用热力图来进行数据展示。 ? 7.地图 当数据带有地理型信息属性时,首选的可视化图表为地图。 0xFF 总结 无论是要对比数据,还是研究数据的分布情况,都需要根据数据的类型、数据的特征来确定可视化的最佳方式。

    1.9K30发布于 2019-08-26
  • 来自专栏木东居士的专栏

    《七数据可视化之旅》第四数据图表的选择(下)

    《七数据可视化之旅》第四数据图表的选择(下) Destiny,某物流公司数据产品经理,目前从事数据平台搭建和可视化相关的工作。持续学习中,期望与大家多多交流数据相关的技术和实际应用,共同成长。 主要包含如下如下几类数据: 区间型数据: 区间型数据一般是用来监控数据当前的进度情况,指示数据是否正常,其数据格式一般为数值或者百分比。 关系型数据数据之间的关系有,包含关系、层级关系、分流情况、联结关系等。 地理型数据: 包含地理型信息的数据,如国家、省份、城市、行政区、经纬度等。 0x02 关系型数据可视化 数据之间的关系,主要包含如下几种关系类型: 表示数据之间的包含关系→韦恩图; 表示数据之间的层级关系→漏斗图&矩形树图; 表示数据之间的分流关系→桑基图; 表示数据之间的联结关系 3.矩形树图 在分布型数据可视化中讲到过,矩形树图适合具有「树状结构」的层级关系数据的可视化,它通过「面积」来映射数据大小或者数据占比,通过颜色来区分类别。

    1.1K30发布于 2019-08-29
  • 来自专栏YashanDB知识库

    【YashanDB知识库】virt虚拟内存远大于res内存问题分析

    # YASDB内存占用简介### 参数配置:默认参数配置:DBMS_PARAM高级包生成配置参数数据库内存配置,使用默认参数步骤:1、DBMS_PARAM.OPTIMIZE(); //生成默认参数,使用总内存的 256M(其他小块内存)# 问题:VIRT超过RES十几个G如下图所示,yasdb满负荷运行后,0任务跑的情况下,virt内存:31.2g,实际内存:21.7g,虚拟内存比实际内存大了10g左右,虚拟内存远大于实际使用内存 ### VIRT内存为什么远远大于RESVIRT:SWAP+RES(虚拟内存大小,包括进程使用的库、代码、数据等,如果申请100M,则增加100M大小)RES:进程使用的,未被换出的物理内存(包括共享内存大小

    25310编辑于 2025-02-20
  • 来自专栏小语雀网

    SQL语句来查询今天、昨天、7内、30数据

    SQL语句来查询今天、昨天、7内、30数据! 今天的所有数据:select * from 表名 where DateDiff(dd,datetime类型字段,getdate())=0 昨天的所有数据:select * from 表名 where DateDiff(dd,datetime类型字段,getdate())=1 7内的所有数据:select * from 表名 where DateDiff(dd,datetime类型字段,getdate ())<=7 30内的所有数据:select * from 表名 where DateDiff(dd,datetime类型字段,getdate())<=30 本月的所有数据:select * from 表名 where DateDiff(mm,datetime类型字段,getdate())=0 本年的所有数据:select * from 表名 where DateDiff(yy,datetime类型字段

    3.4K30编辑于 2022-05-06
领券