首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 远大数据个人风险报告技术实现全解析

    关键词:个人风险报告, 大数据风控, 技术实现, Python, Vue.js, 系统架构, API接口, 远大数据一、引言:从数据孤岛到综合风险画像在数字化风控时代,单一维度的信用数据已无法满足精准决策的需求 现代大数据风控平台致力于解决这一痛点,其核心的个人风险报告,通过整合海量、多维度的合规数据,为用户提供一站式的风险洞察服务。 本文将以一份典型的报告数据结构为蓝本,深入剖析其技术生命周期,看这类系统是如何实现其强大功能的。二、数据基石:合规API接口与模块化聚合一份专业个人风险报告的价值,在于其丰富的数据维度。 这些数据通过调用一系列稳定、合规的API数据接口聚合而成。 实现引流:在发布的版本中,可以将文中的泛指(如"某风控平台")替换为自己的品牌名(如"远大数据"),并将首次出现的品牌关键词制作成一个指向官网产品页的锚文本链接。

    99500编辑于 2025-06-21
  • 远大数据 - 企业风险报告(专业版)API接口文档

    int", "message": "string", "transaction_id": "string", // 流水号 "data": "string"}data 字段为加密的数据 任职类型名称childrenString子对象legal_person_idNumber法人gidcompanyTypeNumber任职类型legal_person_typeNumber法人类型:1-人、2- legalPersonNamestring被处罚方法定代表人或负责人姓名remarkstring备注信息punishStatusstring处罚状态typestring处罚类别1typeSecondstring处罚类别2evidencestring 该大类风险中包含的风险事件总条数namestring风险分类名称(自身风险/周边风险/历史风险/预警提醒)listarray该大类风险下具体风险类型的列表typenumber风险大类的类型代码(0-预警提醒,1-自身风险,2- titlestring该风险事件的标题或摘要信息typenumber具体风险类型的代码descstring对该风险事件的简要描述2.6.6 风险类型代码说明风险大类Type代码:0: 预警提醒1: 自身风险2:

    29710编辑于 2025-08-23
  • 来自专栏布衣者博客

    LeetCode-数据结构-数组-第2

    合并两个有序数组 给你两个有序整数数组 nums1 和 nums2,请你将 nums2 合并到 nums1 中,使 nums1 成为一个有序数组。 初始化 nums1 和 nums2 的元素数量分别为 m 和 n 。你可以假设 nums1 的空间大小等于 m + n,这样它就有足够的空间保存来自 nums2 的元素。 具体题目链接 Python class Solution: def merge(self, nums1: List[int], m: int, nums2: List[int], n: int) 如果是nums1大,则进行tail指针与m指针数进行互换(防止出现复制值现象),如果nums2大则直接赋值给tail 位置。 依次类推进行,m>=0表示nums[1]有序序列未排完,若排完则就让nums2继续排列。

    24420发布于 2021-09-07
  • 来自专栏学习笔记ol

    N爆肝数据库——MySQL(2

    N爆肝数据库——MySQL(2) 这是专栏链接,大家可以看一看,提提意见 本篇文章,主要对DML DQL进行知识总结和学习。 期待和大家一起学习进步。 添加数据(INSERT) 修改数据(UPDATE) 删除数据(DELETE) DML-添加数据 1 给指定字段添加数据 INSERT INTO表名(字段名1,字段名2,...)VALUES(值1,值2 ,...); 2 给全部字段添加数据 INSERT INTO 表名 VALUES(值1,值2,...); 3 批量添加数据 INSERT INTO表名(字段名1,字段名2,...)VALUES(值1 ,(值1,值2,...); INSERT INTO 表名 VALUES(值1,值2,…),(值1,值2,…),(值1,值2,…); DML-修改数据 UPDATE 表名 SET 字段名1=值1,字段名 2=值2,...

    31720编辑于 2023-10-11
  • 来自专栏光城(guangcity)

    2学会Pandas

    2学会Pandas 0.导语1.Series2.DataFrame2.1 DataFrame的简单运用3.pandas选择数据3.1 实战筛选3.2 筛选总结4.Pandas设置值4.1 创建数据4.2 根据位置设置loc和iloc4.3 根据条件设置4.4 按行或列设置4.5 添加Series序列(长度必须对齐)4.6 设定某行某列为特定值4.7 修改一整行数据5.Pandas处理丢失数据5.1 创建含 NaN的矩阵5.2 删除掉有NaN的行或列5.3 替换NaN值为0或者其他5.4 是否有缺失数据NaN6.Pandas导入导出6.1 导入数据6.2 导出数据7.Pandas合并操作7.1 Pandas 2.loc与iloc区别 总结:相同点:都可以索引处块数据 不同点:iloc可以检索对应值,两者操作不同。 ']=np.nan df.ix[2] = np.nan # df.ix[2,:]=np.nan df.ix['20180823'] = np.nan print(df) 5.Pandas处理丢失数据

    2K20发布于 2019-09-20
  • 来自专栏python3

    python 第2

    ,"Test","YES","D:/picture/2.gif") //是使用事例 使用效果如图 ? for looper in range(1,5): print (looper) 注意这里只会打印出1,2,3,4 for looper in range(1,10,2): //这里的步长为2.从

    83120发布于 2020-01-11
  • 来自专栏杨熹的专栏

    2 入门 Java-Day 2

    第二的课程明显就比第一的要难了,? 表示很吃力,脑子不够用的节奏。 各种概念绕来绕去,脑袋都要绕成了壳。 不过还好没有放弃,想个办法画出各概念间的联系,虽然没全记住,但是还算是看懂文字了。 亲测结果,两是可以学完基础的,但是脑子一定要保持清醒,绕晕了的时候就转换下思维,静静,静完再继续。 2、 在普通成员方法中,则可以直接访问同类的非静态变量和静态变量 3、** 静态方法中不能直接调用非静态方法,需要通过对象来访问非静态方法。 由于静态初始化块只在类加载时执行一次,所以当再次创建对象 hello2 时并未执行静态初始化块。

    71490发布于 2018-04-03
  • 来自专栏java学习

    2的练习

    2:Java中的数据类型分几类?基本数据类型有哪些? 3:数据类型转换: 隐式转换: 强制转换: 面试题: 第一题: byte b1=3,b2=4,b; b=b1+b2; b=3+4; 哪句是编译失败的呢?为什么呢?

    73570发布于 2018-04-13
  • 来自专栏从0到1前端开发

    JavaScript 进阶 - 第2

    undefined 允许初始化变量的默认值,属性不存在或单元值为 undefined 时默认值才会生效 注:支持多维解构赋值,比较复杂后续有应用需求时再进一步分析 JavaScript 进阶 - 第2 ,而非堆内存中的数据,如下图所示: [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NZyFjJc2-1668165425697)(assets/object-2.png) ,如下图所示: [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8PVzu9xn-1668165425698)(assets/array-2.png)] 数组赋值后,无论修改哪个变量另一个对象的数据值也会相当发生改变 ; // 字面量创建字符串 let str2 = '你好,世界!' ,由其它数据类型转换成布尔类型的数据被称为真值(truly)或假值(falsly)。

    1.9K30编辑于 2022-11-18
  • 来自专栏杨建荣的学习笔记

    数据迁移部分问题总结(r2第3)

    1.constraint导致的数据reject 在数据加载的时候,报了如下的错误。 TOT_OBJ") 2.foreign key 导致的constraint enable 在数据加载之前,对于foreign key都做了diable的操作,在加载的过程中也没有出现任何问题。 对于reject的数据也根据主键信息罗列了出来。 imported "XXXXX"." 53020364 rows Rejected row #1043: column APP_ID: 1000 column ENTITY_KEY: 1 column PERIOD_KEY: 2 TABLE_NAME SEQ_NAME SEQ_MAX COLUMN_MAX sequence_1 EXTRACT_FILE_SEQ 22144093 22044092 sequence_2 RC_RATES

    78970发布于 2018-03-14
  • 来自专栏路人甲Java

    Mysql系列 - 第2:详解mysql数据类型(重点)

    主要内容 介绍mysql中常用的数据类型 mysql类型和java类型对应关系 数据类型选择的一些建议 MySQL的数据类型 主要包括以下五大类 整数类型:bit、bool、tinyint、smallint )),(pow(2,7)-1); Query OK, 2 rows affected (0.00 sec) Records: 2 Duplicates: 0 Warnings: 0 mysql> char类型占用固定长度,如果存放的数据为固定长度的建议使用char类型,如:手机号码、身份证等固定长度的信息。 数据类型选择的一些建议 选小不选大:一般情况下选择可以正确存储数据的最小数据类型,越小的数据类型通常更快,占用磁盘,内存和CPU缓存更小。 简单就好:简单的数据类型的操作通常需要更少的CPU周期,例如:整型比字符操作代价要小得多,因为字符集和校对规则(排序规则)使字符比整型比较更加复杂。

    2.2K30发布于 2019-09-16
  • 来自专栏NowlNowl_AI

    机器学习第2:训练数据的获取与处理

    数据的获取 我们知道机器学习的关键是数据和算法,提到数据,我们必须要有在这个大数据时代挑选我们需要的,优质的数据来训练我们的模型,这里分享几个数据获取平台 Kaggle Datasets Find Open ") print(s["name"]) 运行结果 (2)按行索引 注意,当我们直接这样按行索引,是会报错的 import pandas as pd s = pd.read_csv("test.csv 在这一部分我们以经典的鸢尾花数据集为例,简单介绍一下:鸢尾花数据集包括了花的种类,花瓣和花萼的长度与宽度,共五列数据,然后我们要训练一个通过花瓣,花萼长宽数据来判断品种的机器学习模型,机器学习的任务请参考这篇文章 :机器学习第一:概念与体系漫游-CSDN博客 部分数据如下 数据特征 我们来分析这个数据集的特征 value_counts() import pandas as pd iris = pd.read_csv ,得到的模型效果将比用花萼长宽训练出来的效果更好 这就是数据分析的意义之一:找到强特征 结语 数据的获取,处理与分析是机器学习中一个重要的过程,好的数据分析与好的算法一样重要,数据分析有许多方法,这里仅带读者了解一下

    40010编辑于 2024-01-18
  • 来自专栏光城(guangcity)

    Mysql系列 - 第2:详解mysql数据类型(重点)

    作者:路人甲Java 作者简介:工作10年的阿里P7,分享Java、算法、数据库方面的技术干货! 总共几十篇,这是mysql系列第2篇文章。 环境:mysql5.7.25,cmd命令中进行演示。 主要内容 介绍mysql中常用的数据类型 mysql类型和java类型对应关系 数据类型选择的一些建议 MySQL的数据类型 主要包括以下五大类 整数类型:bit、bool、tinyint、smallint )),(pow(2,7)-1); Query OK, 2 rows affected (0.00 sec) Records: 2 Duplicates: 0 Warnings: 0 mysql> char类型占用固定长度,如果存放的数据为固定长度的建议使用char类型,如:手机号码、身份证等固定长度的信息。 数据类型选择的一些建议 选小不选大:一般情况下选择可以正确存储数据的最小数据类型,越小的数据类型通常更快,占用磁盘,内存和CPU缓存更小。

    1.1K20发布于 2019-10-12
  • 来自专栏九彩拼盘的叨叨叨

    前端学习 第2周 第2

    link和:visited伪类的书写顺序 作业 写满足以下条件的选择器 类名不为not-normal-input的文本框(<input type="text">)元素的获得焦点状态 在父元素中倒数第2

    22340发布于 2018-08-27
  • 来自专栏杨建荣的学习笔记

    海量数据迁移之冲突数据筛查(r2 第1)

    对于数据迁移来说,无论准备工作准备的多么充分,在测试和正式生产环境中,心里还是会对冲突的数据有一些疑虑,心里感觉没底,因为生产的数据也是在不断变化的,要迁移的数据也在做相应的改动,在这样的环境中,其实数据抽取的工作还是顾虑比较少的 可能会有一些紧急的数据更改任务,数据的稽核等等。。 对于主键相关的数据排查,如果在数据迁移前能够发现,是最好的了,这样可以极大的减少dba的工作量。 所以省去了创建额外的数据空间,而且可以考虑在备库上执行。 基本思路就是通过如下的sql语句来找到冗余的数据。 from target_schema.table_01 --目标数据的schema 实现的脚本如下所示: echo check duplicate data between $1.$2 $3.$2

    2K50发布于 2018-03-13
  • 来自专栏fanzhh的技术笔记

    100机器学习实践之第2

    ---- Day 2, 简单线性回归 使用一个特征值预测结果 这是一种基于独立的变量X预测相关变量Y的方法。这种方法假设两个变量线性相关。 Step 1:预处理数据 我们会按照上一节的步骤来处理数据。 导入库 导入数据集 检查缺失数据 分割数据 特征值规范化以准备使用简单线性回归模型 import pandas as pd import numpy as np import matplotlib.pyplot train_test_split X_train, X_test, Y_train, Y_test = train_test_split(X,Y,test_size=1/4,random_state=0) Step 2: 使用训练数据训练简单线性回归模型 我们将使用sklearn.linear_model的LiearRegression类训练数据

    50720发布于 2019-08-20
  • 来自专栏杨建荣的学习笔记

    生产环境数据迁移问题汇总(r2第16)

    在测试环境中做了3轮数据迁移的演练,最终到了生产环境中,还是出现了不少问题,经过大半夜的奋战,终于是数据都迁移成功了。 2)人为失误,遗漏了脚本 在数据迁移之前运行了一些脚本来设置table nologging,index nologging,disable trigger..结果把最重要的foreign key的脚本给遗漏了 ,结果在使用sqlldr加载数据的时候reject了部分的数据。 赶紧执行disable的脚本,报了如下的错误,好吧,对于已经收影响的数据来说,只能通过.bad文件来逐一恢复数据了。 经过确认是客户的卡发人员想查验数据迁移的情况,这个会对数据的迁移造成一定的影响。

    1.4K70发布于 2018-03-14
  • 来自专栏前端知识分享

    2:HTML常用标签

    www.baidu.com(跳转页面);id名(锚点跳到相应div位置);01.rar(压缩包) target:_blank(新窗口打开);_self(当前窗口打开) 二、文件路径 绝对路径: (1)线上:线上绝对路径 (2) time 时间 em 强调一个词或者一段话 strong 强调一个词或者一段话 img 图片 四、选择器优先级 行间样式>ID>class>类型符>通配符 五、行内、块元素 行内元素: 1、内容撑开宽高 2、 不支持宽高 3、一行可以显示同类多个标签 4、不支持上下的margin 5、代码换行被解析 块元素: 1、默认独占一行 2、没有宽度时,撑满一行 3、支持所有class命令 inline-block 1 、块在一行显示 2、内联支持宽高 3、默认内容撑开宽高 4、标签之间的换行会被解析(问题) 5、IE6、IE7不支持块属性标签的inline-block(问题) 块级元素(block element): /head> <body>

    1.5K10发布于 2018-09-11
  • 来自专栏杨建荣的学习笔记

    巧用parallel极速提升数据加载速度(r2第21)

    现有一个很让人头疼的表,里面还有clob字段,通过exp/imp来导出导入数据,导出慢还可以接受,导入的速度大概在一秒钟1000条的速度,对于千万,上亿的数据来说,简直就是噩梦。 在测试环境中反复测试,时间大概保持在2个小时的样子(数据量是5千万),而且还得不断的去查看undo的使用率,有一次测试中还报了undo空间不足的错误,整个数据导入得重头再来,而且还使得高水位线受到影响。 为了保证测试的可评估性,我每次都会换一个数据量基本一致的外部表来插入数据。 Elapsed: 00:00:06.49 SQL> commit; 清空数据,稍候继续插入数据,来看看是否parallel被启用了。 将近100万的数据在6秒钟导入了,如果是5000万的数据大概需要6分钟左右的时间,来简单验证一下 做一个大的数据插入。大概用了7分钟的时间,速度还是不错的。

    76760发布于 2018-03-14
  • 来自专栏杨建荣的学习笔记

    通过shell抓取html数据(r2笔记74)

    最近看一些网站的时候,发现有些数据很有意思,想把数据截取出来,但是想把数据抽取出来很是困难。因为如下的小方框的数字都是上下两行排列,想要把数据抽取到一行是很难实现的。 比如我们使用wget来抽取网页的数据,然后在这个基础上进行数据的筛查。 [ora11g@rac1 a]$ wget http://www.kufa88.com/jingcai/hunhe? appType=livescore 在分析了网站的标签之后,我写了如下的shell脚本,能够抽取出对应的数据来。 =\"awaywin btn\" op=\"l\">" *|awk -F\<span '{print $2}'|awk -F\> '{print $2}'|awk class=\"num\">" *|awk -F\<span '{print $2}'|awk -F\> '{print $2}'|awk -F\< '{print $1}' >rtie.lst

    1.4K90发布于 2018-03-14
领券