首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏CSDNToQQCode

    数据面试题【十一、InnoDB引擎的4特性】

    1、插入缓冲(insert buffer) 2、二次写(double write) 3、自适应哈希索引(ahi) 4、预读(read ahead)

    35120编辑于 2022-11-28
  • 来自专栏木东居士的专栏

    闲聊4数据经历

    0x00 前言 周末闲来无事,想到从13年接触大数据这个名词,到现在也有4年的时间了,随便聊一聊自己和大数据接触的那些经历。 0x01 大数据 “什么是大数据?” ,和数据相关的技术也都数据数据。 2016年初 然后到了16年初,感觉机器学习突然间火起来了,突然间大数据的概念就被割裂出去了一部分,机器学习和数据挖掘这部分和算法强相关的内容一下子就不属于大数据这个概念了。 然后数据量一下暴增了,一天要处理的数据增到了百亿的级别,很多任务的数据量都超过了千亿,。下子问题就了,遇到了很多的挑战,比如数据倾斜、数据丢失、数据读写影响这些问题。 大规模数据的处理是一个非常的课题,但是这一点更偏向于是搞技术的。 我们在做大数据的时候也更应该有数据的理解,这里对数据的理解可能会和数据分析、数据挖掘有类似,但是又不同。

    85230发布于 2018-05-25
  • 来自专栏最新最全的大数据技术体系

    11月数据面试题复习

    1)从 high-level 的角度来看,两者并没有的差别。 当表和小表join时,用map-side join能显著提高效率。 不一定,当数据规模小,Hash shuffle快于Sorted Shuffle数据规模的时候;当数据量大,sorted Shuffle会比Hash shuffle快很多,因为数量大的有很多小文件,不均匀 ,甚至出现数据倾斜,消耗内存,1.x之前spark使用hash,适合处理中小规模,1.x之后,增加了Sorted shuffle,Spark更能胜任大规模处理了。 4)BlinkDB :是一个用于在海量数据上运行交互式 SQL 查询的大规模并行查询引擎,它允许用户通过权衡数据精度来提升查询响应时间,其数据的精度 被控制在允许的误差范围内。  

    92912编辑于 2021-12-06
  • 数据同步最全避坑指南!4痛点+4场景技术方案

    数据湖仓一体、流批一体的背景下,数据同步作为数据流动越来越重要的一环。然而,数据同步听起来简单,做起来却处处是坑:业务急着要数据做决策,报表却迟迟出不来? 系统A和系统B的数据对不上,流程卡住,用户投诉?想搞实时同步提升体验,结果把核心数据库拖慢了?尤其在企业内部数据分析和业务流程流转等关键时刻,如果数据同步跟不上,问题就了。 (2)技术实现:全周期一致性方案通过将存量数据校验与增量同步并行处理,缩短数据切换时间,降低业务中断风险。4.资源消耗与扩展不足(1)痛点:流式同步技术在提升实时性的同时,对计算资源的需求大大增加。 误区 4:安全防护的合规性缺失敏感数据同步需满足分类分级要求,山东大数据局明确要求传输加密、脱敏处理与最小权限管控。工具应该内置敏感数据规则,并支持操作日志审计留存,确保符合监管要求。 3.流处理平台:实时化场景方案企业可以根据场景选择单一工具或组合方案:4.新一代统一架构:流批一体与湖仓融合理想的数据同步架构应该整合流批一体引擎(Flink)、湖仓存储层(Iceberg)与智能管控面

    59310编辑于 2025-09-22
  • 来自专栏云计算D1net

    数据时代 云安全4策略

    云计算与大数据的结合可以说是天作之合。大数据需要灵活的计算环境,而后者可以快速、自动地进行扩展以支持海量数据,基础设施。 4、对数据安全永不妥协 虽然云安全通常十分复杂,但是用户在大数据部署当中还是会发现一些“安全捷径”。这些“安全捷径”通常貌似能够回避一些复杂设置,同时保持大数据结构“不受伤害”。 并不是所有的大数据基础设施是安全的,如果处于风险当中的数据非常敏感或是属于管制数据,那么用户可能需要寻找替代方案。 多备份在给用户备份数据时自动把数据压缩加密并传到多个云端平台,采用3层加密安全保护体系使得数据安全达到最高。 总结 只有为数据建立了最为严格的安全标准,大数据才能够不断地享受着由云计算提供的可扩展性、灵活性和自动化。加密被认为是保护云()数据的首要步骤。

    1.3K70发布于 2018-03-21
  • 数据资产怎么管?关键在这4环节!

    我们可以利用数据发现工具或数据目录平台,自动连接到公司内部的各个数据库、数据仓库甚至文件存储。 2.核心是抓取“元数据”工具会自动采集“关于数据数据”,比如一个数据表叫什么、在哪里、包含哪些字段(这是技术元数据);每个字段在业务上代表什么,归哪个部门管(这是业务元数据)。 3.形成数据目录将所有采集到的元数据组织起来,形成一个可搜索的、统一的数据资产地图。想象一下,这就是你公司数据的“搜索引擎”。做完这一步,你就能快速回答:我们到底有没有“客户满意度评分”这个数据? 2.设计一致的数据模型在数据汇聚的层面,比如数据仓库里,按照商定好的标准来设计和整合数据,确保口径一致。3.理清数据血缘这一点非常关键。 我们应该把处理好的数据,封装成易于使用的数据服务API、可复用的数据产品或直观的分析报表。让业务方能够方便地获取数据能力。2.尝试进行价值度量数据值多少钱?这是个难题,但我们必须尝试去回答。

    32310编辑于 2025-12-08
  • 来自专栏程序你好

    区块链4优势,与传统金融4短板

    通俗地说,所有网络虚拟数字货币的交易过程都是去中心化的分布式网络账本,被记录的所有交易数据都可以在区块链各个节点上共享,各个数据终端通过加密合约彼此间相互链结。 技术的关键点在于所有节点都分散保存着一个账本,单一或部分节点无法单独篡改数据。 ? 在传统金融日系,都依赖于信用背书系统。 目前大部分的金钱交易都是通过银行、保险公司、担保公司等第三受信机构作为中介完成交易的,记录单独保存于其中央数据库中,这种方式无法确保记录的完整性和唯一性。 区块链技术的四优势表现在四个方面: 首先是免基础信任机制。 所有参与区块链交易节点都参与记录和验证,以及数据的维护。

    1.2K10发布于 2018-07-20
  • 来自专栏Java学习网

    数据库面试,详解4道常见JDBC面试题

    JDBC提供了诸如查询和更新数据库中数据的方法,本质上是用来规范访问数据库的应用程序接口。 总的来说,JDBC在数据库中有着不容忽视的地位,需要我们花费足够的时间去学习,无论是在求职面试还是学习中都需要重视。下面为大家介绍4道经典JDBC面试题。 1、JDBC操作数据库的步骤 ? (1)、注册数据库驱动。 (2)、建立数据库连接。 (3)、创建一个Statement。 (4)、执行SQL语句。 (5)、处理结果集。 (4)、CallableStatement适用于执行存储过程。 3、说说数据库连接池工作原理。 JAVA EE服务器启动时会建立一定数量的池连接,并一直维持不少于此数目的池连接。 4、execute,executeQuery,executeUpdate的区别是什么?

    62620发布于 2021-08-27
  • 来自专栏CSDNToQQCode

    数据面试题【十三、数据查询,怎么优化】

    优化shema、sql语句+索引; 第二加缓存,memcached, redis; 主从复制,读写分离; 垂直拆分,根据你模块的耦合度,将一个的系统分为多个小的系统,也就是分布式系统; 水平切分 ,针对数据量大的表,这一步最麻烦,最能考验技术水平,要选择一个合理的sharding key, 为了有好的查询效率,表结构也要改动,做一定的冗余,应用也要改,sql中尽量带sharding key,将数据定位到限定的表上去查

    82810编辑于 2022-11-28
  • 来自专栏灯塔大数据

    4位专家解读2015数据技术进展

    【回顾2015】 1 关键技术进展 Hadoop: Hadoop作为大数据平台中最基础与重要的系统,在2015年提高稳定性的同时,发布了多个重要功能与特性,这使得Hadoop朝着多类型存储介质和异构集群的方向迈进了一步 它的基本思想是,通过打标签的方式为不同的节点赋予不同的属性,这样,一个的Hadoop集群按照节点类型被分成了若干个逻辑上相互独立(可能交叉)的集群。 ●可配置的store compression 存储的field,例如_source字段,可以使用默认的LZ4算法快速压缩,或者使用DEFLATE算法减少index size。 2015年Kylin的主要发展都在Streaming OLAP上,为了支持低延迟的数据刷新,从整体的架构和设计上都做了相当的重新设计,目前已经可以支持从Kafka读取数据并进行聚合计算的能力,同时提供 ●2015年4月,亚马逊启动其机器学习平台Amazon Machine Learning,这是一项全面的托管服务,让开发者能够轻松使用历史数据开发并部署预测模型。

    93970发布于 2018-04-10
  • 来自专栏java学习

    关于Spring面试题讲解4

    前面的面试题目录总结 关于Spring面试题讲解1 查看 关于Spring面试题讲解2 查看 关于Spring面试题讲解3 查看 题目 ID:javaxxf 51. 解释AOP 52. 横切关注点是一个关注点,此关注点是整个应用都会使用的功能,并影响整个应用,比如日志,安全和数据传输,几乎应用的每个模块都需要的功能。因此这些都属于横切关注点。 54. ⊙面试题68(加深你对栈的理解_让你知道什么是栈) ⊙来测试一下你对数据结构中的栈和队列的了解有多少? ⊙面试题63(链表,哈希表) ⊙ 请你对Java中树的了解有多少? ⊙ 这个培训机构怎么?

    62820发布于 2018-07-25
  • 数据清洗,必须掌握的5解决方案+4步骤

    一、数据清洗是什么及应用场景高质量的数据应用必须建立在干净可靠的基础之上,数据清洗正是数据治理体系中的关键战略环节。当原始数据从采集端流入处理流程,首先需要经历系统性的 “质检” 与 “加工”。 数据清洗是什么?数据清洗是对原始数据进行系统性审查、修正、转换与整合的过程。 (4)机器学习和人工智能:模型训练极度依赖数据质量,缺失值处理不当、异常值未识别、特征尺度差异巨大,都会导致模型性能低下甚至失效。数据清洗的效果直接影响模型的上限。 (3)错误数据:拼写错误、逻辑错误等。(4)异常值:超出正常范围的数据。(5)格式混乱:日期、数字、文本等格式不一致。(6)不一致数据:跨系统、跨表的数据存在差异。(7)冗余数据:不必要的重复信息。 (4)将最终字符串转为DOUBLE类型。得到干净、可直接计算的数字型“利润_清洗”列。数据过滤设置过滤条件,筛选出符合特定条件的数据。例如,筛选出「订购日期」为2023年,「运货费」大于100的数据

    45210编辑于 2025-09-26
  • 来自专栏机器学习/数据可视化

    MySQL必学4语言

    MySQL必学4种语言 本篇文章记录的是MySQL中常用的4种语言: DDL DDL,data defination language,指的是数据定义语言,其主要作用是创建数据库,对库表的结构进行删除和修改等操作 # 需要查询的字段 from table_name # 表名 where 条件 简单查询 select name, age from user where id=4; where id in :指定从哪里开始显示,显示多少行 简写:limit 5, 4:表示从第5行开始,显示4数据 select name, age from user limit 5; -- 只显示5行数据 select name, age from user limit 5 offset 4; -- 从第4(offset)行开始显示5(limit)行数据 select name, age from user limit 4, 5 ; -- 效果同上:逗号之前是offset的内容,逗号之后是limit内容 MySQL中的DQL应该是最常用的,请参考《MySQL经典50题》

    47540编辑于 2023-08-25
  • 来自专栏云头条

    4 亿、金融 IT

    5月24日,吉林省农村信用社联合社发布《2022年核心主机及配套存储等设备采购项目》竞争性谈判公告 预算金额:8688 万元 采购需求: 1、硬件设备共计31台: 其中核心主机3台、核心主机硬件控制台4台 ) 2、核心主机使用的配套软件3套: 其中核心主机存储切换管理软件1套,核心系统性能分析软件1套,核心系统开发工具1套 3、原厂集成实施服务: 包括核心系统生产及同城灾备三点架构环境搭建,核心业务系统数据平滑迁移 ,核心交换机4台,区域汇聚交换机32台,接入交换机118台,4套SDN控制器等软硬件设备。 采购需求: 2022年5月17日,福建省农村信用社联合社发布《数据库存储(01)采购项目等六个项目》招标公告,预算 7693 万元。 2022年5月17日,福建省农村信用社联合社发布《数据库存储(02)采购项目等六个项目》招标公告,预算未公布。

    1.1K10编辑于 2022-06-02
  • 来自专栏Hello工控

    CAN总线4优点!!!

    规模化:CAN的广泛流行本身就是一个降低成本的因素,从控制器、收发器、线束——以及更间接相关的成本,如数据采集硬件、培训等。 易于访问 CAN总线提供了与所有网络ECUs通信的“单一入口点”——使得集中诊断、数据记录和配置成为可能。 这极大地简化了诊断工作,因为你不需要为每个节点单独收集数据。 静默CAN记录:特别是,可以在“静默模式”下进行CAN总线数据记录,确保设备完全不影响CAN总线——这对于例如诊断来说至关重要。 高效 CAN帧通过ID进行优先级排序,这样高优先级的数据就能立即获得总线访问权,而不会造成其他帧的中断或CAN错误。 仲裁:当多个CAN节点尝试同时传输数据时,具有最低CAN ID(最高优先级)的帧获胜,其余的则退避并重试。这避免了碰撞,并确保了安全关键消息的优先级。

    83210编辑于 2024-10-28
  • 来自专栏全栈程序员必看

    HashMap常见面试题_java面试题汇总

    目录 1.HashMap的数据结构? 2.HashMap的工作原理? 3.当两个对象的hashCode相同会发生什么? 4.你知道hash的实现吗?为什么要这样实现? 5.为什么要用异或运算符? 4.你知道hash的实现吗?为什么要这样实现? 如果当n即数组长度很小,假设是16的话,那么n – 1即为1111 ,这样的值和hashCode直接做按位与操作,实际上只使用了哈希值的后4位。 因为位运算直接对内存数据进行操作,不需要转成十进制,所以位运算要比取模运算的效率更高 第二:当length为2的N次方的时候,数据分布均匀,减少冲突 那么为什么默认是16呢?怎么不是4?不是8? 比如某些人通过找到你的hash碰撞值,来让你的HashMap不断地产生碰撞,那么相同key位置的链表就会不断增长,当你需要对这个HashMap的相应位置进行查询的时候,就会去循环遍历这个超级的链表,性能及其地下

    58220编辑于 2022-09-22
  • 来自专栏全栈学习专栏

    阿里巴巴面试题- - -Java体系最新面试题4

    为了帮助秋招的小伙伴们,学长这里整理了一系列的秋招面试题给大家,所以小伙伴们不用太过焦虑,相信你们一定能超常发挥,收到心仪公司的Offer~~ 内容涵盖:Java、MyBatis、ZooKeeper、 以集合来举例,使用泛型的好处是我们不必因为添加元素类型的不同而定义不同类型的集合,如整型集合类,浮点型集合类,字符串集合类,我们可以定义一个集合来存放整型、浮点型,字符串型数据,而这并不是最重要的,因为我们只要把底层存储设置了 Object即可,添加的数据全部都可向上转型为Object。 更重要的是我们可以通过规则按照自己的想法控制存储的数据类型。16、Java创建对象有几种方式?

    62710编辑于 2022-08-26
  • 来自专栏芋道源码1024

    Java中高级面试题4

    这里选了几道高频面试题以及一些解答。不一定全部正确,有一些是没有固定答案的,如果发现有错误的欢迎纠正,如果有更好的回答,热烈欢迎留言探讨。 类似参考文章,请移驾: Java中BIO,NIO,AIO的理解 java中常说的堆和栈,分别是什么数据结构;另外,为什么要分为堆和栈来存储数据 栈是一种具有后进先出性质的数据结构,也就是说后存放的先取 堆是一种经过排序的树形数据结构,每个结点都有一个值。通常我们所说的堆的数据结构,是指二叉堆。堆的特点是根结点的值最小(或最大),且根结点的两个子树也是一个堆。 4、线程池允许我们开启多个任务而不用为每个线程设置属性。 5、线程池允许我们为正在执行的任务的程序参数传递一个包含状态信息的对象引用。 6、线程池可以用来解决处理一个特定请求最大线程数量限制问题。 乐观锁:一段执行逻辑加上乐观锁,不同线程同时执行时,可以同时进入执行,在最后更新数据的时候要检查这些数据是否被其他线程修改了(版本和执行初是否相同),没有修改则进行更新,否则放弃本次操作。

    92300发布于 2018-07-31
  • 来自专栏软件测试学习

    软件测试面试题分享-No.4

    考点: 接口测试用例设计 参考答案: 1)必填字段:请求参数必填项、可选项 2)合法性:输入输出合法、非法参数 3)边界:请求参数边界值等 4)容错能力:容量数据、频繁请求、重复请求(如:订单)、异常网络等的处理 5)响应数据校验:断言、数据提取传递到下一级接口… 6)逻辑校验:如两个请求的接口有严格的先后顺序,需要测试调转顺序的情况 7)性能:对接口模拟并发测试,逐步加压,分析瓶颈点 8)安全性:构造恶意的字符请求 ,如:SQL注入、XSS、敏感信息、业务逻辑(如:跳过某些关键步骤;未经验证操纵敏感数据) 接口测试中的加密参数如何处理 考点: 是否熟悉加解密方式 是否具备处理加密参数的能力 是否实际应用过 参考答案 、数据库操作封装、测试用例管理封装、测试报告等等。 更多面试题/学习交流,在群里等着你呦,公众号后台回复进群/通过菜单自己扫描加群即可。

    53530发布于 2021-07-06
  • 来自专栏前端开发面试

    前端经典面试题(有答案)4

    console.log(2) }}Foo.prototype.a = function(){ console.log(3);}Foo.a = function(){ console.log(4) 如果在 Webpack4 中你希望开启这个功能,只需要启用 optimization.concatenateModules 就可以了:module.exports = { optimization: 如果使用 Webpack 4 的话,开启生产环境就会自动启动这个优化功能。 怎么加事件监听,两种onclick 和 addEventListener参考 前端进阶面试题详细解答基于 Localstorage 设计一个 1M 的缓存系统,需要实现缓存淘汰机制设计思路如下:存储的每个对象需要添加两个属性 当该属性值大于 1M 时,需要按照时间排序系统中的数据,删除一定量的数据保证能够存储下目前需要存储的数据。每次取数据时,需要判断该缓存数据是否过期,如果过期就删除。

    60330编辑于 2023-01-06
领券