首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏好好学java的技术栈

    Java 8 开发4 技巧

    这会导致… 使用现有的函数式接口 随着开发人员越来越熟悉Java 8代码,我们就能知道当使用如Supplier和 Consumer的接口时,会发生什么,以及创建一个本地的ErrorMessageCreator 4.Stream Stream API是Java 8另一个特点,并且我认为我们还真的不知道这对我们的编码方式会产生多大的改变。下面是我发现的一些有用的东西 排队点操作符 我个人更喜欢排队我的流操作。 特别是,遍历原始类型的小型数组几乎肯定会用,以获得更好的性能循环,很可能(至少对于Java开发人员是新的流)更具可读性。 ?

    81410发布于 2019-12-05
  • 来自专栏木东居士的专栏

    闲聊4数据经历

    0x00 前言 周末闲来无事,想到从13年接触大数据这个名词,到现在也有4年的时间了,随便聊一聊自己和大数据接触的那些经历。 0x01 大数据 “什么是大数据?” 2016年初 然后到了16年初,感觉机器学习突然间火起来了,突然间大数据的概念就被割裂出去了一部分,机器学习和数据挖掘这部分和算法强相关的内容一下子就不属于大数据这个概念了。 在那个时候,自己对大数据的理解分为三部分: 大数据运维:集群安装和维护 大数据开发(ETL方向):数据开发,比如数据清洗,实时数据处理 大数据开发(系统方向):数据系统开发,比如报表系统,推荐系统 2016 然后数据量一下暴增了,一天要处理的数据增到了百亿的级别,很多任务的数据量都超过了千亿,。下子问题就了,遇到了很多的挑战,比如数据倾斜、数据丢失、数据读写影响这些问题。 大规模数据的处理是一个非常的课题,但是这一点更偏向于是搞技术的。 我们在做大数据的时候也更应该有数据的理解,这里对数据的理解可能会和数据分析、数据挖掘有类似,但是又不同。

    85230发布于 2018-05-25
  • 数据同步最全避坑指南!4痛点+4场景技术方案

    数据湖仓一体、流批一体的背景下,数据同步作为数据流动越来越重要的一环。然而,数据同步听起来简单,做起来却处处是坑:业务急着要数据做决策,报表却迟迟出不来? 系统A和系统B的数据对不上,流程卡住,用户投诉?想搞实时同步提升体验,结果把核心数据库拖慢了?尤其在企业内部数据分析和业务流程流转等关键时刻,如果数据同步跟不上,问题就了。 (2)技术实现:全周期一致性方案通过将存量数据校验与增量同步并行处理,缩短数据切换时间,降低业务中断风险。4.资源消耗与扩展不足(1)痛点:流式同步技术在提升实时性的同时,对计算资源的需求大大增加。 误区 4:安全防护的合规性缺失敏感数据同步需满足分类分级要求,山东大数据局明确要求传输加密、脱敏处理与最小权限管控。工具应该内置敏感数据规则,并支持操作日志审计留存,确保符合监管要求。 3.流处理平台:实时化场景方案企业可以根据场景选择单一工具或组合方案:4.新一代统一架构:流批一体与湖仓融合理想的数据同步架构应该整合流批一体引擎(Flink)、湖仓存储层(Iceberg)与智能管控面

    59210编辑于 2025-09-22
  • 来自专栏云计算D1net

    数据时代 云安全4策略

    云计算与大数据的结合可以说是天作之合。大数据需要灵活的计算环境,而后者可以快速、自动地进行扩展以支持海量数据,基础设施。 4、对数据安全永不妥协 虽然云安全通常十分复杂,但是用户在大数据部署当中还是会发现一些“安全捷径”。这些“安全捷径”通常貌似能够回避一些复杂设置,同时保持大数据结构“不受伤害”。 并不是所有的大数据基础设施是安全的,如果处于风险当中的数据非常敏感或是属于管制数据,那么用户可能需要寻找替代方案。 多备份在给用户备份数据时自动把数据压缩加密并传到多个云端平台,采用3层加密安全保护体系使得数据安全达到最高。 总结 只有为数据建立了最为严格的安全标准,大数据才能够不断地享受着由云计算提供的可扩展性、灵活性和自动化。加密被认为是保护云()数据的首要步骤。

    1.3K70发布于 2018-03-21
  • 数据资产怎么管?关键在这4环节!

    我们可以利用数据发现工具或数据目录平台,自动连接到公司内部的各个数据库、数据仓库甚至文件存储。 2.核心是抓取“元数据”工具会自动采集“关于数据数据”,比如一个数据表叫什么、在哪里、包含哪些字段(这是技术元数据);每个字段在业务上代表什么,归哪个部门管(这是业务元数据)。 3.形成数据目录将所有采集到的元数据组织起来,形成一个可搜索的、统一的数据资产地图。想象一下,这就是你公司数据的“搜索引擎”。做完这一步,你就能快速回答:我们到底有没有“客户满意度评分”这个数据? 2.设计一致的数据模型在数据汇聚的层面,比如数据仓库里,按照商定好的标准来设计和整合数据,确保口径一致。3.理清数据血缘这一点非常关键。 它在数据开发与集成层面,能够非常清晰地记录和展示这种数据血缘关系。当我们通过它来设计和调度数据同步、数据处理任务时,这个血缘网络会自动生成,为我们后续的治理和排查工作打下了很好的基础。

    32310编辑于 2025-12-08
  • 来自专栏程序你好

    区块链4优势,与传统金融4短板

    现在很多人容易把区块链和比特币混为一谈,事实上,比特币只是区块链技术的一种小应用,只是借助了区块链基础技术架构开发的一种金融产品。 通俗地说,所有网络虚拟数字货币的交易过程都是去中心化的分布式网络账本,被记录的所有交易数据都可以在区块链各个节点上共享,各个数据终端通过加密合约彼此间相互链结。 技术的关键点在于所有节点都分散保存着一个账本,单一或部分节点无法单独篡改数据。 ? 在传统金融日系,都依赖于信用背书系统。 区块链技术的四优势表现在四个方面: 首先是免基础信任机制。 所有参与区块链交易节点都参与记录和验证,以及数据的维护。

    1.2K10发布于 2018-07-20
  • 来自专栏灯塔大数据

    4位专家解读2015数据技术进展

    ●可配置的store compression 存储的field,例如_source字段,可以使用默认的LZ4算法快速压缩,或者使用DEFLATE算法减少index size。 开发并贡献至开源社区。 2015年Kylin的主要发展都在Streaming OLAP上,为了支持低延迟的数据刷新,从整体的架构和设计上都做了相当的重新设计,目前已经可以支持从Kafka读取数据并进行聚合计算的能力,同时提供 ●2015年4月,亚马逊启动其机器学习平台Amazon Machine Learning,这是一项全面的托管服务,让开发者能够轻松使用历史数据开发并部署预测模型。 在Google、Amazon、Quora、Facebook等大公司的背后,都有一批数据科学专业人才,将大量数据变为可开发有价值的金矿。在大数据时代,数据科学家等分析人才的需求在激增。

    93870发布于 2018-04-10
  • 数据清洗,必须掌握的5解决方案+4步骤

    4)机器学习和人工智能:模型训练极度依赖数据质量,缺失值处理不当、异常值未识别、特征尺度差异巨大,都会导致模型性能低下甚至失效。数据清洗的效果直接影响模型的上限。 (3)错误数据:拼写错误、逻辑错误等。(4)异常值:超出正常范围的数据。(5)格式混乱:日期、数字、文本等格式不一致。(6)不一致数据:跨系统、跨表的数据存在差异。(7)冗余数据:不必要的重复信息。 下面我就通过数据清洗步骤,将FineDataLink的核心功能串联起来,直观展示它如何高效解决我们前面讨论的种种数据清洗痛点和效率问题。数据接入(1)登录FineDataLink,进入「数据开发」。 (4)将最终字符串转为DOUBLE类型。得到干净、可直接计算的数字型“利润_清洗”列。数据过滤设置过滤条件,筛选出符合特定条件的数据。例如,筛选出「订购日期」为2023年,「运货费」大于100的数据。 通过上述步骤,就能利用FineDataLink的可视化算子和功能,快速完成数据的清洗和处理,提高开发效率,无需编写复杂的SQL语句。

    45210编辑于 2025-09-26
  • 来自专栏日常记录。。。

    2024年企业软件定制开发必须了解的4趋势

    在目前竞争激烈的市场中,计划从零开始开发应用程序的企业越来越倾向于采用云原生开发策略。云原生应用使用微服务架构和持续集成/持续部署(CI/CD)的实践,因此能够实现快速部署和定期更新。 飞算科技作为新一代数字化技术服务商,基于中国原创技术和丰富的行业经验,已经累计服务八行业数百家企业与机构,帮助其实现突破,提升竞争力。 数据机器人和AI.Modeler建模机器人,覆盖业务系统化、数据开发及治理、应用数智化企业数字化转型全流程,应用于不同业务场景,全方位助力企业数字化转型。 以近期飞算科技为天禹数智定制化开发的全链路智能拓客系统—“销管家”为例,可以实现“全域获客”、“一键分销”、“私域激活”、“数据追踪”、“直播变现”及“业务管理”六功能。 截至目前已为包括医疗、金融、制造、零售等在内的八行业的上百家机构提供了技术服务,加速其数字化转型进程。

    59810编辑于 2023-11-22
  • 来自专栏机器学习/数据可视化

    MySQL必学4语言

    MySQL必学4种语言 本篇文章记录的是MySQL中常用的4种语言: DDL DDL,data defination language,指的是数据定义语言,其主要作用是创建数据库,对库表的结构进行删除和修改等操作 affected (0.01 sec) mysql> flush privileges; # 刷新权限 Query OK, 0 rows affected (0.00 sec) 注意:当在实际的开发项目中 :指定从哪里开始显示,显示多少行 简写:limit 5, 4:表示从第5行开始,显示4数据 select name, age from user limit 5; -- 只显示5行数据 select name, age from user limit 5 offset 4; -- 从第4(offset)行开始显示5(limit)行数据 select name, age from user limit 4, 5 ; -- 效果同上:逗号之前是offset的内容,逗号之后是limit内容 MySQL中的DQL应该是最常用的,请参考《MySQL经典50题》

    47540编辑于 2023-08-25
  • 来自专栏云头条

    4 亿、金融 IT

    套 3、原厂集成实施服务: 包括核心系统生产及同城灾备三点架构环境搭建,核心业务系统数据平滑迁移,同城灾备重构及切换演练,开发测试环境重构等原厂商集成实施服务 4、核心主机操作系统和开发工具升级服务,现有生产主机利旧至开发测试环境后 2022年5月24日,吉林省农村信用社联合社发布《2022年网络设备采购项目》竞争性谈判公告 预算金额:4655 万元 采购需求: 核心路由器4台,核心交换机4台,区域汇聚交换机32台,接入交换机118 台,4套SDN控制器等软硬件设备。 采购需求: 2022年5月17日,福建省农村信用社联合社发布《数据库存储(01)采购项目等六个项目》招标公告,预算 7693 万元。 2022年5月17日,福建省农村信用社联合社发布《数据库存储(02)采购项目等六个项目》招标公告,预算未公布。

    1.1K10编辑于 2022-06-02
  • 来自专栏Hello工控

    CAN总线4优点!!!

    规模化:CAN的广泛流行本身就是一个降低成本的因素,从控制器、收发器、线束——以及更间接相关的成本,如数据采集硬件、培训等。 易于访问 CAN总线提供了与所有网络ECUs通信的“单一入口点”——使得集中诊断、数据记录和配置成为可能。 这极大地简化了诊断工作,因为你不需要为每个节点单独收集数据。 静默CAN记录:特别是,可以在“静默模式”下进行CAN总线数据记录,确保设备完全不影响CAN总线——这对于例如诊断来说至关重要。 高效 CAN帧通过ID进行优先级排序,这样高优先级的数据就能立即获得总线访问权,而不会造成其他帧的中断或CAN错误。 仲裁:当多个CAN节点尝试同时传输数据时,具有最低CAN ID(最高优先级)的帧获胜,其余的则退避并重试。这避免了碰撞,并确保了安全关键消息的优先级。

    83110编辑于 2024-10-28
  • 来自专栏Java

    小米模型数据开发工程师-武汉

    小米模型数据开发工程师-武汉 我对于这个岗位的理解 结合这个职位的描述与网上的搜索,对于这个职位我的理解大概是这样的: 数据处理:需要使用各种工具(如SQL、Python、Hadoop等)来收集、清洗和处理数据 模型和大数据的行业前景理解 模型-理解 首先是对于模型的理解,最经典的就是chatgpt,PI AI,claude2, Bard,这些是市面上使用体验最好的语言模型,这也是我平日生活中工作学习必不可少的部分 就我自己学习和我们老师教学来看,我的理解是后端开发包含大数据开发,但是大数据开发不包含后端开发,也就是干后端开发的往往也可以干大数据开发,但是干大数据开发的很难转到后端开发,我们教学也是这样的,都显示教完 因此,Python常被用于数据分析和模型的构建,它的灵活性和易用性使得数据科学家和工程师能够更快速地进行原型设计和实现复杂的数据分析任务。 kafka\spark\ETL\maven\gradle 我们可以将模型数据开发想象成是一家大型的制造厂,而这些技术工具就是厂房中的各种设备。

    59610编辑于 2025-01-21
  • 来自专栏zzzz

    快大数据开发框架的构成模块

    快大数据开发框架的构成模块 大数据也不是近几年才出现的新东西,只是最近几年才真正意义上变得热门、火爆! 做大数据原生态开发且又推出商业发行版的,行业也就只有快搜索,可能在未来的三五年内也许还会有做大数据原生态开发的出现。 为何大数据的普及度不高,主要是由于大数据的应用开发太过偏向于底层,学习的难度不是一般的,所涉及到的技术面广太大,不是一般人所能够驾驭得了的。 快DKhadoop把大数据开发中的一些通用的,重复使用的基础代码、算法封装为类库,在很大程度上降低了开发的难度。相信这个对于从事开发的人员看了就更容易懂了。 下面,就给大家介绍看一下快的大数据开发框架的模块构成都有哪些: 快大数据一体化开发框架主要由六部分组成:数据源与SQL引擎、数据采集(自定义爬虫)模块、数据处理模块、机器学习算法、自然语言处理模块、

    90720发布于 2018-10-10
  • 来自专栏雪胖纸的玩蛇日常

    广告小程序后端开发4.导入地区数据

    1.将地区数据引入Area表: 1.uni-app自带的地址选择组件中,省、市、县的数组列表数据: 1.省级: [{ "label": "北京市", "value": "11" }, }, { "label": "北安市", "value": "231181" }, { "label": "五连池市 }, { "label": "天峻县", "value": "632823" }, { "label": "柴旦行政委员会 "680301" }], [{ "label": "路氹城", "value": "680401" }] ] ]  2.新建一个py文件执行,将三级数据融合为一个列表 : 1.新建执行一个py文件: sheng=省级数据 shi=市级数据 xian=县级数据 allarea=[] for i in sheng: # print(i["value"],i["label

    2.4K30发布于 2019-05-14
  • 来自专栏nginx

    SpringAI vs LangChain4j:Java生态模型应用开发终极对决

    《SpringAI vs LangChain4j:Java生态模型应用开发终极对决》 引言:Java在AI时代的重新定位 尽管Python主导了AI研究领域,但2024年JetBrains开发者调查报告显示 两Java生态框架的崛起尤为引人注目: SpringAI:依托Spring生态的完整企业级解决方案 LangChain4j:移植自Python生态的灵活开发框架 本文将从15个维度进行深度对比,并附可直接用于生产的代码示例 350 410 -12% 流式响应 2100 2400 +5% 第六章:选型决策指南 6.1 技术选型矩阵 需求场景 推荐框架 关键因素 传统Spring改造 SpringAI 无缝集成 快速原型开发 LangChain4j 灵活度高 复杂Agent系统 LangChain4j 模块化设计 高安全要求 SpringAI 企业级安全 6.2 混合架构建议 附录:开发者快速入门 SpringAI启动: /mvnw spring-boot:run LangChain4j示例: // 添加依赖 implementation 'dev.langchain4j:langchain4j-open-ai:0.25.0

    1.3K11编辑于 2025-11-16
  • 来自专栏王磊的博客

    ChatClient vs ChatModel:开发者必须知道的4区别!

    在 Spring AI/Spring AI Alibaba 框架中,ChatModel 和 ChatClient 都可以实现模型的文本生成功能,例如聊天机器人,但二者是两种不同层级的 API 封装,分别针对不同的开发场景和需求设计 但需要开发者手动处理提示词组装、响应解析、参数配置等细节,适合处理简单的模型交互场景。 ChatModel:若实现简单的模型对接场景使用 ChatModel。 本文已收录到我的技术小站 www.javacn.site,其中包含的内容有:Spring AI、LangChain4j、Dify、Spring AI Alibaba、AI Agent、MCP、Function Call、RAG、向量数据库、Prompt、多模态、向量数据库、嵌入模型等内容。

    69510编辑于 2025-06-20
  • 来自专栏大数据文摘

    数据路线|构建供应链金融的4步骤

    第一步:核心数据来源 无论是业务还是数据都需要有渠道来源,对于供应链金融而言,就必须选择一个核心企业,通过这类企业来获取核心的交易数据。这种企业有三类四标准。 第三、物流仓储平台 该类平台很早以前就是银行重点开发的核心企业。最早非常常见的供应链金融模式,即为仓单质押,这类业务特别需要物流仓储配合监控。 另外,企业的物流一般都需要第三方物流公司配合。 根据上述的简单介绍,这三类企业一般都符合以下四个标准: 1、在行业中属于龙头企业、风向标; 2、具有大量上下游企业; 3、具有稳定或有规律采购以及销售流水; 4、具有较高程度的系统化信息化。 财务数据,一般是指传统财务的三报表,资产负债表、利润表以及现金流量表。 在银行传统业务中,主要是通过财务数据对风险进行评估。 这种规则引擎模式的分析在支付宝的支付模型中有非常好的体现,例如支付宝在其风险模型中采用了六维度( 账户、设备、位置、行为、关系、偏好 ),在模型中采用了1万多条规则或策略,来判断支付行为是否有危险。

    2.3K90发布于 2018-05-21
  • 来自专栏胡琦

    聆思模型AI开发套件集成Coze调用GPT-4

    ❝上一篇《模型赋能开发板被这家公司玩明白了》 我们已经详细介绍了聆思模型 AI 开发套件以及聆思模型平台,并实操了基于LLM_control二次开发拓展了天气查询、中英互译的能力。 今天我们再来看看聆思模型 AI 开发套件如何通过Coze Bot 使用 GPT-4 。 整体思路 聆思模型AI开发套件集成Coze整体思路 首先,介绍几个关键点: Coze 国际版支持 GPT-4 能力,可以将 Bot 部署到 Discord; 借助 coze-discord-proxy 代理 Discord 对话Coze-Bot,实现API形式请求GPT4对话模型/微调模型; 利用 LSPlatform 应用编排中的 http-request 去调用 API 以及联接开发板。 (我们暂时没能编排实现接入coze-discord-proxy的流式返回) 聆思模型AI开发套件接入 Coze API 如同上一篇文章中的拓展开发,我们只需要将闲聊逻辑从调用内置星火认知模型改为调用

    90010编辑于 2025-05-20
  • 数据融合是什么?进行数据融合的4关键环节!

    (3)传感器:物联网设备中的传感器,如温度传感器、压力传感器、摄像头等,产生实时的、连续的数据流。(4)网络:通过网络爬虫从互联网上抓取的数据,如社交媒体数据、新闻资讯、用户评论等。 (3)图像数据:如产品图片、监控摄像头图像、医学影像等,需要通过计算机视觉技术进行处理和分析。(4)视频数据:如视频监控、在线教育视频、广告视频等,数据量大,处理难度较高。 不同的融合方法适用于不同的场景和需求,选择合适的方法是实现高效数据融合的关键。4.应用领域数据融合在许多领域都有广泛应用,包括商业智能和数据分析、医疗健康、智能城市、军事情报分析、环境监测等。 二、数据融合有哪些类型数据融合的目的是通过整合多样化的数据,提高数据的完整性、准确性和可用性,以支持更深入的分析、决策制定或应用开发。但数据融合并非单一模式,根据数据结构的特性,可以分为以下几类。 通过FineDataLink进行数据质量监控,能够让相关人员及时了解到数据质量的情况,进而采取相应的措施。4.协同合作与知识共享在数据融合过程中,不同团队或者部门之间需要进行有效的协同合作与知识共享。

    86410编辑于 2025-09-09
领券