首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Hank’s Blog

    3-5 处理缺失值

    > x <- c(1,NA,2,NA,3) > is.na(x) [1] FALSE TRUE FALSE TRUE FALSE > x[!is.na(x)] #找出不是缺失值 [1] 1 2 3 > x <- c(1,NA,2,NA,3) > y <- c("a","b",NA,"c",NA) > z <- complete.cases(x,y) #都不是缺失值的元素 > x[z] [1] 1 > y[z] [1] "a" > library(datasets) #import dat

    49610发布于 2020-09-16
  • 来自专栏NetCore 从壹开始

    3-5 安装CICD管理平台:Jenkins

    大家这里可以先安装gitlab工具,我就省事了,直接用gitee做源代码管理平台了。

    34721编辑于 2023-01-09
  • 来自专栏叽叽西

    lagou 爪哇 3-5 spring cloud (下) 笔记

    微服务监控之 Turbine 聚合监控 参考上⽂Hystrix部分 微服务监控之分布式链路追踪技术 Sleuth + Zipkin 分布式链路追踪技术适⽤场景(问题场景) 场景描述 为了⽀撑⽇益增⻓的庞⼤业务量 ,我们会使⽤微服务架构设计我们的系统,使得 我们的系统不仅能够通过集群部署抵挡流量的冲击,⼜能根据业务进⾏灵活的扩展。 Sentinel 分为两个部分: 核⼼:(Java 客户端)不依赖任何框架/,能够运⾏于所有 Java 运⾏时环 境,同时对 Dubbo / Spring Cloud 等框架也有较好的⽀持。 2)SCA实际上发展了三条线 第⼀条线:开源出来⼀些组件 第⼆条线:阿⾥内部维护了⼀个分⽀,⾃⼰业务线使⽤ 第三条线:阿⾥云平台部署⼀套,付费使⽤ 从战略上来说,SCA更是为了贴合阿⾥云。 数据配置 datasource: driver-class-name: com.mysql.cj.jdbc.Driver url: YOUR-URL username: YOUR-USER-NAME

    85820编辑于 2022-05-17
  • 来自专栏PHP实战技术

    3-5年的PHPer常见的面试题

    explain 等的使用 sphinx的中文分词词库使用第三方还是自己建? mysql与mysqli的区别有哪些? 将来的发展方向?安全、还是数据挖掘、大数据处理? php 处理大数据业务 linux 应用,负载性能查看 ? nginx设置缓存js、css、图片等信息,缓存的实现原理是? nginx负载均衡有哪些? 如果其中一台服务器挂掉,报警机制如何实现? nginx 实战优化业务功能 ? 谈一下近三年来你的得意之作? 看看简历,会问一些过去做的项目的用户量、pv、吞吐量、相关难点和解决方法等 数据设计经验,为什么进行分表? 分库? 什么是数据垂直拆分? 水平拆分? 分区等等?可以举例说明 数据优化有哪些? 分别需要注意什么? web开发方面会遇到哪些缓存? 分别如何优化? 为什么要对数据进行主从分离? 如何处理多服务器共享session? 一个10G的表,你用php程序统计某个字段出现的次数,思路是?

    1.6K100发布于 2018-03-09
  • 来自专栏cwl_Java

    C++编程之美-结构之法(代码清单3-5)

    代码清单3-5 void RecursiveSearch(int* number, int* answer, int index, int n) { if(index == n)

    27020编辑于 2022-11-30
  • 来自专栏陈黎栋的专栏啦

    图数据·业务总结·反欺诈

    通过融合企业和个人银行资金交易明细、通话、出行、住宿、工商、税务等信息构建初步的“资金账户-人-公司”关联知识图谱。同时从案件描述、笔录等非结构化文本中抽取人(受害人、嫌疑人、报案人)、事、物、组织、卡号、时间、地点等信息,链接并补充到原有的知识图谱中形成一个完整的证据链。辅助公安刑侦、经侦、银行进行案件线索侦查和挖掘同伙。比如银行和公安经侦监控资金账户,当有一段时间内有大量资金流动并集中到某个账户的时候很可能是非法集资,系统触发预警(图7)

    1.6K30发布于 2020-02-18
  • 来自专栏信息化漫谈

    如果数据down,业务多久恢复?

    数据是整个系统的核心,如果主用数据中断或故障,你的业务什么时间内能恢复? 一、数据是否必须做冗余? 墨菲定律,鸡蛋不能放在同一个篮子中。 数据是最重要的资产,出现单点故障确实不可避免,我们应提前做到数据备份,出现故障时能够快速恢复。 ? 对于4级的重要业务,至少每天全量+增量备份,RPO/RTO从小时到天级别。 对于5的关键业务,要求数据丢失不能超过30分钟,即RPO小于等于30分钟。并能够在分钟级别恢复业务,即RTO分钟级。 2、数据快速恢复解决方案(应尽量缩短RTO时间,也就是数据恢复的时间量) 原理:当主用数据中断时,能够通过快速切换数据,将业务切换到正常工作的数据上。 也可以采用第三方工具,如Zookeeper,通过检测数据的状态,当异常时向应用程序返回正常工作的数据IP地址。 3、大家一定会问第6级的业务如何恢复,仅靠标准公有云难以满足。

    1.2K20发布于 2019-09-24
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 3-5 Numpy数组(和矩阵)的基本操作

    shape 属性查看数组的维度,返回值是一个元组,元组中对应位置的值为数组中对应维度的元素个数。

    83410编辑于 2022-05-25
  • 来自专栏跟着官方文档学小程序开发

    第二章 小程序开发指南3-5

    在本章会介绍小程序的基本开发流程,结合前面章节的知识,完全可以独立完成一个体验很完善的小程序。为了让开发者更加了解小程序开发,在本章中还会通过常见的一些应用场景介绍小程序API的一些细节以及开发的一些技巧和注意事项。

    35010编辑于 2025-08-25
  • 来自专栏AI研习社

    未来 3-5 年内,哪个方向的机器学习人才最紧缺?

    所以以 3-5 年的跨度来看,这些工具依然会非常有用,甚至像 CNN 和 LSTM 之类的深度学习算法还在继续发展迭代当中。

    69860发布于 2018-03-19
  • 来自专栏杨建荣的学习笔记

    通过数据建模梳理数据业务

    以这个为出发点,我觉得很多DBA对于自己负责的数据业务其实是不了解的,比如这个数据数据量情况,数据变化情况,对象(表,索引)的分布情况,整体的SQL质量情况等,或者更高的一个要求,我们负责了100套数据业务 ,这些数据半天内产生了多少数据量,什么时候会是业务的高峰,什么时候相对会比较平稳,这些是我们应该了解的,但是显然这是我们忽视的。 所以通过这些数据可以得出一个初步的结论,这个数据是一个典型的TP业务,数据变更很频繁,算是一个偏TP层面的业务。 ? 再来看一个数据,这个数据的数据量不大,从两次的时间采集的数据来看,日志没有切换,更关键的,偏移量没有发生任何变化,所以通过这个层面来看,这很可能是一个僵尸业务,可以持续关注。 ? 再来看一个业务,这个数据的数据量比较大,有60多G,日志切换切换很频繁,数据量的增长相对较快,所以这很可能是一个密集型写入的日志业务。 ? 通过这些数据分析,就会得到一些有效的数据模型。

    91230发布于 2018-12-18
  • 为什么跨数据业务总是慢?

    说说跨用过Oracle和DB2这样的数据的朋友应该听过一次名词,叫DBLink。A的本地表和通过DBLink的B的进行关联,效果通常不太好(反正比本地查询慢,应该都有这个感觉。 (总数1万条)同根据A表逐条提交更新B表 完成耗时: 11217 ms同根据A表逐条提交更新B表 平均每条耗时: 22.43ms同根据A表批量提交更新B表 完成耗时: 669 ms同根据A表批量提交更新 这是数据本身刷脏机制决定的。批量就是比逐条提交快。那么跨数据呢?在一个数据上有A在另外一个数据上有B两个表根据A表的数据更新B表。以500条为测试样本。 (总数1万条)跨根据A表逐条提交更新C表 完成耗时: 18970 ms跨根据A表逐条提交更新C表 平均每条耗时: 37.94 ms跨根据A表批量提交更新C表 完成耗时: 9149 ms跨根据A表批量提交更新 如果车票的表和支付的表(或者说账户的表)不是一个数据。那么就是要从一个数据查到了,通过接口或者服务去另外一个数据更新。

    17910编辑于 2025-10-22
  • 来自专栏跟着asong学Golang

    Go业务开发中常用的几个开源

    最近总有一些初学Go语言的小伙伴问我在业务开发中一般都使用什么web框架、开源中间件;所以我总结了我在日常开发中使用到的,这些不一定是特别完美的,但是基本可以解决日常工作需求,接下来我们就来看一下。 大多数日志基本都是基于反射的序列化和字符串格式化的,这样会导致在日志上占用大量CPU资源,不适用于业务开发场景,业务对性能敏感还是挺高的。 github地址:https://github.com/uber-go/zap jsoniter 做业务开发离不开json的序列化与反序列化,标准虽然提供了encoding/json,但是它主要是通过反射来实现的 ants也是国人开发的,设计博文写的也很详细的,目前很多大厂也都在使用ants,经历过线上业务检验的,所以可以放心使用。 总结 本文列举的几个都是经常被使用的开源,这几个你都掌握了,基本的业务开发都没有啥问题了,一些初学者完全可以通过这几个达到入门水平。

    1.2K20编辑于 2022-07-11
  • 来自专栏大数据,java,Python和前端

    Maxwell采集MySQL Binlog业务数据同步方案

    简介: 针对业务MySQL Binlog日志数据进行数据同步,从MySQL到Kafka,最终实现实时(准实时)数据采集。 产品目标完成实时数据采集,拉取业务数据数据。 建立maxwell表,存储捕获到的schema等信息。 值可以为具体的数据、数据表、数据列,甚至可以用JS来定义复杂的过滤规则,也可以用正则表达式描述。如:# 仅匹配foodb数据的tbl表和所有table_数字的表。 /table_\d+/’# 排除所有所有表,仅匹配db1数据--filter=’exclude:.

    77210编辑于 2025-07-21
  • 通过 YashanDB 数据提升业务决策能力

    要通过 YashanDB 数据提升业务决策能力,首先需要理解数据如何在数据存储、分析和提取过程中支持决策。以下是一些具体的方法:1. 数据整合与集中化YashanDB能够有效整合多种数据源。 通过将各类业务数据(如销售数据、客户数据、财务数据等)统一存储在一个平台上,能够提供一个全面的视角,帮助决策者更好地理解各个部门和业务的现状。 通过高效的查询语言和分析工具,业务分析师可以快速对数据进行切割和处理,从而更好地理解市场趋势、客户行为和产品表现等关键业务领域。 优化运营和流程通过对运营数据的分析,能够识别出业务流程中的瓶颈或不必要的步骤,从而优化业务流程和提高效率。例如,通过数据分析发现生产过程中的延迟问题,可以采取措施加以改善。 - 提高效率:实时追踪和调整业务流程,确保每一环节的顺畅进行。总结通过YashanDB数据,企业可以获得更高效、更精准的数据处理与分析能力,进而做出更为科学、数据驱动的决策。

    18110编辑于 2025-10-05
  • 来自专栏云计算linux

    电子书城数据分析业务

    数据设计说明 1. t_user 用户表 表名列名 数据类型(精度范围) 空/非空 约束条件 其他说明 id int 非空 种子,自增1 用户唯一标识 name Varchar(20) 非空 帐号

    28710编辑于 2024-12-19
  • 来自专栏韩曙亮的移动开发专栏

    【Android 逆向】Android 进程注入工具开发 ( 远程进程注入动态文件操作 | 注入动态 加载 业务动态 | 业务动态启动 | pthread_create 线程开发 )

    文章目录 前言 一、加载 libnattive.so 动态 二、 libnattive.so 动态启动 三、 pthread_create 线程开发 四、 线程执行函数 前言 libbridge.so 动态是 注入工具 使用 ptrace 函数强行向远程进程 注入的 动态 , 这种方法侵入性极大 , 会破坏远程进程的运行环境 , 因此该动态越简洁越好 ; 注入动态 就执行一个操作 , 就是加载 包含真正的逆向业务逻辑的 libnattive.so 动态 , 然后启动该动态即可 , 执行完毕后 , 马上在远程进程中销毁注入的 libbridge.so 动态 ; 一、加载 libnattive.so 动态 ---- 通过 注入工具 , 将 libbridge.so 注入到远程进程 后 , 远程进程中 , 会 为 libbridge.so 动态分配一块内存 , 并将其运行起来 ; libbridge.so 动态的主要操作是 加载 libnattive.so 动态 , 并执行该动态的 invoke 方法 ; libbridge.so 动态对应的 bridge.c 源码如下 : #include <

    1.4K20编辑于 2023-03-29
  • YashanDB面向业务的数据性能优化策略

    如何优化数据查询速度是提升业务系统响应能力和用户体验的关键问题。高效的查询不仅降低系统资源消耗,还能支撑复杂业务逻辑的实时处理。 YashanDB作为面向多种业务场景设计的数据系统,通过多层面技术架构和丰富的优化机制,为业务提供稳定且高性能的数据处理能力。 不同部署架构结合业务特点和资源条件,合理挑选适配架构,成为数据性能优化的基础。 根据业务需求选择同步或异步复制,平衡业务性能和数据一致性。备份策略:支持全备份及分级增量备份,建议结合业务低峰期进行备份,减少对在线性能影响。 建议数据管理员和开发人员深入理解YashanDB核心技术原理,基于业务特点灵活应用上述优化策略,持续监控并调优数据参数与执行计划,以实现数据性能的持续提升和业务价值最大化。

    30310编辑于 2025-08-20
  • 如何高效部署YashanDB数据实现业务优化

    现代业务系统对数据的性能和稳定性提出了严格要求,但在实际应用中,系统往往面临性能瓶颈、数据一致性维护复杂以及扩展能力不足等挑战。 本文将基于YashanDB体系架构,深入解析其核心技术及部署优化方法,帮助开发人员和数据管理员提升业务性能和系统可用性。 主备复制和故障切换主备复制通过redo日志传输实现主库与备数据同步,支持同步与异步复制模式。支持Switchover计划内切换和Failover故障切换,确保业务连续性。 通过合理利用存储结构、多版本并发控制、分布式并行执行及高可用复制机制,用户可有效提升数据性能与稳定性。 建议数据开发和运维团队深入理解并实践本文方法,在项目环境中实施索引设计优化、合理调整并行度及存储参数,并结合高可用架构保障业务持续性,实现系统的整体业务优化。

    23310编辑于 2025-10-02
  • 来自专栏iOS逆向与安全

    写作小技能:卡片式写文章(用3-5张卡片写文)

    挑战->核心概念->该怎么做->总结->升华 找到1张卡做大的核心概念 找到3-5张卡做子概念的内容 把这些卡片的“行动指引”总结下,列在最后做个行动指引大全。 .… 用3-5张卡片写文是个很好的体验:1.主题是自下而上生成,而不是逼你针对命题写一个。2. 内容是过去知识卡片的积累,而不是临时写一句,出去找一段儿。3. apns的payload中携带了需要合成的文本内容,通过离线语音合成生成wav音频文件后,将文件写到AppGroups的Library/Sounds文件夹下,最后更改UNNotificationSound

    1.5K10编辑于 2022-08-22
领券