搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏Android点滴分享
Camera2 采集
本篇介绍 Camera2相比Camera1，使用起来要复杂一些，不过也节省了一些逻辑，比如可以自动处理角度问题。本篇就按照流程介绍下Camera2的简单使用，更多细节会后续介绍。使用Camera2 申请权限静态申请: <uses-permission android:name="android.permission.CAMERA" /> 动态申请: if (ContextCompat.checkSelfPermission
84930编辑于 2022-10-25
来自专栏Java架构师必看
数据运营平台-数据采集
今天说一说数据运营平台-数据采集[通俗易懂],希望能够帮助大家进步!!! 目录行为数据采集业务数据采集与转换第三方系统API对接用户数据关联人工数据采集数据输出 ---- 行为数据采集 1.埋点采集 ①跨平台打通确定性方法识别利用用户帐号体系中，可以是系统生成的业务数据采集与转换大数据平台的数据来源广泛，根据来源，大致分为两类： 1)内部 a)手工填报 b)流+实时数据采集 c)批量 2)外部 a)文件导入 b)网络爬虫 c)对外接口服务根据以上分类提供以下方案 2、批量数据采集转换批量数据采集有多种方案，比如通过开源组件sqoop、kettle等，或者通过阿里的DataX离线同步服务完成。批量数据的执行周期可自写定时任务，也可利用工具自带定时机制完成。 2、对接方案 1）对接方式平台与外部系统对接方式多以web service方式。
6K31编辑于 2022-07-06
来自专栏全栈程序员必看
基于kettle的数据采集平台
平台开发目的是设计一个通用的数据采集、解析、处理、装载、调度、监控的通用数据采集平台。平台具有业务无关性，涉及到具体的业务数据处理时候需要特殊处理，动态加载到框架中，达到通用的目的。
68720编辑于 2022-06-28
来自专栏阿年的数据梦
数仓日记 - 数据采集平台
事件日志格式及字段含义 2. 启动日志格式及字段含义 3. 说明二、采集平台准备 1. 框架版本选型 2. 集群部署规划 3. 数据流程图三、用户行为数据采集模块 1. 采集通道启动/停止脚本四、业务数据采集模块 1. MySQL安装 2. Sqoop安装 3. 业务数据生成 4. 业务数据导入HDFS • 项目经验 5. logcollector-1.0-SNAPSHOT.jar logcollector-1.0-SNAPSHOT-jar-with-dependencies.jar 二、采集平台准备 1. 框架版本选型 2. 集群部署规划 3. 数据流程图三、用户行为数据采集模块 1. 采集通道启动/停止脚本 zookeeper集群启动脚本：zk.sh flume采集集群启动脚本：f1.sh Kafka集群启动脚本：kf.sh flume消费集群启动脚本：f2.sh #!
3.2K20编辑于 2022-11-18
来自专栏machh的专栏
Windows平台音频采集技术介绍
音频处理的相关技术：采集麦克风输入采集声卡输出将音频数据送入声卡进行播放对多路音频输入进行混音处理在Windows操作系统上，音频处理技术主要是采用微软提供的相关API：Wave系列API函数主要是用来实现对麦克风输入的采集（使用WaveIn系列API函数）和控制声音的播放（使用后WaveOut系列函数）。支持XP及之后的Windows系统，支持麦克风输入的采集和控制声音的播放，不支持声卡的采集。 DirectSound 可实现多个声音的混合播放。 2. 提高可靠性 ( 将很多音频函数从核心态移到了用户态 ) 3. 提高了安全性（在安全的，低优先级别的线程处理被保护的音频内容） 4. 2. EndpointVolume API 使客户端程序能够操作音频终端设备。 3.
2.1K10编辑于 2022-06-10
来自专栏全栈程序员必看
基于spark的数据采集平台
数据采集平台管理端 https://github.com/zhaoyachao/zdh_web 数据采集平台服务 https://github.com/zhaoyachao/zdh_server web 端在线查看 http://zycblog.cn:8081/login 用户名：zyc 密码：123456 界面只是为了参考功能,底层的数据采集服务需要自己下载zdh_server 部署,服务器资源有限平台介绍数据采集,处理,监控,调度,管理一体化平台具体介绍请看github连接中的readme 文档 # 数据采集,处理,监控,调度,管理一体化平台 # 提示 zdh 分2部分,前端配置 hadoop,hive 可选择部署) # 下载修改基础配置打开resources/application-dev.properties 1 修改服务器端口默认8081 2 sql脚本db.sql 依赖 1 必须提前安装redis # 下载编译好的包 1 找到项目目录下的release 目录直接将release 目录拷贝 2
96210编辑于 2022-06-28
来自专栏程序猿的大杂烩
大数据平台 - 数据采集及治理
数据采集介绍 ETL基本上就是数据采集的代表，包括数据的提取（Extract）、转换（Transform）和加载（Load）。数据源是整个大数据平台的上游，数据采集是数据源与数仓之间的管道。常见的三个数据采集场景：场景1：从支持FTP、SFTP、 HTTP等协议的数据源获取数据场景2：从业务数据库获取数据，数据采集录入后需支撑业务系统场景3：数据源通过Kafka等消息队列，需要实时采集数据数据采集系统需求：数据源管理与状态监控定时、实时、全量、增量等多模式的数据采集及任务监控元数据管理、数据补采及数据归档 ---- 常用数据采集工具 Sqoop Sqoop是常用的关系数据库与HDFS rows selected (0.131 seconds) 0: jdbc:hive2://localhost:10000> ---- 数据治理简介将数据采集到数仓后所面临的问题：相比传统数仓大数据时代数据更加多样数据采集及处理流程中产生的元数据纳入数据治理平台，并建立血缘关系提供数据管理的服务接口，数据模型变更及时通知上下游 ---- Apache Atlas数据治理常见的数据治理工具： Apache Atlas
4.2K11发布于 2020-11-16
来自专栏Sun
大数据平台之binlog采集方案
1、背景大数据平台的采集功能是从外部数据源采集数据存储到hive，采集方式分为全量采集、增量采集，增量采集适用于数据规模较大情况，有很多使用场景，但是在增量采集时，平台只能感知数据新增、更新大数据平台针对mysql的处理方案流程如图1所示。 222.drawio (2).png 方案整体流程主要是通过记录binlog水位，从水位处拉取binlog数据并提取出对应的SQL，然后将SQL应用到存量hive数据上，首次采集时因为水位不存在会通过因为漏数据是无法容忍的，因此平台选择1，为了避免重复的SQL操作，平台增加了约束：采集的mysql表需要包含主键或唯一键，这个约束正常情况下都是完全可以满足的。 ,66df243d406353d0e9db6c5dd027d2d6,"20002","name2",12 UPDATE,9cdf26568d166bc6793ef8da5afa0846,"10007",
1.8K30发布于 2021-11-23
来自专栏斑斓
剖析大数据平台的数据采集
数据采集的设计，几乎完全取决于数据源的特性，毕竟数据源是整个大数据平台蓄水的上游，数据采集不过是获取水源的管道罢了。但是在大数据平台下，由于数据源具有更复杂的多样性，数据采集的形式也变得更加复杂而多样，当然，业务场景也可能变得迥然不同。下图展现了大数据平台比较典型的数据采集架构： ? 在这种场景下，数据采集就仅仅是一个简单的同步，无需执行转换。场景2：数据源已经写入Kafka，需要实时采集数据。为了更高效地完成数据采集，通常我们需要将整个流程切分成多个阶段，在细分的阶段中可以采用并行执行的方式。在这个过程中，可能牵涉到Job的创建、提交与分发，采集流程的规划，数据格式的转换等。除此之外，在保证数据采集的高性能之外，还要考虑数据丢失的容错。
1.8K40发布于 2018-03-07
来自专栏全栈程序员必看
大数据：数据采集平台之Fluentd
大数据：数据采集平台之Fluentd ---- Apache Flume 详情请看文章：《大数据：数据采集平台之Apache Flume》 Fluentd 详情请看文章：《大数据：数据采集平台之 Fluentd》 Logstash 详情请看文章：《大数据：数据采集平台之Logstash》 Apache Chukwa 详情请看文章：《大数据：数据采集平台之Apache Chukwa 》 Scribe 详情请看文章：《大数据：数据采集平台之Scribe 》 Splunk Forwarder 详情请看文章：《大数据：数据采集平台之Splunk Forwarder》 Fluentd从各方面看都很像Flume，区别是使用Ruby开发，Footprint会小一些，但是也带来了跨平台的问题，并不能支持Windows平台。
75120编辑于 2022-08-14
来自专栏葡萄城控件技术团队
实战分享 | 金融数据采集报送平台实践
对企业数据系统来说，数据采集填报、报表设计、校验审核、汇总上报等功能是非常常见的需求，也是业务用户使用频率最高的功能模块。本周我们有幸邀请到葡萄城的深度合作客户——杭州明佑电子有限公司（简称明佑电子）开发部经理杨颖，从银行业背景和业务痛点出发，分享他们对于银行业数据采集报送领域的实践经验，分析、解决以上提到的痛点问题。 SpreadJS 实现在线导入Excel自定义报表 https://mp.weixin.qq.com/s/IbN6ljTBHGxcg-lfjt_yxw 【客户故事】希施玛数据科技 – 金融大数据处理实验实训教学平台
1.1K40编辑于 2023-02-10
来自专栏全栈程序员必看
大数据：数据采集平台之Apache Flume
大数据：数据采集平台之Apache Flume ---- Apache Flume 详情请看文章：《大数据：数据采集平台之Apache Flume》 Fluentd 详情请看文章：《大数据：数据采集平台之Fluentd》 Logstash 详情请看文章：《大数据：数据采集平台之Logstash》 Apache Chukwa 详情请看文章：《大数据：数据采集平台之Apache Chukwa 》 Scribe 详情请看文章：《大数据：数据采集平台之Scribe 》 Splunk Forwarder 详情请看文章：《大数据：数据采集平台之Splunk Forwarder 》 ---- 官网： https://flume.apache.org/ Flume 是Apache旗下的一款开源、高可靠、高扩展、容易管理、支持客户扩展的数据采集系统。
70420编辑于 2022-06-28
来自专栏爬虫资料
面向教育平台的分层内容采集思路
更可行的方式是设计一个分层次的采集流程，逐级深入，既能减少资源浪费，又能适应平台的动态变化。二、思路图谱下面用一张树状结构图来概括整个方案：教育平台内容分层采集方案│├── 网络接入│ ├── 使用代理服务│ ├── 用户模拟切换│ └── 请求频率控制│├── 抓取逻辑│ ├ ─ 增量更新机制│ └── 定期调度任务│└── 监控与优化 ├── 日志与监控 ├── 失败重试 └── 代理池健康度管理三、示例代码下面给出一个简化示例，展示如何代理服务分层采集教育类平台的目录和课程信息分层采集思路：先拿到分类，再进入课程页面，最后细化到具体单元。可根据平台情况扩展到动态渲染场景。四、总结教育类平台的内容采集，必须考虑到层级化结构、频繁更新、多终端分布和访问限制。采用分层次的采集思路，可以在保证效率的同时降低风险，并更好地适应教育平台未来的演进方向。这种方案不仅适合教育类平台，也能够迁移到资讯网站、视频平台、知识型社区等场景中。
24710编辑于 2025-09-03
来自专栏运维监控日志分析
可视化日志采集分析平台建设方案
网站用户行为分析，对Nginx 访问的 URL 、地区分布、终端类型、延迟等参数进行采集分析展示。所以决定使用ELK+Filebeat的架构进行平台搭建。最终，采用Elasticsearch+ Logstash+ Kibana+ Filebeat+ Kafka+ Zookeeper+ Zabbix+ Grafana 的架构构建日志采集分析平台。 2.架构分析第一层、数据采集层，数据缓存层在业务应用服务器安装 filebeat 做日志采集，同时filebeat将采集的日志转送至kafka/zookeeper集群。 Grafana Grafana是一款用go语言开发的跨平台的开源度量分析和可视化工具，可以通过将采集的数据进行查询监控可视化的展示。
5.4K44发布于 2020-05-15
来自专栏chaplinthink的专栏
大数据平台如何实现任务日志采集
背景平台任务主要分3种: flink实时任务, spark任务,还有java任务,spark、flink 我们是运行在yarn 上, 日常排错我们通过查看yarn logs来定位, 但是会对日志存储设置一定的保留时间 jar,排除其它日志框架引入采集架构设计通过log4j appender 将采集的日志发送到接收中心,这里注意搞个buffer,通过http批量发送到接收中心,日志太小过滤掉. 进行简单的清洗转换后将数据sink到es中用户通过界面根据各种条件如applicationId、时间、不同角色节点筛选,搜索到对应日志总结本文主要介绍了下基于log4j 自定义appender,实现了大数据平台相关任务日志的采集 ,针对不同类型任务的处理,获取最终我们平台搜索需要的功能. 日志采集注意采集量过猛可能会将磁盘打满,需要有相应的降级或者预防措施,用户不会考虑太多关于平台相关的东西. 大数据平台技术目前各大公司很多技术架构都差不多,就看细节的处理了.
68810编辑于 2021-12-30
来自专栏全栈程序员必看
大数据采集平台之ZDH_SERVER部署
目录项目源码下载源码打包部署运行 ---- 项目源码数据采集平台管理端 https://github.com/zhaoyachao/zdh_web 数据采集平台服务 https://github.com /zhaoyachao/zdh_server web端在线查看 http://zycblog.cn:8081/login 用户名：zyc 密码：123456 界面只是为了参考功能,底层的数据采集服务需要自己下载 mysql8或者mariadb10.2.14+ git:选择性安装看个人需要下载源码 1 http下载：https://github.com/zhaoyachao/zdh_server.git 2 /gradlew release -x test 部署 1：先安装 2.4.4 版本spark,这里不具体介绍spark 安装 2：修改release/bin 目录下的start_server.sh
64620编辑于 2022-06-28
Rokid AR 平台多媒体采集技术全景解析
也正因此，Rokid AR Platform推出了一体化多媒体采集SDK，更让“空间计算”从概念走向落地。接下来，让我们从多媒体采集（拍照、录音、录像）技术板块入手，带大家拆解这套让AR眼镜实现“眼观六路、耳听八方”的隐形工具链。每次“开火”先在 SD 卡预分配 2 GB 连续块，剩余空间不足 2 GB 直接返回 FAILED，不会“先录一半再报错”，避免关键场景掉链子。5. 2. 、五、总结：用代码打开“空间记忆”Rokid AR 平台通过一体化多媒体采集 SDK，围绕 “延伸感官” 需求实现了 “空间计算” 落地，其核心技术涵盖三大拍照途径（单机功能键盲拍、AI 场景拍照、唤起相机拍照
69210编辑于 2025-10-14
来自专栏全栈程序员必看
大数据采集平台ZDH_WEB安装部署
目录项目源码 WEB端安装 2 下载源码 3 打包 4 创建数据库 5 修改release 包下conf 相关配置 6 运行 ---- 项目源码数据采集平台管理端 https://github.com /zhaoyachao/zdh_web 数据采集平台服务 https://github.com/zhaoyachao/zdh_server web端在线查看 http://zycblog.cn:8081 /login 用户名：zyc 密码：123456 界面只是为了参考功能,底层的数据采集服务需要自己下载zdh_server 部署,服务器资源有限,请手下留情如果觉得项目不错记得分享给同伴和点star WEB端安装 1 基础构建环境 maven:3.5.4+ jdk:jdk8 reids:4.0+ mysql8或者mariadb10.2.14+ git:选择性安装看个人需要 2 下载源码 http mysql.sql 登陆msyql ,执行mysql.sql 脚本 source xxxx/mysql_xxx.sql 5 修改release 包下conf 相关配置 1 数据库连接修改 2
56140编辑于 2022-08-14
来自专栏JVMGC
KnowAgent 一站式日志采集平台
KnowAgent 一站式日志采集平台阅读本文档，您可以了解到 KnowAgent 的用户群体、产品定位等信息，并通过体验地址，快速体验以应用为采集粒度，从应用维度批量下发采集任务全流程。 1.1.2 容器采集 KnowAgent目前对容器日志采集未实现平台化支持，未来将提供全面的容器日志采集平台化支持，参见《KnowAgent一站式日志采集平台介绍》展望部分。 Agent 启动后，将携带宿主机信息自动向管理平台进行注册，注册成功后，即可对其进行管理。采集任务管理：维护采集任务相关信息，查看采集任务健康度与故障原因（健康度为黄或红时显示故障原因）。 1.4 核心优势一站式日志采集方案高可靠、高性能、具备全方位可观测性的采集引擎，与面向应用的易管控、易观测、易治理的管理平台，大幅降低日志数据采集接入成本，大幅提升日志数据采集接入效率。 Agent Manager：是针对 Agent 的管理平台。用于管理相关元数据、Agent与采集任务，自动巡检 Agent 与采集任务的健康度、故障诊断，指标展示。
2.1K30编辑于 2023-03-10
精准化数据采集与数据标注平台的设计
在AI时代，数据就是新的石油，而精准的数据采集和标注则是炼油厂。今天我们来聊聊如何构建一个既高效又可靠的数据平台。 1. 2. 数据采集平台设计 2.1 采集架构总览 2.2 多源数据采集策略 Web数据采集支持静态页面和SPA应用反反爬虫机制（代理池、请求头轮换、验证码识别）增量采集和全量采集模式 API数据采集 RESTful 总结与展望 7.1 平台价值构建精准化数据采集与标注平台，能够带来以下核心价值：效率提升自动化采集提升数据获取效率10倍智能标注工具提升标注效率3-5倍质量控制减少返工率80% 成本节约减少人工标注成本关键词：数据采集平台、数据标注、平台架构、AI数据处理、质量控制、智能标注
1.7K10编辑于 2025-07-20

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

Camera2 采集

数据运营平台-数据采集

基于kettle的数据采集平台

数仓日记 - 数据采集平台

Windows平台音频采集技术介绍

基于spark的数据采集平台

大数据平台 - 数据采集及治理

大数据平台之binlog采集方案

剖析大数据平台的数据采集

大数据：数据采集平台之Fluentd

实战分享 | 金融数据采集报送平台实践

大数据：数据采集平台之Apache Flume

面向教育平台的分层内容采集思路

可视化日志采集分析平台建设方案

大数据平台如何实现任务日志采集

大数据采集平台之ZDH_SERVER部署

Rokid AR 平台多媒体采集技术全景解析

大数据采集平台ZDH_WEB安装部署

KnowAgent 一站式日志采集平台

精准化数据采集与数据标注平台的设计

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐