搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

金融数据治理新范式：如何用算子级血缘与主动元数据 10分钟定位 EAST 报送异常？
本文探讨如何通过基于AST深度解析的算子级血缘（>99%准确率）与主动元数据能力，结合行级裁剪与实时监控，将异常定位从“天”级缩短至“分钟”级，实现从事后“救火”到事中“防火”的数据治理与DataOps 三、新范式：基于算子级血缘的主动根因定位以 Aloudata BIG 为代表的主动元数据平台，通过 >99% 解析准确率的算子级血缘为基座，结合主动监控与智能分析，从根本上改变了游戏规则。1. 主动监控与智能关联：从被动响应到主动预警主动元数据能力体现在：实时监控：任务调度状态、数据产出时效、关键表的数据质量规则。五、实施建议：构建主动数据风险防控体系企业可遵循以下三步路径，在 EAST 等关键场景中快速落地主动元数据能力：基座先行：优先接入核心数仓（Hive, Oracle, GaussDB）、ETL/ELT 二是链路覆盖：初步构建起关键业务数据（如 EAST 相关数据）的端到端血缘图谱。三是流程配合：将主动元数据平台的预警与定位能力，与运维值班、数据研发团队的处置流程相结合，形成闭环。
16510编辑于 2026-02-03
来自专栏用户8015575的专栏
win10如何主动关闭显示器 win10显示器怎么主动关闭
win10如何主动关闭显示器，下面与大家分享关闭显示器win10的教程。品牌型号：联想GeekPro 2020 系统：win10 1909 64位企业版部分用户可能电脑型号不一样，但系统版本一致都适合该方法。 1第一步右键点击左下角的微软图标，点击电源选项 2第二步把屏幕关闭时间设置为1分钟，电脑停止操作一分钟即可关闭屏幕好了，以上就是关于win10关闭显示器的内容，希望对大家有所帮助。
2K30发布于 2020-12-17
来自专栏科学计算
10 元编程
元编程什么是元编程维基百科上的解释为：元编程（英语：Metaprogramming），又译超编程，是指某类计算机程序的编写，这类计算机程序编写或者操纵其它程序（或者自身）作为它们的资料，或者在运行时完成部分本应在编译时完成的工作知乎上有一个关于元编程的解释是比较直观的。比如 meta-knowledge 就是「关于知识本身的知识」，meta-data 就是「关于数据的数据」，meta-language 就是「关于语言的语言」，而 meta-programming 也是由此而来」 —— 这是关于前面那条数据的数据。 val end end @tid map(x->x^2, 1:10000) @which @which 1+2 @which sleep(2) @show x = rand(10
1.1K20发布于 2020-06-30
致数仓架构师：别再用 Excel 维护数据字典，主动元数据才是正解
Gartner等权威机构已明确指出，主动元数据是数据管理现代化的核心。二、核心差异对比：传统工具vs主动元数据平台Excel和传统血缘工具（表级/列级）在解析精度、颗粒度和管理模式上存在根本性缺陷，而基于算子级血缘的主动元数据平台实现了从“依赖关系”到“加工逻辑理解”的质变 2.主动风险防控vs事后救火传统模式：上游表结构或逻辑变更后，无法精准评估影响，常导致下游报表错误，每次上线如履薄冰。主动元数据模式：构建“事前事中变更协作机制”。六、常见问题(FAQ)Q1:我们数仓里有大量存储过程和复杂嵌套SQL，主动元数据平台能准确解析吗？可以。 Q3:除了金融行业，其他行业的数仓治理也适用主动元数据吗？完全适用。“看不清依赖链路”是各行业数仓的共性痛点。
6410编辑于 2026-04-16
数据治理新解法：基于算子级血缘的主动元数据如何破解数仓重构难题？
文章结合招商银行、浙江农商联合银行等标杆案例，展示了主动元数据平台在自动化盘点、DataOps协同及模型治理等场景下的落地路径与量化价值。管理模式被动、静态的元数据管理。仅记录数据结构的静态快照，缺乏对数据流动、加工逻辑和变更影响的实时感知与主动干预能力，与 DataOps 所要求的自动化、协同化严重脱节。四、落地路径：从“看清”到“管好”的四步实践借助主动元数据平台，企业可以构建一套闭环的数据管理能力，让数仓重构从临时的“运动式”项目，转变为可持续的“常态化”机制。五、价值验证：标杆客户如何用“手术刀”完成高难度重构金融行业头部客户的实践，为算子级血缘与主动元数据的价值提供了最有力的量化证明。主动元数据驱动治理闭环：从自动化盘点、主动风控到模型治理、DataOps协同，构建了可持续的、常态化的数据管理能力。
18310编辑于 2026-02-12
来自专栏三流程序员的挣扎
2022-10-10-享元模式
享元模式池中共享对象，减少对象创建，减小 OOM 机率。比如 Android 从 xml 构建 View 时的构造器。Map 保存对象，有就拿出来用，没有再创建存到 Map 中去。 // 抽象的享元类 public abstract class Flyweight { //内部状态 private String intrinsic; //外部状态，final 不许子类修改 protected final String Extrinsic; //要求享元角色必须接受外部状态。 } //定义业务操作 public abstract void operate(); //内部状态的getter/setter } // 具体的享元类虽然可以使用享元模式可以实现对象池，但是这两者还是有比较大的差异，对象池着重在对象的复用上，池中的每个对象是可替换的，从同一个池中获得 A对象和 B 对象对客户端来说是完全相同的，它主要解决复用，而享元模式在主要解决的对象的共享问题
27310编辑于 2022-10-25
一行代码改崩 20 张报表：主动元数据如何实现「事前感知」？
本文将深入剖析这一问题的根源，并介绍如何通过算子级血缘和主动元数据技术，实现变更风险的“事前感知”与精准防控。、主动风险防控三、新范式：以算子级血缘为基石的主动风险防控破解困局的关键在于将元数据从“被动记录”升级为“主动驱动”。事中（调度执行）：与调度系统集成，实时监控与拦截生产环境的元数据异常变更。事后（故障排查）：基于精准血缘图谱快速定位数据异常根因，将排查时间从“小时级”缩短至“分钟级”。四、落地路径：四步构建主动管控体系企业可以遵循以下路径，逐步构建主动式数据变更管控体系：连接与解析：对接 Hive、Spark、Oracle、DB2、GaussDB 等全域数据平台，自动采集 SQL 与全面推广与优化：将试点经验推广至更多业务线，并利用平台的主动模型治理能力，持续优化链路过长、重复计算等问题。
10310编辑于 2026-03-27
来自专栏DeepHub IMBA
细胞图像数据的主动学习
主动学习是机器学习中的一种方法，它提供了一个框架，根据模型已经看到的标记数据对未标记的数据样本进行优先排序。如果想细胞成像的分割和分类等技术是一个快速发展的领域研究。使用主动学习——展示一个模拟使用主动学习和不使用主动学习的对比实验。细胞图像预处理我们将使用在MIT许可的血细胞图像数据集（GitHub和Kaggle）。主动学习我们现在已经有了训练需要的搜有数据，现在可以开始试验使用主动学习策略是否可以通过更少的数据标记获得更高的准确性。如果我们使用所有数据，那么它们最终分数是相同的，但是我们的研究目的是在少量标注数据的前提下训练，所以只使用了数据集中的300个随机样本。总结本文展示了将主动学习用于细胞成像任务的好处。 Genome biology, 7(10), 1–11. Stirling, D. R., Swain-Bowden, M. J., Lucas, A. M., Carpenter, A.
76020编辑于 2022-11-11
来自专栏数据派THU
细胞图像数据的主动学习
来源：DeepHub IMBA本文约4000字，建议阅读10+分钟本文介绍一种对红细胞和白细胞图像分类任务的主动学习端到端工作流程。通过细胞图像的标签对模型性能的影响，为数据设置优先级和权重。为了解决这个问题，机器学习领域出现了一个叫做主动学习的领域。主动学习是机器学习中的一种方法，它提供了一个框架，根据模型已经看到的标记数据对未标记的数据样本进行优先排序。使用主动学习——展示一个模拟使用主动学习和不使用主动学习的对比实验。细胞图像预处理我们将使用在MIT许可的血细胞图像数据集（GitHub和Kaggle）。主动学习我们现在已经有了训练需要的搜有数据，现在可以开始试验使用主动学习策略是否可以通过更少的数据标记获得更高的准确性。如果我们使用所有数据，那么它们最终分数是相同的，但是我们的研究目的是在少量标注数据的前提下训练，所以只使用了数据集中的300个随机样本。总结本文展示了将主动学习用于细胞成像任务的好处。
53930编辑于 2022-08-29
来自专栏腾讯云 DNSPod 团队
企业专供10元起!
Bbyx.Ltd自2007年成立至今已有13年，全国拥有120多家直营门店，100家加盟店，2018年销售额突破6.8亿元，发展迅猛。目前，腾讯云限时域名大促，.ltd域名新注首年仅需10元! 点击下方链接，发挥你的创造力，用.ltd为你的企业创造无限可能添加阿D微信邀您加入官方交流群 ?
59820发布于 2020-06-22
来自专栏AI科技大本营的专栏
400名微软员工主动曝光薪资：28万元到228万元不等！
微软的员工的职级从59级到80级，而亚马逊员工的职级为L4-L10，Facebook员工的职级则为E3到E9。登记了这份电子表格的员工中，有一名员工是位于华盛顿州的62级软件工程师。根据该电子表格的数据，虽然现金奖励在微软员工职业生涯中保持相对稳定的工资百分比，但股票收入可以涨到年收入的20%。虽然这份数据无法表明这种策略，但常常有经验较少的人跳到更高的职级。虽然关于在印度工作的微软工程师的数据非常少，但这份收集到的数据显示，他们的薪酬远低于位于华盛顿的同行们。在填写电子表格的印度程序员中，绝大部分年收入不到5万美元，而拥有类似经验的美国人的年收入为15万美元，而奖金形式的报酬更是高达10倍。 “大部分因素都是利他主义，”在谈起人们为什么会为Levels.fyi贡献数据时，Musa表示， “我认为，大家之所以很支持只是因为我们需要这些信息。”
3.1K10发布于 2019-09-26
来自专栏大数据&分布式
统一元数据：元模型定义、元数据采集
背景元数据管理可分为如下5个流程步骤：元模型定义、元数据采集、元数据加工、元数据存储、元数据应用。其中，元模型定义是整个元数据管理的前提和规范，用于定义可管理的元数据范式。元数据采集是元数据来源的重要途径，提供可管理的元数据原料，而如何进行可扩展且高效的元数据采集也是元数据管理的难点之一。本文将主要针对元模型定义、元数据采集两个模块进行详细说明。，元数据采集可分为两种类型：元数据推断：通过读取并解析存储系统的数据文件，自动识别和推断该数据文件对应的Schema信息；元数据Crawler：主要通过PULL方式主动定时的周期性拉取元数据信息；同时也支持引擎以，获取元数据信息；对于特殊组件，如Hive，可实现组件Hook，基于PUSH主动上报业务元数据支持PUSH主动上报异构采集触发：基于消息中间件，解耦元数据的采集过程和处理过程；元数据推断元数据推断 PULL主动采集：元数据管理系统定时周期性采集，采集周期应支持设定，以适配数据源差异化的更新频率； PUSH被动采集：由人工发起或外部系统通过API主动上报，人工发起时，可以采用手动上传元数据文件或主动启动采集任务的方式来完成
4.1K43编辑于 2024-05-14
来自专栏信数据得永生
Python 元学习实用指南：6~10
元学习是元学习的重点，我们知道，在元学习中，我们从仅包含少量数据点的各种相关任务中学习，并且元学习器会产生一个可以很好地概括新的相关任务的快速学习器，即使训练样本数量较少。以下是每个任务中需要的样本数量（即镜头数量）和数据点数量[k）： self.num_samples = 10 以下是周期数，即训练迭代： self.epochs = 1000 因此，对于每个任务，我们仅采样 10 个数据点并训练网络-也就是说，对于每个任务，我们仅采样 10 个(x, y)对。让我们看一下代码并详细查看它。因此，当我们对一批任务以及每个任务中的一些k数据点进行采样时，我们将使用深度神经网络学习每个k数据点的表示形式，然后对这些表示进行元学习。我们的框架包含三个组件：概念生成器概念判别器元学习器概念生成器的作用是提取数据集中每个数据点的特征表示，捕获其高级概念，概念判别器的作用是识别和分类由概念生成器生成的概念，而元学习器学习由概念生成器生成的概念
91110编辑于 2023-04-24
来自专栏文渊之博
探索SQL Server元数据（三）：索引元数据
背景在第一篇中我介绍了如何访问元数据，元数据为什么在数据库里面，以及如何使用元数据。介绍了如何查出各种数据库对象的在数据库里面的名字。第二篇，我选择了触发器的主题，因为它是一个能提供很好例子的数据库对象，并且在这个对象中能够提出问题和解决问题。本篇我将会介绍元数据中的索引，不仅仅是因为它们本身很重要，更重要的是它们是很好的元数据类型，比如列或者分布统计，这些不是元数据中的对象。索引对于任何关系数据库表都是必不可少的。元数据中还有其他类型的索引吗? 还有两种比较特殊的索引，一是空间索引，其信息在sys.spatial_index_tessellations 和 sys.spatial_indexes表中。为此，它需要估计数据的“基数”，以确定为任何索引值返回多少行，并使用这些“stats”对象告诉它数据是如何分布的。
1.4K10发布于 2018-08-03
来自专栏java编程那点事
合并元数据
如同ProtocolBuffer，Avro，Thrift一样，Parquet也是支持元数据合并的。用户可以在一开始就定义一个简单的元数据，然后随着业务需要，逐渐往元数据中添加更多的列。在这种情况下，用户可能会创建多个Parquet文件，有着多个不同的但是却互相兼容的元数据。Parquet数据源支持自动推断出这种情况，并且进行多个Parquet文件的元数据的合并。因为元数据合并是一种相对耗时的操作，而且在大多数情况下不是一种必要的特性，从Spark 1.5.0版本开始，默认是关闭Parquet文件的自动合并元数据的特性的。可以通过以下两种方式开启Parquet数据源的自动合并元数据的特性： 1、读取Parquet文件时，将数据源的选项，mergeSchema，设置为true 2、使用SQLContext.setConf // 一个是包含了name和age两个列，一个是包含了name和grade两个列 // 所以，这里期望的是，读取出来的表数据，自动合并两个文件的元数据，出现三个列，name、age、grade /
1.3K10编辑于 2023-02-25
来自专栏别先生
Spark的Streaming + Flume进行数据采集（flume主动推送或者Spark Stream主动拉取）
sources = r1 a1.channels = c1 a1.sinks = k1 # Describe/configure the source 描述和配置source组件：r1 #类型, 从网络端口接收数据 ,在本机启动, 所以localhost, type=spoolDir采集目录源,目录里有就采 #type是类型，是采集源的具体实现，这里是接受网络端口的，netcat可以从一个网络端口接受数据的。 wctotal.log a1.sources.r1.shell = /bin/bash -c # Describe the sink 描述和配置sink组件：k1 #type，下沉类型，使用logger，将数据打印到屏幕上面 #下沉的时候是一批一批的, 下沉的时候是一个个eventChannel参数解释： #capacity：默认该通道中最大的可以存储的event数量，1000是代表1000条数据。
1.5K50发布于 2018-05-16
来自专栏大数据架构师成长之路
元数据解读
元数据应用领域较广，种类甚多，按照不同应用领域或功能，元数据分类有很多种方法或种类，元数据一般大致可为三类：业务元数据、技术元数据和操作元数据。元数据架构元数据战略是关于企业元数据管理目标的说明，也是开发团队的参考框架。元数据战略决定了企业元数据架构。元数据架构可分为三类：集中式元数据架构、分布式元数据架构和混合元数据架构。集中式元数据架构：集中式架构包括一个集中的元数据存储，在这里保存了来自各个元数据来源的元数据最新副本。保证了其独立于源系统的元数据高可用性；加强了元数据存储的统一性和一致性；通过结构化、标准化元数据及其附件的元数据信息，提升了元数据数据质量。集中式元数据架构有利于元数据标准化统一管理与应用。混合式元数据架构：这是一种折中的架构方案，元数据依然从元数据来源系统进入存储库。但是存储库的设计只考虑用户增加的元数据、高度标准化的元数据以及手工获取的元数据。
1.6K51发布于 2020-06-10
数据管理最容易混淆的3个概念：元数据、数据元、元模型
做数据这行的，肯定常听到“元数据”“数据元”“元模型”这三个词。开会时有人说“元数据管理”，转头又有人提“数据元标准”，偶尔还穿插“元模型设计”，但真要问它们仨到底啥区别，估计不少人说不清楚。一、元数据：描述“数据”本身的信息说白了，元数据就是“关于数据的数据”。那么元数据到底有啥用？简单说，元数据就是帮你解决“数据从哪儿来、能干啥、怎么用”这三个问题的：实际工作中怎么用元数据的？比如FineDataLink中要管理“表元数据”和“字段元数据”，元模型就会规定：每个“表元数据”必须关联多个“字段元数据”，每个“字段元数据”必须包含“名称”“类型”“长度”这些信息。 4.治理数据时通过元数据监控表的变更，用数据元校验数据质量，按元模型检查模型是否合规，比如事实表没加外键。总结元数据、数据元、元模型这三个概念，看着有点绕，但其实都是数据治理的基础。
3.4K11编辑于 2025-08-19
来自专栏大数据和云计算技术
元数据概念
刘耀铭同学元数据系列作品的第一篇，大家支持！其他元数据相关系列文章：基于元数据驱动的ETL Hive 元数据表结构详解 1、元数据是描述其他数据的数据（data about other data）,用于提供某种资源有关信息的结构化数据（structed 字面上看无法看出所以然，但其实看对应的英文含义就明确了，Meta指“对······的描述”类似Meta tag，所以元数据就是对数据的解释和描述。 2、这里主要将数据仓库的元数据分为3类：DBMS数据字典、ETL处理流程产生的日志、BI建模等。 DBMS数据字典　　数据库管理系统（DBMS）中的元数据一般在所有的数据仓库都会包含，因为数据仓库一般都是基于数据库搭建的，而数据库本身的管理系统就会自动维护一套数据字典供用户查询。
1.5K110发布于 2018-03-08
来自专栏iOS打包，上架知识大全
MySQL 元数据
数据库和数据表的信息：包含了数据库及数据表的结构信息。 MySQL服务器信息：包含了数据库服务器的当前状态，版本号等。在MySQL的命令提示符中，我们可以很容易的获取以上服务器信息。 mysqli_affected_rows ($conn_id) : 0); print ("$count 条数据被影响\n"); ---- 数据库和数据表列表你可以很容易的在MySQL服务器中获取数据库和数据表列表你也可以使用 SHOW TABLES 或 SHOW DATABASES 语句来获取数据库和数据表列表。 PERL 实例 # 获取当前数据库中所有可用的表。：查看所有数据库 <? > ---- 获取服务器元数据以下命令语句可以在 MySQL 的命令提示符使用，也可以在脚本中使用，如PHP脚本。
82310编辑于 2023-05-05

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

金融数据治理新范式：如何用算子级血缘与主动元数据 10分钟定位 EAST 报送异常？

win10如何主动关闭显示器 win10显示器怎么主动关闭

10 元编程

致数仓架构师：别再用 Excel 维护数据字典，主动元数据才是正解

数据治理新解法：基于算子级血缘的主动元数据如何破解数仓重构难题？

2022-10-10-享元模式

一行代码改崩 20 张报表：主动元数据如何实现「事前感知」？

细胞图像数据的主动学习

细胞图像数据的主动学习

企业专供10元起!

400名微软员工主动曝光薪资：28万元到228万元不等！

统一元数据：元模型定义、元数据采集

Python 元学习实用指南：6~10

探索SQL Server元数据（三）：索引元数据

合并元数据

Spark的Streaming + Flume进行数据采集（flume主动推送或者Spark Stream主动拉取）

元数据解读

数据管理最容易混淆的3个概念：元数据、数据元、元模型

元数据概念

MySQL 元数据

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

金融数据治理新范式：如何用算子级血缘与主动元数据 10分 钟定位 EAST 报送异常？

win10如何主动关闭显示器 win10显示器怎么主动关闭

10 元编程

致数仓架构师：别再用 Excel 维护数据字典，主动元数据才是正解

数据治理新解法：基于算子级血缘的主动元数据如何破解数仓重构难题？

2022-10-10-享元模式

一行代码改崩 20 张报表：主动元数据如何实现「事前感知」？

细胞图像数据的主动学习

细胞图像数据的主动学习

企业专供10元起!

400名微软员工主动曝光薪资：28万元到228万元不等！

统一元数据：元模型定义、元数据采集

Python 元学习实用指南：6~10

探索SQL Server元数据（三）：索引元数据

合并元数据

Spark的Streaming + Flume进行数据采集（flume主动推送或者Spark Stream主动拉取）

元数据解读

数据管理最容易混淆的3个概念：元数据、数据元、元模型

元数据概念

MySQL 元数据

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

金融数据治理新范式：如何用算子级血缘与主动元数据 10分钟定位 EAST 报送异常？