首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • Paimon系列:IDEA环境读写Paimon表

    本文基于 Apache Flink 1.16 和 Apache Paimon 1.0.1,详细介绍如何配置 Paimon 环境、创建和使用追加表(Append-Only Table)与主键表(Primary-Key Primary-Key 表1. Primary-Key Table(主键表)特点主键表是 Apache Paimon 中定义了主键的表类型,支持高效的 upsert 操作和变更日志生成,适合需要实时更新和复杂数据处理的应用场景。 Primary-Key 的创建和写入创建基本本地文件的 Paimon catalog,定义分区键 PRIMARY KEY (dt, id) NOT ENFORCED;/** * @author BigData ")"); tableEnv.executeSql("USE CATALOG paimon_catalog"); // 创建 primary-key

    45111编辑于 2025-09-20
  • 来自专栏Lansonli技术博客

    客快物流大数据项目(八十六):ClickHouse的深入了解

    支持普通硬盘存储很多列式数据库只支持在内存中工作,如Google PowerDrill、SAP HANA等,但是ClickHouse支持廉价的传统磁盘存储(TIDB只对SSD固态硬盘比较友好),在底层磁盘物理存储的方式上按照primary-key ,当查询大量row的时候,按列的存储顺序往下查找,大量减少了CPU的等待时间,从而高效实用CPU资源;支持实时数据更新ClickHouse在使用Merge tree引擎的时候,插入数据的时候按照数据的primary-key

    1.6K121编辑于 2022-12-21
  • 来自专栏数据仓库践行者

    sparksql源码系列 | 一文搞懂Show create table 执行原理

    partitionKeys" table="PARTITION_KEYS" > <collection element-type="MFieldSchema"/> <join> <primary-key name="PARTITION_KEY_PK"> <column name="TBL_ID"/> <column name="PKEY_NAME"/> </primary-key

    1.7K10编辑于 2022-06-09
  • 来自专栏大数据最后一公里

    Maxwell 系列(二)—— 入门(7000字的干货)

    columns":[{"type":"int","name":"id","signed":true},{"type":"varchar","name":"name","charset":"utf8"}],"primary-key columns":[{"type":"int","name":"id","signed":true},{"type":"varchar","name":"value","charset":"utf8"}],"primary-key

    1.7K30发布于 2021-08-05
  • TiDB 组件 GC 原理及常见问题

    根据我们之前对分布式事务的理解,用户在 commit 一个事务之后,TiKV 内部还是有可能留下锁的,而这些锁的提交状态则是存在 primary-key 上,试想以下情况:事务 1:事务 ID 即 start_ts 在实际操作中,我们操作步骤如下:将请求发给每个 region 的 leader 获取到 lock根据 lock 状态,逐个 resolve lock:向 PD 定位当前 lock 里面 primary-key 所在的 region 信息向对应的 TiKV 发送获取当前 (primary-key,事务 ID ) 对应的事务状态根据 (primary-key,事务 ID) 对应的状态:事务已提交,向 tikv

    40710编辑于 2024-04-07
  • 来自专栏米扑专栏

    Clojure 学习入门(7)—— 连接mysql

    (defn insert-user [fname]    (sql/insert-values :users [:fname] [fname])) 使用insert-values可以利用primary-key

    1.4K20发布于 2019-02-18
  • 来自专栏ByConity

    StarRocks 物化视图2 - 查询优化

    OptExpression mvExpression) { // short circuit for tables without foreign-key/primary-key

    49510编辑于 2025-09-15
  • Flink CDC 为什么会重复消费?一文讲透 offset、快照、锁机制

    4)并行度太高导致交换(exchange)重复partition by primary-key 之前的 shuffle 会产生重复消费。这一点一般人不会注意。7.

    25810编辑于 2025-11-27
  • 来自专栏菜菜小屋

    [学习笔记] TiDB学习笔记(二)

    connect进行连接 在数据查询的时候,我们通过等位偏移对value进行反解析,然后对应schema的元信息进行列信息映射 二级索引:也是一个全局有序的kvmap 简单来说:key= 索引列信息 value= primary-key

    1.1K51编辑于 2021-12-30
  • 来自专栏eosfans

    eos源码赏析(十四):EOS智能合约数据持久化存储(下)

    multi-index.hpp里,可参考:https://github.com/EOSIO/eos/blob/master/contracts/eosiolib/multi_index.hpp 以问题1为例,primary-key

    85610发布于 2021-11-23
  • 来自专栏数据库相关

    基于binlog的离线分析平台的一些初步实践

    name":"description","charset":"utf8mb4"},{"type":"timestamp","name":"update_time","column-length":0}],"primary-key

    91130发布于 2019-10-27
  • 湖仓一体:小米集团基于 Apache Doris + Apache Paimon 实现 6 倍性能飞跃

    aggregate-function' = 'sum', 'fields.v2.aggregate-function' = 'max', 'merge-engine' = 'aggregation', 'primary-key

    96210编辑于 2025-08-26
  • 来自专栏c++与qt学习

    MIT 6.830数据库系统 -- lab three

    of the right-hand table in the join * @param t1pkey * Is the left-hand table a primary-key * @param t2pkey * Is the right-hand table a primary-key table?

    53640编辑于 2023-10-11
  • 来自专栏最新最全的大数据技术体系

    流数据湖平台Apache Paimon(二)集成 Flink 引擎

    test3_op WITH (‘file.format’ = ‘parquet’) AS SELECT * FROM test3; – 指定主键 CREATE TABLE test_pk WITH (‘primary-key ’ = ‘dt,hh’) AS SELECT * FROM test; – 指定主键和分区 CREATE TABLE test_all WITH (‘primary-key’ = ‘dt,hh’, ‘partition

    4.4K31编辑于 2023-07-31
领券