搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏全栈程序员必看
KETTLE教程：转换
所谓的转换，可以理解为将数据开中的数据转换为excel表格，txt文档，.bat等格式输出；将excel表格，txt文档，.bat等格式转换成数据库中表格的数据。 kettle的转换功能十分便捷，大大减少了我们的工作量。下面开始介绍如何使用kettle进行转换：以文本转换为mysql数据表为例首先，点击文件：在文件中新建→转换然后，点击转换下的DB转换：选择要转换成什么数据库表，连接方式，输入用户名密码以及主机
1.4K10编辑于 2022-08-31
来自专栏HUC思梦的java专栏
kettle学习笔记（六）——kettle转换步骤
一、概述　　转换步骤分类：　　　　1. 增加新的列　　　　2. 字符串处理　　　　3. 行列变换　　　　4. 排序/排重/字段选择　　　　5. 其他转换步骤二、增加新的列 1.增加常量列　　　　增加一列常量的列 ? 　　其它增加列的操作大同小异，不一一赘述，只介绍计算器 1. 增加常量列　　2. 4.字符串其它转换 ? 　　　　字符串操作： ? 　　　　　　
4.2K20发布于 2020-09-03
来自专栏别先生
kettle的转换组件
1、转换是转换里面的第四个分类。转换属于ETL的T，T就是Transform清洗、转换。ETL三个部分中，T花费时间最长,是一般情况下这部分工作量是整个ETL的2/3。 16、列转行就是如果数据一列有相同的值，按照指定的字段，把多行数据转换为一行数据。去除一些原来的列名，把一列数据变为字段。　　注意：列转行之前数据流必须进行排序！必须使用排序记录图元哦！ ? 17、行转列，就是把数据字段的字段名转换为一列，把数据行变为数据列。 ? 18、行扁平化就是把同一组的多行数据合并成为一行。注意：只有数据流的同类数据数据行记录一致的情况才可使用！
2.5K20发布于 2020-02-23
来自专栏Java架构师必看
Kettle使用_29 转换里使用参数
Kettle使用_29 转换里使用参数大家好，我是架构君，一个会写代码吟诗的架构师。今天说一说Kettle使用_29 转换里使用参数,希望能够帮助大家进步!!! Kettle使用_29 转换里使用参数需求：通过Kettle对转换进行参数传递解决方法：通过环境变量、命名参数、获取系统信息、获取变量等组件对转换进行传值。 Previous work: 这里通过参数组件直接结合文本文件输出的方式展示，实际使用时结合自己的转换即可。方法一环境变量 Step1:新建个转换。
1.9K30发布于 2021-12-01
来自专栏java和python
kettle学习（一）学习转换里面的转换目录下的控件
目录软件目录介绍转换控件 Concat fields 需求分析实现值映射需求分析实现增加常量需求分析实现增加序列需求分析实现字段选择需求分析实现计算器剪切字符串，字符串替换，字符串操作去除重复记录，排序记录应用控件替换null值写日志流程控件 Switch case 过滤记录软件目录介绍转换控件 Concat fields 就是要学习以上的控件需求分析实现以上是excle输入控件里面的内容以上是 Concat fields 里面的东西输出控件里面的内容以上是转换完成
29030编辑于 2022-05-09
来自专栏架构之巅
kettle5.1转换中文乱码问题
找到db连接- >用到的db连接->选项->参数名称中增加characterEncoding 值里面输入你的编码，保存即可
77342发布于 2020-11-09
来自专栏yuyy.info技术专栏
基于kettle的数据转换及可视化
要求通过Kettle连接mysql数据库，在kettle建立job,将house中的一个表，增量备份到另外一个表中。步骤建立获取时间转换 image.png image.png image.png 建立获取增量数据转换 image.png image.png image.png 运行job image.png image.png
59120编辑于 2022-06-28
来自专栏HUC思梦的java专栏
kettle学习笔记（九）——子转换、集群与变量
一、概述　　kettle中3个重要的步骤：子转换/映射　　　　　　在转换里调用一个子转换，便于封装和重用。集群集群模式变量和参数变量和参数的用法二、子转换 1.定义子转换　　　　主要由映射输入与映射输出定义： ? 　　　　这里给出一个从kettle自带的samples中拿出来的示例，详情配置，参考kettle示例 ? 　　　　保存这个转换（可以是文件，也可以在资源库），这就是子转换了！ 2.调用子转换 ? 　　　　子转换的配置： ? 　　　　整个调用的示例如下： ? 　　　　// 详细，查看kettle示例三、集群　　Kettle 集群是一个分布式的运行环境，由一个主节点和多个子节点构成。　　（本机模拟可以通过carte不同端口来模拟启动，然后在kettle的子服务器中配置，默认集群用户名cluster/cluster，然后在kettle集群中添加集群）　　使用的方式在步骤右击，选择集群进行配置
2.4K20发布于 2020-09-03
来自专栏Hadoop数据仓库
Kettle构建Hadoop ETL实践（六）：数据转换与装载
本篇重点是针对销售订单示例创建并测试数据装载的Kettle作业和转换。在此之前，先简要介绍数据清洗的概念，并说明如何使用Kettle完成常见的数据清洗工作。最后用完整的的Kettle作业演示如何实现销售订单数据仓库的数据转换与装载。一、数据清洗对大多数用户来说，ETL的核心价值在“T”所代表的转换部分。总的Kettle转换如图6-1所示。 ? 图6-1 校验身份证号码的Kettle转换这是本专题到目前为止步骤最多的一个转换。虽然有些复杂，但条理还比较清楚。与单纯用shell执行SQL相比，Kettle转换一个明显的好处是这三个步骤可以并行以提高性能。 Kettle作业和转换能够实现Hadoop数据仓库的初始装载和定期装载。
5.1K47发布于 2020-10-26
来自专栏浩Coding
Kettle教程一：Kettle简介和Kettle的部署安装
一 Kettle简介 1、ETL简介 ETL（Extract-Transform-Load的缩写，即数据抽取、转换、装载的过程），对于开发或者运维人员来说，我们经常会遇到各种数据的处理，转换，迁移， Kettle中有两种脚本文件，transformation和job，transformation完成针对数据的基础转换，job则完成整个工作流的控制。 3、kettle的核心组件 4、Kettle的概念模型 Kettle的执行分为两个层次：Job（作业）和Transformation（转换）。 / B站2019kettle8.2最新教程：https://www.bilibili.com/video/BV1jE411B7J8 国内kettle论坛网：https://www.kettle.net.cn 4、打开kettle只需要运行spoon.bat，即可打开spoon图形工具： 5、Kettle目录文件介绍三常见的kettle报错 1、打开kettle后一闪而过就没了可能有如下原因：
87.3K67发布于 2021-01-29
来自专栏全栈程序员必看
kettle 性能优化_kettle过滤记录
本章主要是介绍Kettle的性能优化及效率提升。一、Kettle调优 1、调整JVM大小进行性能优化修改Kettle定时任务中的Kitchen或Pan或Spoon脚本：修改脚本代码片段 set OPT=-Xmx512m -cp %CLASSPATH （也可以通过单个执行最长的步骤来确定性能瓶颈）通过点击转换空白处,可以调整RowSet的大小：调整之后，执行效果如下： 4、调整转换动作的并发处理数（改变开始复制的数量）注意：此种方式要用在适合并发操作的场景当调整RowSet大小之后，性能效果仍不明显的话，可以尝试调整转换动作的并发处理数，比如以下转换操作在“数据库查询”处出现性能瓶颈。注意死锁问题：数据库死锁(读写同一张表)和转换本身死锁；（5）. 尽量使用数据库连接池；使用数据库连接池，可以在一定程度上提高速度。如何查看是否使用了数据库连接池？
5K21编辑于 2022-11-08
来自专栏Hadoop数据仓库
Kettle与Hadoop（一）Kettle简介
Kettle是一款流行的ETL（Extract-Transform-Load，即数据抽取、转换、装载）工具，并可用来操作Hadoop上的数据。Kettle是用Java语言开发的。 Kettle里的图就是转换和作业。可视化编程一直是Kettle里的核心概念，它可以让用户快速构建复杂的ETL作业和降低维护工作量。Kettle中的设计开发工作几乎都可以通过简单的拖拽来完成。二、转换转换（transformation）是Kettle ETL解决方案中最主要的部分，它处理抽取、转换、装载各阶段各种对数据行的操作。四、转换或作业的元数据转换和作业是Kettle的核心组成部分。为了解决打开多个连接而产生的问题，Kettle可以在一个事务中完成转换。在转换设置对话框的 “杂项”标签中，设置“使用唯一连接”，可以完成此功能。
4.5K21发布于 2020-05-27
来自专栏全栈程序员必看
kettle教程（1）简单入门、kettle简单插入与更新。打开kettle
本文要点：Kettle的建立数据库连接、使用kettle进行简单的全量对比插入更新：kettle会自动对比用户设置的对比字段，若目标表不存在该字段，则新插入该条记录。若存在，则更新。 Kettle中有两种脚本文件，transformation和job，transformation完成针对数据的基础转换，job则完成整个工作流的控制。 3、建立转换。　　在文件->新建装换。　　新建转换后在左边的主对象树中建立DB连接用以连接数据库。如图所示：　　建立数据库连接的过程与其他数据库管理软件连接数据库类似。　使用作业可以定时或周期性的执行转换，新建一个作业。并从左边面板拖入start 和转换。　　双击start可以编辑，可以设置执行时间等等　　点开装换，可以设置需要执行的转换任务，比如可以执行上面我们做的转换，XXX.ktr 　　最后点击运行即可。
8K10编辑于 2022-08-25
来自专栏HUC思梦的java专栏
kettle学习笔记（二）——kettle基本使用
Carte.bat: 启动web服务，用于 Kettle 的远程运行或集群运行。 Encr.bat: 密码加密　　转换和作业： Kettle 的 Spoon 设计器用来设计转换（Transformation）和作业（Job）。　　 •转换主要是针对数据的各种处理，一个转换里可以包含多个步骤（Step）。　　二、第一个转换——hello world 　　1.运行Spoon.bat，打开图形设计界面 ? 　　2.通过导航栏：文件-新建-转换，新建一个转换 ? 　　 5.运行转换 ? 　　运行之前保存转换： ? 　　查看执行结果： ? 　　桌面上可以查看转换的结果文件： ? 　　
6.6K20发布于 2020-09-03
来自专栏Java架构师必看
Kettle使用_28 转换之数值范围与字符串操作
Kettle使用_28 转换之数值范围与字符串操作大家好，我是架构君，一个会写代码吟诗的架构师。今天说一说Kettle使用_28 转换之数值范围与字符串操作,希望能够帮助大家进步!!! Kettle使用_28 转换之数值范围与字符串操作需求：通过Kettle将score字段进行去重、数值范围转换，对字段进行字符串操作（去除空格、改成大写、字符串替换）解决方法：通过去除重复记录、数值范围 Step1：新建个转换 Step2：拖个自定义常量组件，初始化结构和数据见下：元数据定义：数据内容： Step3：拖个去除重复记录组件，SHIFT连接自定义常量组件，并配置如下： Step4 连接增加常量组件，并配置如下： Step7：拖个数值范围组件，SHIFT连接字符串操作组件，并配置见下： Step8：拖个字符串操作组件，SHIFT连接增加常量组件，并配置如下： Step9：保存并运行转换
1.5K10发布于 2021-12-01
来自专栏HUC思梦的java专栏
kettle学习笔记（四）——kettle输入步骤
常用于构造一些测试数据三、获取系统信息　　获得各类系统信息，常见的包括：　　　　• 转换开始时间。　　　　 // 固定是整个转换开始的时间 ? 　　 CSV 文件输入：　　　　简化了文本文件输入　　　　通过 NIO、并行、延迟转换提高性能　　固定宽度：　　　　列固定宽度的文件，不用解析字符串，性能好。　　
6.2K20发布于 2020-09-03
来自专栏HUC思梦的java专栏
kettle学习笔记（五）——kettle输出步骤
　　数据库表：　　　　• 表输出　　　　• 更新，删除，插入/更新　　　　• 批量加载（mysql，oracle）　　　　• 数据同步　　文件：　　　　• SQL 文件输出　　　　• 文本文件输出　　　　• XML 输出　　　　• Excel Output/Excel Writer 　　其他（报表、应用）
5K30发布于 2020-09-03
来自专栏IT码农
安装kettle
> set global time_zone='+8:00'; 方法二：修改my.ini文件，在[mysqld]加入以下命令： default-time-zone='+8:00' 方法三：修改kettle
1.7K43编辑于 2022-05-06
来自专栏全栈程序员必看
kettle调度监控平台（kettle-scheduler）开源
KS整体的框架是由spring+sprin gmvc +beetlsql整合而成，通过调用kettle的API来执行转换和作业，并且使用quartz框架完成调度工作。 #kettle日志存放路径 kettle.log.file.path=D:\\data-integration\\logs #保存上传文件转换(.ktr)或作业(.kjb)的路径,此功能未调试,暂时停用这个任务就处于被系统的监控状态下，首页展示了总监控任务数、监控作业数、监控转换数、转换监控记录（仅显示5条）、作业监控记录（仅显示5条）以及7天内作业和转换的监控状况。 5.任务管理 – 转换管理管理转换定时任务，可以新增、修改、删除转换定时任务，启动后转换即开始运行。 6.任务管理 – 执行策略管理执行策略，可以新增、修改、删除执行策略（定时执行策略）。 8.监控管理 – 转换监控处于运行的转换会被系统监控，此处显示被监控的转换的监控信息，包括总转换任务数、总执行成功次数、总执行失败次数以及每个转换的成功次数和失败次数。
12.6K150编辑于 2022-11-02
来自专栏Hadoop数据仓库
Kettle与Hadoop（二）Kettle安装配置
属性对Kettle而言就如同环境变量对操作系统的shell命令。它们都是全局的字符串变量，用于把作业和转换参数化。如果使用资源库保存转换或作业，如下这些预定义变量就可以定义一个默认资源库： KETTLE_REPOSITORY：默认的资源库名称。 KETTLE_USER：资源库用户名。（5）repositories.xml Kettle可以通过资源库管理转换、作业和数据库连接这样的资源。（6）shared.xml Kettle里有一个概念叫共享对象，共享对象就是类似于转换的步骤、数据库连接定义、集群服务器定义等这些可以一次定义，然后在转换和作业里多次引用的对象。（2）classpath里增加一个jar包在Kettle的转换里可以写Java脚本，Java脚本会引用第三方的jar包。
8.3K50发布于 2020-06-01

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

KETTLE教程：转换

kettle学习笔记（六）——kettle转换步骤

kettle的转换组件

Kettle使用_29 转换里使用参数

kettle学习（一）学习转换里面的转换目录下的控件

kettle5.1转换中文乱码问题

基于kettle的数据转换及可视化

kettle学习笔记（九）——子转换、集群与变量

Kettle构建Hadoop ETL实践（六）：数据转换与装载

Kettle教程一：Kettle简介和Kettle的部署安装

kettle 性能优化_kettle过滤记录

Kettle与Hadoop（一）Kettle简介

kettle教程（1）简单入门、kettle简单插入与更新。打开kettle

kettle学习笔记（二）——kettle基本使用

Kettle使用_28 转换之数值范围与字符串操作

kettle学习笔记（四）——kettle输入步骤

kettle学习笔记（五）——kettle输出步骤

安装kettle

kettle调度监控平台（kettle-scheduler）开源

Kettle与Hadoop（二）Kettle安装配置

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

KETTLE教程：转换

kettle学习笔记（六）——kettle转换步骤

kettle的转换组件

Kettle使用_29 转换里使用参数

kettle学习（一）学习转换里面的转换目录下的控件

kettle5.1转换中文乱码问题

基于kettle的数据转换及可视化

kettle学习笔记（九）——子转换、集群与变量

Kettle构建Hadoop ETL实践（六）：数据转换与装载

Kettle教程一：Kettle简介和Kettle的部署安装

kettle 性能优化_kettle过滤记录

Kettle与Hadoop（一）Kettle简介

kettle教程（1） 简单入门、kettle简单插入与更新。打开kettle

kettle学习笔记（二）——kettle基本使用

Kettle使用_28 转换之数值范围与字符串操作

kettle学习笔记（四）——kettle输入步骤

kettle学习笔记（五）——kettle输出步骤

安装kettle

kettle调度监控平台（kettle-scheduler）开源

Kettle与Hadoop（二）Kettle安装配置

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

kettle教程（1）简单入门、kettle简单插入与更新。打开kettle