首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏python3

    pentaho中Invalid byte

    上网一查,说是有中文,字体不相符,可是我没有写中文,为了能继续往后进行,修改了如下文件 在start-pentaho.bat中添加了一句代码 修改前 IF "%BITS%" == "64" ( set

    77120发布于 2020-01-07
  • 来自专栏Java架构师必看

    pentaho8.1安装

    本文主要介绍pentaho8.1的安装过程,重点介绍pentaho-server的安装。 针对pentaho在线上使用必须使用mysql作为数据源,我们本次就以mysql作为数据源。 1、下载后有这些文件(能够直接解压缩执行,其中pentaho-server需要配置) pentaho-server pdi --pentaho data intergration prd -- pentaho report desiginer 2、把pentaho-解压到/usr/local/petaho中 3、安装mysql(略) 4、修改pentaho的数据源到mysql,默认不是mysql的,需要修改 /start-pentaho.sh 7、查看tomcat/logs/pentaho.log是否有异常输出 例如输出如下: **************************************** ] Using "/usr/local/pentaho/pentaho-server/tomcat/temp/vfs_cache" as temporary files store. 2018-11-03

    1.1K20发布于 2021-05-14
  • 来自专栏Hadoop数据仓库

    Pentaho Work with Big Data(六)—— 使用Pentaho MapReduce生成聚合数据集

    本示例说明如何使用Pentaho MapReduce把细节数据转换和汇总成一个聚合数据集。当给一个关系型数据仓库或数据集市准备待抽取的数据时,这是一个常见使用场景。 关于如何使用Pentaho MapReduce把原始web日志解析成格式化的记录,参考 http://blog.csdn.net/wzy0623/article/details/51145570。 编辑'Pentaho MapReduce'作业项,如图11到图14所示。 图11 图12 图13 图14 说明: . 参考: http://wiki.pentaho.com/display/BAD/Using+Pentaho+MapReduce+to+Generate+an+Aggregate+Dataset

    60130编辑于 2022-05-07
  • 来自专栏繁依Fanyi 的专栏

    问题随记 —— Cannot resolve org.pentaho:pentaho-aggdesigner-algorithm:jar:5.1.5-jhyde

    问题描述 IDEA 中使用对 Hive 进行 Maven 配置时出现以下问题 Cannot resolve org.pentaho:pentaho-aggdesigner-algorithm:jar:5.1.5 -jhyde 解决方法 ① 找到 Maven repository 仓 —— 5.1.5-jhyde 大概位置在这 C:\Users\Administrator\.m2\repository\org\pentaho \pentaho-aggdesigner-algorithm\5.1.5-jhyde ② 把 Jar 包放里面 ③ 重新 Reload Project 即可 这个可以不用管。

    86010编辑于 2023-05-07
  • 来自专栏复盘总结文章集合

    Pentaho图表开发指南

    一、使用Pentaho Report-Designer绘制报表 1、解压打开Pentaho Report-Designer 工具。 ? 2、启动Pentaho Report-Designer 工具,新建一个报表。 ? 1.1、基础配置 1.1.1、配置窗口右侧的数据源与数据库连接 ? 1.1.2、新建数据源 ? 1.4、发布报表到pentaho 1.4.1、点击发布 ? 1.4.2、复制pentaho地址 ? 1.4.3、设置发布参数 ? 1.4.4、选择发布到的文件夹并设置发布文件名、标题。 ? 二、使用Pentaho CDE绘制统计图 2.1、启动PENTAHO 2.1.1、解压启动pentaho脚本 2.1.2、等待启动完成 2.2、访问PENTAHO BI SERVER 2.3、PENTAHO /plugin/pentaho-cdf-dd/api/renderer/render?

    2.3K20发布于 2019-05-28
  • 来自专栏Hadoop数据仓库

    Pentaho Work with Big Data(八)—— kettle集群

    192.168.56.104、192.168.56.102、192.168.56.103分别安装Pentaho的PDI,安装目录均为/home/grid/data-integration。

    87920编辑于 2022-05-07
  • 来自专栏云计算与大数据技术

    Hive导包报错解决:Missing artifact org.pentaho:pentaho-aggdesigner-algorithm:jar:5.1.5-jhyde

    1、找本机的到maven仓库地址 F:\Maven\repository\org\pentaho\pentaho-aggdesigner-algorithm\5.1.5-jhyde ? 2、把pentaho-aggdesigner-algorithm-5.1.5-jhyde.jar以外的文件全部删除 ? 3、项目右键执行Maven Update Project ,报错解决! ? ? org.apache.hadoop hadoop-client 2.7.3 org.apache.hive hive-cli 2.1.1 org.pentaho pentaho-aggdesigner-algorithm 5.1.5-jhyde test mysql mysql-connector-java

    4.4K40发布于 2021-04-27
  • 来自专栏复盘总结文章集合

    Pentaho CDE详细开发使用手册

    注:建议保存在public下,home下的文件会有pentaho用户权限配置影响访问或者去到pentaho文件夹里新建一个文件夹用于保存及分类。 数据格式: 许可证类型 总数 生产许可证 5947 经营许可证 233720 6、去到pentaho文件浏览 ? 7、打开data数据源文件 ? 8、选择数据源 ? response; } }) return jsonData; }; //url_first_bar是访问cda页面给到的请求数据路径(更改为复制的地址) var url_first_bar = "/pentaho 注:pentaho访问地址尽量为ip地址 ? 修改预览的页面的css样式:文件路径:pentaho-server\pentaho-solutions\system\pentaho-cdf\js\compressed\lib\Bootstrap\css

    1.9K20发布于 2019-05-28
  • 来自专栏路过君BLOG from CSDN

    pentaho server 9.2 配置mysql数据源

    配置 2.1 设置quartz /pentaho-server/pentaho-solutions/system/quartz/quartz.properties org.quartz.jobStore.driverDelegateClass 配置hibernate pentaho-server/pentaho-solutions/system/hibernate/hibernate-settings.xml <config-file>system /hibernate/mysql5.hibernate.cfg.xml</config-file> 2.3 替换默认的审计记录配置文件 拷贝pentaho-server/pentaho-solutions /system/dialects/mysql5/audit_sql.xml文件到pentaho-server/pentaho-solutions/system目录 2.4 配置Jackrabbit pentaho-server/pentaho-solutions/system/jackrabbit/repository.xml Repository,DataStore,Workspaces,PersistenceManager

    2.3K10编辑于 2021-12-07
  • 来自专栏故久

    Pentaho的下载与安装及其简单实用

    二、在环境变量中配置pentaho_java_home变量。值就是本地的jdk路径 ? 配置完毕后,点击Spoon.bat ? 打开后耐心等待一会儿。 三、创建数据库的连接 ?

    6.9K10发布于 2019-12-24
  • 来自专栏Hadoop数据仓库

    Pentaho Work with Big Data(二)—— Kettle提交Spark作业

    192.168.56.104安装Pentaho的PDI,安装目录为/home/grid/data-integration。 hostname (2)编辑spark-env.sh文件,写如下两行,如图1所示 export HADOOP_CONF_DIR=/home/grid/data-integration/plugins/pentaho-big-data-plugin $PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin export HADOOP_CONF_DIR=/home/grid/data-integration/plugins/pentaho-big-data-plugin README.txt input (2)执行Spark Submit Sample作业,部分结果如图6所示 图6 spark的UI控制台如图7所示 图7 参考: http://help.pentaho.com /Documentation/6.0/0L0/040/029 http://wiki.pentaho.com/display/EAI/Spark+Submit

    75630编辑于 2022-05-07
  • 来自专栏复盘总结文章集合

    Pentaho BI Server 批量上传文件排坑笔记

    本文讲的是实际操作中的小问题和小技巧, 这里要谈谈Pentaho BI Server对文件夹的操作,在项目使用pentaho cde图表开发完图表后,通常会迁移cde图表文件来完成开发与部署不同环境下的图表迁移 ,在迁移过程中发现BI Server可以对Pentaho中文件夹进行下载, ? 后面遇到有人问我Pentaho BI Server能否进行批量上传文件,因为upload每次只能上传一个文件,而当要上传文件夹时我就想到了可以通过将本地需要上传的文件夹打成zip然后上传到服务器做法, 发现pentaho上传文件时不能出现中文。 ? 注:上传成功后若发现某些文件看不到,则需要勾选显示隐藏文件 ?

    90330发布于 2019-05-28
  • 来自专栏Hadoop数据仓库

    Pentaho Work with Big Data(一)—— Kettle连接Hadoop集群

    准备研究一下Pentaho的产品如何同Hadoop协同工作。从简单的开始,今天实验了一下Kettle连接Hadoop集群。 192.168.56.104安装Pentaho的PDI,安装目录为/root/data-integration。 编辑相关配置文件 cd /home/grid/data-integration/plugins/pentaho-big-data-plugin/hadoop-configurations/cdh54 点击“测试”,结果如图6所示,连接HDFS成功 图6 参考: http://help.pentaho.com/Documentation/6.0/0L0/040/025 http:// help.pentaho.com/Documentation/6.0/0H0/070/030/010

    1.2K10编辑于 2022-05-07
  • 来自专栏路过君BLOG from CSDN

    pentaho pdi(kettle) spoon检测空流对象用法

    版本 pentaho-pdi-ce 9.2 说明 如果输入流为空时,输出流将自动添加一行空行(所有字段为null)。

    97910编辑于 2021-12-07
  • 来自专栏Hadoop数据仓库

    Pentaho Work with Big Data(三)—— 向Hadoop集群导入数据

    http://wiki.pentaho.com/download/attachments/23530622/weblogs_rebuild.txt.zip? http://wiki.pentaho.com/download/attachments/23530622/weblogs_parse.txt.zip?

    43820编辑于 2022-05-07
  • 来自专栏Hadoop数据仓库

    Pentaho Work with Big Data(七)—— 从Hadoop集群抽取数据

    http://wiki.pentaho.com/download/attachments/23530622/weblogs_aggregate.txt.zip? http://wiki.pentaho.com/download/attachments/23530622/weblogs_parse.txt.zip? 参考: http://wiki.pentaho.com/display/BAD/Extracting+Data+from+HDFS+to+Load+an+RDBMS http://wiki.pentaho.com

    46810编辑于 2022-05-07
  • 来自专栏Hadoop数据仓库

    Pentaho Work with Big Data(四)—— 转换Hive里的数据

    1. 建立hive表,导入原始数据,过程参考 http://blog.csdn.net/wzy0623/article/details/51133760 2. 建立一个作业,查询hive表,并将聚合数据写入一个hive表 (1)打开PDI,新建一个作业,如图1所示。

    40120编辑于 2022-05-07
  • 来自专栏超级架构师

    「集成架构」ETL工具大比拼:Talend vs Pentaho

    Talend与Pentaho之间的比较(信息图表) 以下是Talend与Pentaho的比较 ? Talend与Pentaho之间的主要区别 Talend和Pentaho Kettle在他们自己的市场中是无可挑剔的工具,下面是显着的差异: Talend: Talend是一个开源数据集成工具,而Pentaho Talend的支持主要存在于美国,而Pentaho的支持不仅存在于美国,而且还针对英国,亚太市场 虽然Talend和Pentaho工具都具有相似的特性,但是需要理解Pentaho Kettle具有轻微优势的 下面我们看到Pentaho Kettle到Talend的显着特征和突出产品: Pentaho水壶比Talend快两倍 与Talend的GUI相比,Pentaho kettle的GUI更易于运行 适应系统 与Pentaho Talend和Pentaho Kettle都是强大的,用户友好的,可靠的开源工具。

    2.6K21发布于 2019-09-08
  • 来自专栏Hadoop数据仓库

    Pentaho Work with Big Data(五)—— 格式化原始web日志

    本示例说明如何使用Pentaho MapReduce把原始web日志解析成格式化的记录。 编辑'Pentaho MapReduce'作业项,如图9到图11所示。 图9 图10 图11 说明: . 参考: http://wiki.pentaho.com/display/BAD/Using+Pentaho+MapReduce+to+Parse+Weblog+Data

    32510编辑于 2022-05-07
  • 来自专栏华章科技

    6个用于大数据分析的最好工具

    Pentaho的发行,主要以Pentaho SDK的形式进行。 Pentaho SDK共包含五个部分 Pentaho平台、Pentaho示例数据库、可独立运行的Pentaho平台、Pentaho解决方案示例和一个预先配制好的 Pentaho网络服务器。 其中Pentaho平台是Pentaho平台最主要的部分,囊括了Pentaho平台源代码的主体;Pentaho数据库为 Pentaho平台的正常运行提供的数据服务,包括配置信息、Solution相关的信息等等 ,对于Pentaho平台来说它不是必须的,通过配置是可以 用其它数据库服务取代的;可独立运行的Pentaho平台是Pentaho平台的独立运行模式的示例,它演示了如何使Pentaho平台在没有应用服务器 支持的情况下独立运行;Pentaho解决方案示例是一个Eclipse工程,用来演示如何为Pentaho平台开发相关的商业智能解决方案。

    1.6K20发布于 2018-08-15
领券