搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

Hive LLAP调优:每个守护进程的内存和堆大小计算

我正在调优具有Hive的集群，根据下面的链接，需要计算堆大小的值，但不确定*的含义是什么？我还有一个问题，关于如何计算hive.llap.daemon.yarn.container.mb的值，然后是ambari给出的默认值？我试图通过考虑这个值(*作为乘法)来计算这个值，并将容器值设置为yarn.scheduler.maximum.allocation.mb，但是HiveServer 2交互在调优后不会启动。

浏览 0修改于2019-02-14得票数 1

1回答

如何调优Hive插入覆盖分区？

我在单元中编写了插入覆盖分区，以便将分区中的所有文件合并为更大的文件，SET hive.exec.compress.output=true;set hive.merge.mapredfiles=true;SET mapreduce.max.split.sizemapreduce.min.split.size=256000000; SET mapreduce

浏览 2提问于2016-04-04得票数 2

回答已采纳

2回答

配置单元查询性能调优

我是hadoop & hive的新手。对于运行在cloudera 5.2.1上的Apache Hive，您能建议一些性能调整步骤吗？为了提高配置单元查询性能，有哪些调优参数配置单元查询:-配置单元表格创建为外部，选项为“存储为文本格式”，表格属性如下:- 更改配置单元下面的设置后，我们发现性能提

浏览 0提问于2015-04-02得票数 1

1回答

火花公子中的执行蜂巢查询

我如何调优python代码来使用本机单元引擎，而不是pyspark来执行下面的查询？select count(com_dq), col1 from ( select col1, case when col2 not in (select distinct col3 from hive_Schema_name_1.table_name_1 where col4=1 AND col5='ABC' ) then 1 else 0 end as com_dq from hive_Schema_

浏览 1修改于2022-10-05得票数 0

1回答

为什么SQL_PROFILE不给出建议？

我正在尝试从sqlplus运行sql调优顾问。l_sql_tune_task_id := DBMS_SQLTUNE.create_tuning_task (END;要执行调优： EXEC DBMS_SQLTUNE.execute_tuning_tas

浏览 2修改于2017-09-04得票数 3

回答已采纳

1回答

特兹。慢速减速器

我试图从Hive读取日志数据，将其按id、日期和其他参数分成若干块，然后写入另一个单元表。但是最后5个减速器工作了大约一个小时。谢谢你的建议。

浏览 3提问于2016-02-15得票数 1

1回答

spark.sql.hive.filesourcePartitionFileCacheSize

SharedInMemoryCache: Evicting cached table partition metadata from memory due to size constraints谢谢

浏览 21修改于2019-02-05得票数 3

2回答

AWS Athena的SerDe属性列表

我以"ignore.malformed.json" = "true"为例使用了这个选项，但我非常确定还有很多其他选项可以调优查询。我看过Apache Hive文档，但找不到这个，在AWS文档/论坛上也找不到。谢谢!

浏览 0修改于2018-03-04得票数 6

1回答

可以跳过自动SQL调优顾问作业中的特定sql语句吗？

我面临一个ORA:7445问题与自动sql调优顾问。自动sql调优顾问不断失败是否有任何方法从自动sql调优顾问作业中跳过此sql语句？

浏览 1修改于2017-01-22得票数 1

回答已采纳

1回答

火花提交工作表现

最后它将使用createDataFrame并将数据帧保存到Hive表中。", "true").getOrCreate()) lines = sparkSession.read.textdriver-memory 4g --executor-memory 8g --executor-cores 3 --files /usr/lib/spark-2

浏览 1修改于2017-02-08得票数 0

回答已采纳

1回答

调优使用基础HBase表的Hive查询

我在Hbase中有一个表，比方说"tbl“，我想使用Hive查询它。但是像这样的查询 select id from tbl where data["777"] IS当我查看作业跟踪器上的hive生成的映射作业时，我发现"map.input.records“对Hbase表中的所有项进行了计数，这意味着作业在启动任何映射器之前就会进行完整的表扫描！因此，我的问题是-为什么用于<em

浏览 1提问于2015-05-06得票数 9

1回答

Hive Tez reducers运行速度非常慢

我真的不确定如何调优查询并使其运行得更快。目前，我正在做试错，看看这是否能产生一些结果，但这似乎不是working.Mappers运行得更快，而是reducers需要永远完成。SET hive.execution.engine=tez; SET hive.qubole.cleanup.partial.data.on.failure=2; SET hive.mapred.

浏览 154修改于2019-02-02得票数 3

回答已采纳

1回答

R:插入符号如何选择默认的调优范围？

当使用R caret对同一数据集中的多个模型进行比较时，如果为所有模型指定了相同的tuneLength，而没有指定特定于模型的tuneGrid，则caret足够聪明地为不同的模型选择不同的调优范围。例如，caret为一个特定数据集选择的调优范围是：gamSpline(df)：1，1.5，2，2.5，3有人知道caret是如何确定这些默认调优</e

浏览 4修改于2015-11-07得票数 4

回答已采纳

1回答

决策树的超参数调优然后在Adaboost中单独使用还是同时产生相同的结果？

所以，我在这里的困境是，我在一个独立决策树分类器上执行了超参数调优，我得到了最好的结果，现在轮到独立的Adaboost，但是这里是我的问题所在，如果我在Adaboost中使用调优的决策树作为base_estimator，那么我只对Adaboost执行超参数调优，它会产生与尝试对未调优的Adaboost和未调优的决策树同时作为base_estimator执行超参数调优的结果吗?

浏览 0提问于2021-09-15得票数 0

回答已采纳

3回答

Server 2012:如何在列中找到公共值

Server 2012:如何在列中找到公共值AADSCLS'select 4, 'Arun', 'RREDFTLS'select 4, 'Arun', 'RREDFTNG'selec

浏览 7修改于2015-08-21得票数 2

回答已采纳

1回答

星星之火SQL - Hivecontext -从一个表到另一个表格的数据副本

我用Spark代码将数据从一个Hive表复制到另一个Hive表(外部)，数据量为7400万行(~50 GB)。插入操作需要超过40分钟。hdfs_exports_ dev_work.WORK_CUSTOMER /CUSTOMER’导入外部表dev_work.WORK_CUSTOMER； CDH 5.8，19节点群请您帮助调优性能以找到执行快速数据复制的其他方法

浏览 3提问于2017-08-22得票数 1

回答已采纳

1回答

自定义翻译器-培训后的模型调整

没有字典文件，也没有调优文件。训练结束后，我检查了测试结果，我想在模型中做一些调整。以下是几个问题：无法看到自动生成的调优文件，因此我必须提供自己的调优文件，以便进行更易于管理的调优过程。是这样吗？请描述如何生成调优文件，当我有3个不同

浏览 3提问于2020-04-10得票数 2

1回答

Hyperopt与默认值

当我使用hyperopt库来调优随机森林分类器时，我得到了以下结果：然而，当我使用默认的超参数来训练模型时，所有的评估指标(精度、召回、F1、iba、AUC)都会返回比调优模型更高的值。我还应该继续跟踪调优参数吗？或者忽略调优过程的结果，因为它无助于改进结果？

浏览 0提问于2019-05-27得票数 4

4回答

使用哪个mysql版本- 5.1还是5.5？

我在这个网站上看到一篇文章说，在某些情况下，5.5可能比5.1慢，但是一些调优会使它足够好。如果调优完成，那么使用5.5是否可取？还是5.1表现更好？编辑这是我上面提到的帖子的链接- https://stackoverflow.com/questions/9202825/mysql-5-5-perfomance

浏览 0修改于2017-08-31得票数 2

回答已采纳

1回答

数据准备，选择算法

基本上，我试图调优一个有数字旋钮和数字输出的对象。通过进行蛮力调优(排列)，可以找到输出的理想值，但这需要时间。我正在尝试使用ML至少缩短调优过程。📷 我有一个数据集，为大量优秀的单位，成功地调优，但在各种尝试。X = 10, Y = 5, Z = 3.9 => lucky!!!Try 10 => A = 1.4, B = 2.6, C = 3.8 ; X = 10, Y = 5, Z = 3.9 =&g

浏览 0修改于2020-02-19得票数 1

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

Hive LLAP调优:每个守护进程的内存和堆大小计算

如何调优Hive插入覆盖分区？

配置单元查询性能调优

火花公子中的执行蜂巢查询

为什么SQL_PROFILE不给出建议？

特兹。慢速减速器

spark.sql.hive.filesourcePartitionFileCacheSize

AWS Athena的SerDe属性列表

可以跳过自动SQL调优顾问作业中的特定sql语句吗？

火花提交工作表现

调优使用基础HBase表的Hive查询

Hive Tez reducers运行速度非常慢

R:插入符号如何选择默认的调优范围？

决策树的超参数调优然后在Adaboost中单独使用还是同时产生相同的结果？

Server 2012:如何在列中找到公共值

星星之火SQL - Hivecontext -从一个表到另一个表格的数据副本

自定义翻译器-培训后的模型调整

Hyperopt与默认值

使用哪个mysql版本- 5.1还是5.5？

数据准备，选择算法

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐