搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

Hive LLAP调优:每个守护进程的内存和堆大小计算

我正在调优具有Hive的集群，根据下面的链接，需要计算堆大小的值，但不确定*的含义是什么？我还有一个问题，关于如何计算hive.llap.daemon.yarn.container.mb的值，然后是ambari给出的默认值？我试图通过考虑这个值(*作为乘法)来计算这个值，并将容器值设置为yarn.scheduler.maximum.allocation.mb，但是HiveServer 2交互在调优后不会启动。

浏览 0修改于2019-02-14得票数 1

1回答

如何调优Hive插入覆盖分区？

我在单元中编写了插入覆盖分区，以便将分区中的所有文件合并为更大的文件，SET hive.exec.compress.output=true;set hive.merge.mapredfiles=true;SET mapreduce.max.split.sizemapreduce.min.split.size=256000000; SET mapreduce

浏览 2提问于2016-04-04得票数 2

回答已采纳

1回答

Java设计调优参数对象

作为其中的一部分，我有一个类表示我的调优参数。最后，我要检查所有的整定参数，并计算精度。例如，调优参数可以是k近邻的k值，从1到9。其次，我想为这个对象创建某种迭代器。方法getNextPair()应该返回下一组调优参数，直到hasNext()返回false为止

浏览 5提问于2016-03-09得票数 0

回答已采纳

2回答

配置单元查询性能调优

我是hadoop & hive的新手。对于运行在cloudera 5.2.1上的Apache Hive，您能建议一些性能调整步骤吗？为了提高配置单元查询性能，有哪些调优参数配置单元查询:-配置单元表格创建为外部，选项为“存储为文本格式”，表格属性如下:- 更改配置单元下面的设置后，我们发现性能提

浏览 0提问于2015-04-02得票数 1

1回答

mlr3超带调谐中的配置数

如何控制在mlr3中的超带调优期间评估的配置数？我注意到，当我在xgboost()中调优6个参数时，代码会评估大约9种配置。当我在catboost()中调优相同数量的参数时，代码从评估729个配置开始。在这两种情况下，我都使用eta =3。

浏览 4提问于2022-02-08得票数 0

回答已采纳

1回答

从{kernlab}理解{插入}序列(tuneLength=)和支持向量机方法

来自{caret}文档：表示调优参数网格中粒度大小的整数。默认情况下，此参数是由train生成的每个调优参数的级别数。例如，M1 (svmRadial)和M3 (svmRadialSigma)都采用和给定相同的调参数，但基于调用$results似乎使用它们不同？我对train(tuneLength = 9)的理解是，这两个模型都会产生sigma和C的结果，每个模型都带有9 values, 9 times，因为9</em

浏览 9修改于2016-08-09得票数 16

回答已采纳

1回答

spark.sql.hive.filesourcePartitionFileCacheSize

SharedInMemoryCache: Evicting cached table partition metadata from memory due to size constraints谢谢

浏览 21修改于2019-02-05得票数 3

2回答

AWS Athena的SerDe属性列表

我以"ignore.malformed.json" = "true"为例使用了这个选项，但我非常确定还有很多其他选项可以调优查询。我看过Apache Hive文档，但找不到这个，在AWS文档/论坛上也找不到。谢谢!

浏览 0修改于2018-03-04得票数 6

1回答

可以跳过自动SQL调优顾问作业中的特定sql语句吗？

我面临一个ORA:7445问题与自动sql调优顾问。自动sql调优顾问不断失败是否有任何方法从自动sql调优顾问作业中跳过此sql语句？

浏览 1修改于2017-01-22得票数 1

回答已采纳

2回答

每次调优的MySQL查询时间是不同的

我正在为缓慢的查询调优SQL查询时间，但是每次我得到不同的时间，所以我无法评估我的优化解决方案。例如，我运行了三次查询select * from abc where abc.status in (x,y,z) and abc.scale>123;，结果时间为5s、11s、9s。如何获得一个干净的沙箱来调优慢速查询？

浏览 0修改于2011-07-14得票数 2

1回答

调优使用基础HBase表的Hive查询

我在Hbase中有一个表，比方说"tbl“，我想使用Hive查询它。我将表映射为单元，如下所示：STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler当我查看作业跟踪器上的hive生成的映射作业时，我发现"map.input.records“对Hbase表中的所有项进行了计数，这意味着作业在启动任何映射器之前就会

浏览 1提问于2015-05-06得票数 9

1回答

Hive Tez reducers运行速度非常慢

我真的不确定如何调优查询并使其运行得更快。目前，我正在做试错，看看这是否能产生一些结果，但这似乎不是working.Mappers运行得更快，而是reducers需要永远完成。SET hive.execution.engine=tez; SET hive.qubole.cleanup.partial.data.on.failure=2; SET hive.mapred.

浏览 154修改于2019-02-02得票数 3

回答已采纳

1回答

决策树的超参数调优然后在Adaboost中单独使用还是同时产生相同的结果？

所以，我在这里的困境是，我在一个独立决策树分类器上执行了超参数调优，我得到了最好的结果，现在轮到独立的Adaboost，但是这里是我的问题所在，如果我在Adaboost中使用调优的决策树作为base_estimator，那么我只对Adaboost执行超参数调优，它会产生与尝试对未调优的Adaboost和未调优的决策树同时作为base_estimator执行超参数调优的结果吗?

浏览 0提问于2021-09-15得票数 0

回答已采纳

1回答

星星之火SQL - Hivecontext -从一个表到另一个表格的数据副本

我用Spark代码将数据从一个Hive表复制到另一个Hive表(外部)，数据量为7400万行(~50 GB)。插入操作需要超过40分钟。hdfs_exports_ dev_work.WORK_CUSTOMER /CUSTOMER’导入外部表dev_work.WORK_CUSTOMER； CDH 5.8，19节点群请您帮助调优性能以找到执行快速数据复制的其他方法

浏览 3提问于2017-08-22得票数 1

回答已采纳

1回答

火花公子中的执行蜂巢查询

我如何调优python代码来使用本机单元引擎，而不是pyspark来执行下面的查询？select count(com_dq), col1 from ( select col1, case when col2 not in (select distinct col3 from hive_Schema_name_1.table_name_1 where col4=1 AND col5='ABC' ) then 1 else 0 end as com_dq from hive_Schema_name_2.ta

浏览 1修改于2022-10-05得票数 0

1回答

自定义翻译器-培训后的模型调整

没有字典文件，也没有调优文件。训练结束后，我检查了测试结果，我想在模型中做一些调整。以下是几个问题：无法看到自动生成的调优文件，因此我必须提供自己的调优文件，以便进行更易于管理的调优过程。是这样吗？请描述如何生成调优文件，当我有3个不同

浏览 3提问于2020-04-10得票数 2

1回答

Hyperopt与默认值

当我使用hyperopt库来调优随机森林分类器时，我得到了以下结果：然而，当我使用默认的超参数来训练模型时，所有的评估指标(精度、召回、F1、iba、AUC)都会返回比调优模型更高的值。我还应该继续跟踪调优参数吗？或者忽略调优过程的结果，因为它无助于改进结果？

浏览 0提问于2019-05-27得票数 4

2回答

大型数据仓库上的Pyspark

interpreterZeppelin运行在3.1.0.3.1.0.0-78)Initial客户端，数据存储在Hive上(Hive 3.1.0.3.1.0.0-78)Initial Dataframe是通过使用llap :查询Hive创建的)。from pyspark_llap import HiveWarehouseSessionDataframe大小为6千万行，在相同环境下执行的9次操作

浏览 0修改于2020-08-27得票数 0

2回答

什么是机器学习中的调优？

我是机器学习的新手，对调优感到困惑。机器学习中调优的目的是什么？为算法选择最佳参数？调优是如何工作的？

浏览 0提问于2014-04-07得票数 12

回答已采纳

5回答

是否有人认为垃圾收集调优是有用的？

我读过很多关于用Java调优GC的文章，经常想知道有多少人真正使用了一些更高级的特性。我总是避免在可能的情况下进行调优，并专注于编写我所能编写的最简单的代码(Brian的建议)--到目前为止，这似乎对我很有帮助。这些调优策略是否具有跨VM版本变化的弹性，还是需要不断的重新评估？我使用过的一个调优是-server标志。

浏览 1修改于2009-03-08得票数 21

回答已采纳

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

Hive LLAP调优:每个守护进程的内存和堆大小计算

如何调优Hive插入覆盖分区？

Java设计调优参数对象

配置单元查询性能调优

mlr3超带调谐中的配置数

从{kernlab}理解{插入}序列(tuneLength=)和支持向量机方法

spark.sql.hive.filesourcePartitionFileCacheSize

AWS Athena的SerDe属性列表

可以跳过自动SQL调优顾问作业中的特定sql语句吗？

每次调优的MySQL查询时间是不同的

调优使用基础HBase表的Hive查询

Hive Tez reducers运行速度非常慢

决策树的超参数调优然后在Adaboost中单独使用还是同时产生相同的结果？

星星之火SQL - Hivecontext -从一个表到另一个表格的数据副本

火花公子中的执行蜂巢查询

自定义翻译器-培训后的模型调整

Hyperopt与默认值

大型数据仓库上的Pyspark

什么是机器学习中的调优？

是否有人认为垃圾收集调优是有用的？

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐