文章/答案/技术大牛

发布

社区首页 >问答首页 >Mysql查询调优(大数据集)和解释计划

问Mysql查询调优(大数据集)和解释计划
EN

Stack Overflow用户

提问于 2014-04-15 13:51:14

回答 1查看 854关注 0票数 0

我使用mysql5.1，我有一个表，它有大约1500万个(150万) records.This表，有不同实体的记录，即所有主实体的子记录。

该表中有8列，其中有6列为主键。这些列可能是单独的外键，但由于性能原因，我们已经做了此更改。

即使一个带有两个条件的简单select语句也采用6-8 seconds.Below作为相同的解释计划。

查询

explain extended 
 select distinct location_code, Max(trial_number) as replication
   from status_trait  t  
  where t.status_id='N02'
    and t.trial_data='orange'
  group by location_code

解释推广的结果

id  select_type table   type    possible_keys   key key_len ref rows    filtered    Extra
 1  SIMPLE  t   index       FK_HYBRID_EXP_TRAIT_DTL_2   5       1481572 100.00  Using where; Using index

我有以下问题：

如何处理具有大数据的表
是否为此表建立良好的索引

explain

mysql

optimization

normalization

回答 1

Stack Overflow用户

发布于 2014-04-15 14:47:06

有两件事可能对你有帮助。

首先，在聚合查询中，SELECT DISTINCT是没有意义的。只需使用SELECT。

其次，您没有公开您创建的索引。然而，为了有效地满足这个查询，下面的复合覆盖索引可能会有很大帮助。

(status_id, trial_data, location_code, trial_number)

为什么这是正确的指数？因为MySQL索引被组织为BTREE。此组织允许服务器随机访问索引以查找特定值。在您的情况下，您需要status_id和trial_data的特定值。一旦服务器对索引进行了随机访问，就可以按顺序进行扫描.在这种情况下，您希望扫描location_code的各种值。服务器知道它将按照顺序找到这些不同的值。最后，服务器需要提取trial_number的值，以便在MAX()函数中使用。瞧，他们就在指数里，准备好准备采摘了。

(如果要对大型表进行大量的聚合和查询，那么了解复合索引和覆盖索引是如何工作的是有意义的。)

添加索引是有代价的:当您使用INSERT或UPDATE行时，您也必须更新索引。但是这种索引会大大加快你的检索速度。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/23085734

复制

相似问题

问Mysql查询调优(大数据集)和解释计划
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Mysql查询调优(大数据集)和解释计划EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Mysql查询调优(大数据集)和解释计划
EN