我有一个表,几乎有90列,并且还在上面使用了范围分区。这个表有将近50lacs的记录。当我在查询中使用GROUP BY时,它在explain语句中显示"using temporary“和"filesort”。
查询:
SELECT
subscribe_time * 0.000001 AS start_date,
subscribe_time * 0.000001 AS end_date,
(
IFNULL(
ROUND(
SUM(
CASE WHEN(
subscribe_duration > 20000 AND subscribe_status = '1'
) THEN 1 ELSE 0
END
) /(
SUM(
CASE WHEN(subscribe_status = '1') THEN 1 ELSE 0
END
)
) * 100,
2
),
0
)
) AS subscribe_avg
FROM
tbl_subscription a
WHERE
1 AND subscribe_time > 0 AND subscribe_time BETWEEN "1525113000000000" AND "1524680999999999"
GROUP BY
EXTRACT(
YEAR
FROM
FROM_UNIXTIME(subscribe_time * 0.000001)
),
EXTRACT(
MONTH
FROM
FROM_UNIXTIME(subscribe_time * 0.000001)
),
EXTRACT(
WEEK
FROM
FROM_UNIXTIME(subscribe_time * 0.000001)
),
EXTRACT(
DAY
FROM
FROM_UNIXTIME(subscribe_time * 0.000001)
),
sub_user,
subscribe_ip,
subscribe_zone,
subscribe_approvalfield1上已经提供了索引。field1不是我们的PK。总共给出了5列索引。
当我写GROUP BY查询的时候,执行起来差不多花了43秒。当我删除GROUP BY时,它花费了0.27秒的执行时间。
另外,当我们最后写"ORDER BY NULL“的时候,文件排序就被移除了。但是我不想在查询中使用ORDER BY。如何减少查询执行时间?
此外,我也尝试从单个分区获取数据,但查询仍然花费了相同的时间。从单个分区获取数据的查询:
SELECT field1, field2 FROM TABLE_NAME PARTITION(p1) WHERE 1 AND
field1='SOME_VALUE' GROUP BY field1;给出一些减少查询执行时间的建议。
发布于 2018-06-01 08:57:06
GROUP BY的第一个表达式可能可以替换为
subscribe_time或者也许
FLOOR(subscribe_time * 0.000001)我认为没有必要仅仅为了做GROUP BY而拆分它。
你能提供SHOW CREATE TABLE吗?-我们需要查看索引,分区,可能还有其他细节。具体地说,它是否具有其中一项或两项
PARTITION BY RANGE(subscribe_time)
INDEX(subscribe_time)https://stackoverflow.com/questions/50597122
复制相似问题