文章/答案/技术大牛

发布

社区首页 >问答首页 >Python:对InfluxDB的查询在几次连续调用后变慢了

问Python:对InfluxDB的查询在几次连续调用后变慢了
EN

Stack Overflow用户

提问于 2019-07-16 22:48:00

回答 1查看 180关注 0票数 0

我在一台内存为8 GB的Macbook上的docker容器中运行了一个Influx-DB实例(所以我已经达到了极限)。我正在编写一个Python程序，执行对数据库的查询。由于获取大块数据失败并出现超时，因此我执行顺序调用，获取属于一个小时的数据获取的数据。这是我顺序调用数据库的代码：

for day in range(15,25,1):
        for hour in range(0,24, 1):
            lowerDate = '2019-03-' + f'{day:02}'
            lowerHour = f'{hour:02}' + ':00:00'
            upperDate = lowerDate
            upperHour = f'{hour:02}' + ':59:59'
            rawDataSet: pd.DataFrame = influxDataReader.getRawDataByAcqTimeFrame(lowerDate=lowerDate,
                                                                           lowerTime=lowerHour,
                                                                           upperDate=upperDate,
                                                                           upperTime=upperHour)

            if rawDataSet is not None and rawDataSet.size > 0:
                resultRawData = resultRawData.append(rawDataSet)
                print('Got data for ' + lowerDate + 'T' + lowerHour + '. resultRawData.size = ' +
                      str(resultRawData.size))
            else:
                print('No data: ' + lowerDate + 'T' + lowerHour + '.')

            time.sleep(1.0)

方法getRawDatabyTimeFrame：

def getRawDataByAcqTimeFrame(self, lowerDate: str, lowerTime: str, upperDate: str, upperTime: str):
    queryStatement = """SELECT rawdata,
     sequenceStartStamp, 
     timestampCycle
     from YRT1DT1F_rawdata 
     WHERE time >= '""" + \
                     lowerDate + 'T' + lowerTime + '.0Z' + """' AND time <= '""" + \
                     upperDate + 'T' + upperTime + '.0Z' + """'"""

    result: pd.DataFrame = pd.DataFrame(self._influxConnector.executeQueryStatement(queryStatement).get_points())
        if dropDuplicateRows:
            result = result.drop_duplicates()
        return result

最后是"executeQuery()“方法：

def executeQuery(self, selectStatement: str, chunked: bool = False, chunksize: int = 10000) -> influxdb.resultset.ResultSet:
    if self._influxClient is None:
        print('Initializing DB...')
        self.initDbClient()

    try:
        queryResult: influxdb.resultset.ResultSet = self._influxClient.query(selectStatement,
                                                                             chunked=chunked,
                                                                             chunk_size=chunksize)
    except Exception as err:
        print('Error while executing DB statement: ' + selectStatement + '. Error message: ' + str(err))
    finally:
        self._influxClient.close()

    try:
        queryResult
    except Exception as err:
        print('queryResult was not assigned.')
        raise err
    else:
        return queryResult

此代码如期返回前三次调用(2019-03-15T00:00:00.0Z - 2019-03-15T02:59:59.0Z)的数据。在2019-03-15T03:00:00和2019-03-22T23:59:59之间，数据库中没有可用的数据，因此代码返回一个空的rawDataSet并发出消息"No data：...“和预期的一样。

问题是此代码的执行速度快到2019-03-17T23:00:00 (返回空rawDataSet的调用每~秒执行一次)。然后，从2019-03-18T:00:00:00开始，执行速度急剧减慢:每个“空”调用突然花费30秒甚至一分钟。

这可能是什么原因呢？

python

performance

influxdb

回答 1

Stack Overflow用户

发布于 2019-07-17 02:22:38

在CLI模式下运行此查询需要多长时间？

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/57059994

复制

相似问题

问Python:对InfluxDB的查询在几次连续调用后变慢了
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python:对InfluxDB的查询在几次连续调用后变慢了EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python:对InfluxDB的查询在几次连续调用后变慢了
EN