我正在设法解决一个看似简单的问题,但我无法使自己相信正确的方法。
我有时间序列数据,代表一个功率输出(P)的pdf,随着时间的变化,还有of和分位数函数- f(P,t),F(P,t)和q(p,t)。我需要在给定的时间间隔t1,t2中找到能量的pdf,cdf和分位数函数,比如e(),E()和qe()。
很明显,能量是t1,t2上幂的积分,但是我怎样才能最好地计算e,e和qe呢?
我最好的猜测是,既然q(p,t)是幂,我应该通过在时间间隔上积分Q来产生qe,然后再根据它计算其他的分布。
它是这么简单,还是我需要掌握随机微积分?
澄清的其他详细信息
我们得到的数据是关于f(P),F(P),q(P)对每次t的‘黑匣子’预测的时间序列,其中P是瞬时功率,对于我想得到e(P)的间隔,大约有100个预测。所谓“黑盒”,我的意思是有一个函数,我可以调用它来计算P的f,F,q,但是我不知道基本的分布。
黑匣子函数几乎肯定是从产生功率预测的模型中插入输出数据,但我们不能访问它。我猜想它不会是任何简单的东西,因为它来自一个非线性转换链。这实际上是风电场的生产预测:风速可能是正态分布的,但是多个地形和涡轮机的转换会改变这一点。
进一步澄清了(我编辑了原始文本以删除能量分布函数中令人困惑的变量名称)。
有关预测如下:
我们需要e,E和qe的区间t1,t2被细分为100 (比方说)子区间k=1...100.对于每一个k,我们得到一个不同的f(P),称为f_k(P)。我们需要计算这组f_k(P)的区间的能量分布。
发布于 2015-06-01 17:43:08
谢谢你的澄清。据我所知,你没有足够的信息来正确地解决这个问题。具体来说,你需要从一个时间步骤到下一个步骤,对能量的依赖性进行一些估计。时间越长,依赖性就越小;如果步骤足够长,权力可能从一个步骤到下一个步骤几乎是独立的,这将是个好消息,因为这将大大简化分析。那么,时间的步数是多长?一个小时?一分钟?一天?
如果时间步长足够独立,能量的分布就是100个变量的分布,中心极限定理几乎是正态分布。在这种情况下,很容易计算出总能量的平均值和方差。
否则,分布将是一些更复杂的结果。我的猜测是,独立步骤方法估计的方差会太大--我相信实际的差异会稍微小一些。
根据你所说的,你没有任何关于时间依赖性的信息。也许你可以找到或从其他来源得到一个估计自相关函数--如果这个问题已经被风电研究过的话,我也不会感到惊讶。如果这个问题的一般版本已经被研究过了,我也不会感到惊讶--也许你可以搜索“自相关变量之和的分布”。您可能会对stats.stackexchange.com上的这个问题感兴趣。
https://stackoverflow.com/questions/30546733
复制相似问题