我有一个包含大约600万行每日数据的DataFrame,我将使用这些数据来找出某些技术标记如何影响它们各自股票的长期表现。我有两种方法,推荐哪一种?
我不知道还有什么更昂贵的计算--计算所有行的技术标记,甚至是不需要的行,或者对主表进行查找。谢谢。
发布于 2017-05-23 16:51:58
我认为最简单和最有效的途径是有两个表。原因是,对于1大表,您的算法可以采用O(n^2),因为您必须对标记中的每个元素迭代n次,然后对每个元素匹配n次,以满足每个性能。
如果您使用了2表方法,则复杂度将达到O(n * m),其中n是技术标记的数目,然后m是性能中的记录数。在这个用例中,我会想象你的n是基于你想要看的任何一组,而不是整个集合,所以这意味着你的n
或者,如果您能够构建一个主查找表来捕获性能和技术标记之间的所有关系,那么您的复杂性本质上就是一个哈希查找或O(1)。
https://stackoverflow.com/questions/44140675
复制相似问题