我需要运行一组长期的数据处理活动,从某些cosmos db容器中获取数据。我没有看到容器中有一个字段可以帮助我或多或少地在蔚蓝函数之间分配负载。我想知道是否有任何哈希函数允许我使用mod函数进行经典的分区,假设我决定从orchestrator运行10个活动,并查询类似的数据
select * from c where hash(c.id) % 10 = {functionNumber}。
我知道它会在10个函数中的每一个做一个完整的扫描,但它是好的,均匀分布的负载在这种情况下更重要。它的持续时间很长,不是因为数据量,而是由于数据处理的复杂性。
发布于 2021-11-22 20:02:36
替代散列按字段(似乎不是Cosmos SQL的一部分),我决定在Cosmos Db中使用模块化函数和时间戳_ts
例如,10个活动总数中的第5个活动将查询以下数据:SELECT VALUE root FROM root WHERE (root["_ts"] % 10) = 5)
https://stackoverflow.com/questions/70061304
复制相似问题