首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python:对大容量实时数据流进行在线处理

Python:对大容量实时数据流进行在线处理
EN

Stack Overflow用户
提问于 2021-02-01 14:02:15
回答 1查看 51关注 0票数 0

我在不同的websockets (传感器数据-每月几个TBs )上输入了一些大容量数据,其中

我希望保证所有数据都存储在中,即使在高负载期间也是如此。

因此,我希望将数据分派到我的数据库和实时处理模块(例如GUI、ML预测等),其方式是:

它缓冲的数据,以防所述模块的处理太慢,这样当负载减少时,这些模块就可以‘追赶’。

我尝试过的内容:带有队列(来自队列模块或线程模块)的 python线程,但是如果它阻塞了,我无法确保数据不会阻塞,如果它的非阻塞(例如asyncio.Queue),我会得到竞争条件,事情就会崩溃。

所以,也许我应该使用某种回调方法,但我不知道该寻找什么。我希望问题不要太含糊。--如果有人知道我可以尝试什么--最好只使用python,那将对我有很大的帮助,即使这只是一个想法。

EN

回答 1

Stack Overflow用户

发布于 2021-02-02 11:20:19

,所以也许我应该使用某种回调方法,但我不知道该寻找什么。

看来你需要一个Future

我尝试了什么:具有队列(来自队列模块或线程模块)的python线程,但是如果它是阻塞的,我不能确保数据不阻塞,如果它的非阻塞(例如asyncio.Queue),我会得到竞争条件,事情就会崩溃。

您可以尝试使用Queue的非阻塞方法。

以及当queue.Emptyqueue.Full异常捕获时查询数据库。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/65994051

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档