你将在这一章学到bolt生命周期,一些bolt设计策略,以及几个有关这些内容的例子。 Bolt生命周期 Bolt是这样一种组件,它把元组作为输入,然后产生新的元组作为输出。
Storm集群的输入流由一个被称作spout的组件管理,spout把数据传递给bolt,bolt要么把数据保存到某种存储器,要么把数据传递给其它的bolt。
一个据数流组指定了每个bolt会消费哪些数据流,以及如何消费它们。 NOTE:一个节点能够发布一个以上的数据流,一个数据流组允许我们选择接收哪个。
Storm是用Java实现的,你看到的所有这本书中的spout和bolt都是用java编写的。那么有可能使用像Python、Ruby、或者JavaScript这样的语言编写spout和bolt吗?
要创建这个拓扑,我们要用一个spout读取文本,第一个bolt用来标准化单词,第二个bolt为单词计数,如图2-1所示。
这个元组的内容是拓扑里下一个bolt的输入。 GetCategoryBolt 这个bolt非常简单。它只负责反序列化前面的spout分发的元组内容。
spout并行分批创建供bolt处理的元组(译者注:下文将这种分批创建、分批处理的元组称做批次)。其中一些bolt作为提交者以严格有序的方式提交处理过的批次。

扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2026 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059
粤公网安备44030502008569号
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号
