我正在尝试实现我自己的家庭自动化基础设施,目前我能够用这样的流程与一些自制的设备进行语音交互:
语音=> GooogleHomeDevice -> IFTTT.COM-Applet -> IO.ADAFRUIT.COM-Feed -> ESP32(MQTT) =>设备
由于IFTTT/IO.ADAFRUIT节点的一些限制,我想切换到这样的流:
语音=> GooogleHomeDevice -> (某事) -> GC-Functions -> ESP32(MQTT) =>设备
我需要一种功能,允许我用文本格式的声音命令提供Google函数,以便GCF将它们提供给另一个服务(GC PubSub),就像IFTTT.COM-Applet对IO.ADAFRUIT.COM-Feed所做的那样。
IFTTT.COM服务执行任务的方式看起来非常简单,因为它只需要“只”使用我的Google来拦截我的交互(我知道有很多东西可以隐藏在幕后)。
我一直在寻找替代解决方案,但就目前而言,我所发现的只是许多组件之间的复杂交互(Google助手,在Google上的操作,Firebase,.)。
在我开始构建如此复杂的东西之前,我想知道如何实现捕获我的声音命令的唯一“简单任务”(可能不使用GCP以外的特性)。
谢谢。
发布于 2021-02-25 16:57:33
捕捉声音命令的另一种解决方案是使用带有命令和搜索模型的语音到文本API (此模型专门用于转录较短的音频剪辑),并将话语设置为true。
https://stackoverflow.com/questions/65886625
复制相似问题