首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏大模型机器人

    AI语音智能如何从根本上预防机器幻觉?

    随着大模型技术的飞速发展,AI语音智能正以前所未有的速度融入我们的生活。从智能客服、车载语音助手到个人虚拟伴侣,它们以其自然的交互方式和即时的响应能力,为我们带来了极大的便利。 试想,如果语音导航指引错误路线、医疗助手提供虚假药方,或客服代表承诺了不存在的服务,其后果将是灾难性的。因此,预防机器幻觉,确保AI语音智能的可信度与可靠性,已成为其能否真正赋能各行各业的关键。 一个优秀的语音智能必须学会“知之为知之,不知为不知”。不确定性校准:在模型训练中,引入机制使其能够评估自身回答的置信度。 例如,用户说“设置一个提醒”,智能应追问:“请问提醒的内容和时间是什么?” 事实上,让AI语音智能摆脱“幻觉”,变得可靠而可信,是一项复杂但至关重要的系统工程。

    33410编辑于 2025-11-06
  • 来自专栏杨熹的专栏

    智能语音时代》

    我们正在进入语音时代,从智能语音助手到智能家居,这些智能语音产品已经开始融入我们的生活了。 智能语音既是人工智能的起点,又是人工智能的终点。 我们驯化人工智能的方式,是让机器像人一样成长。 人工智能的演化逻辑,其实是在模拟人脑的进化。它有一项核心技术,叫做神经网络。和之前技术发展最大的不同是,它让机器可以自己学习进化。 从这个角度来看,我们可以说智能语音是人工智能的起点。 为什么说智能语音的发展,也可以说是人工智能的终点。当机器都可以预判,进行反事实分析的时候,就意味着它从某种程度上具备了人类主动思考的能力。

    3.2K30发布于 2020-04-14
  • 智能案例分析:IT新闻聚合智能

    智能案例分析:IT新闻聚合智能 IT新闻聚合智能通过自动化技术抓取、分析和呈现最新的IT行业动态。这类智能通常结合自然语言处理(NLP)和机器学习技术,从多个来源筛选高价值信息。 核心功能包括: 实时爬取主流科技媒体(如TechCrunch、Wired、The Verge) 自动分类(人工智能、网络安全、云计算等) 情感分析判断新闻倾向性 生成摘要简化阅读 典型应用场景: 投资机构追踪技术趋势

    35410编辑于 2025-12-17
  • 来自专栏用户6167002的专栏

    智能语音爬天井

    配图来自Canva可画 随着技术的升级、消费者需求的爆发以及大环境的变好,智能语音行业的发展愈发如火如荼,智能语音也在悄无声息地渗透进人们的日常生活。 另外,智能语音助手也逐渐成为了智能手机的“标配”,据Strategy Analytics数据显示,2018年全球销售的智能手机中已经有47.7%配置了人工智能语音助手。 作为人工智能的重要入口以及人工智能三大核心基础技术之一的智能语音,其重要性自然不言而喻。随着人工智能浪潮的来袭,不少企业都纷纷加码人工智能领域,其中智能语音行业的广阔前景也引得各方纷纷布局。 除了科大讯飞、捷通华声等智能语音科技企业之外,阿里、百度、腾讯、搜狗、苹果、谷歌等国内外巨头都在智能语音领域有所布局。 破局势在必行 面对这些挑战,智能语音领域的参与者们也从多方着手,寻求破局之道。 消费级市场和企业级市场的双双爆发,助推了智能语音的发展,智能语音市场也实现了快速扩容,现如今智能语音的应用场景也逐步拓宽至教育、汽车、家居、医疗等诸多场景,智能语音和这些场景相结合也成为了主流发展方向。

    1.5K20编辑于 2022-01-24
  • 智能语音相关介绍

    另外,通过让机器能听会说,语音也成为人机交互的重要入口。语音技术一般包括传输、存储、识别、合成、增强等方面,智能语音技术的研发主要聚焦于语音的识别理解、合成输出和声音增强。 随着信息技术的发展,智能语音技术已经成为人们信息获取和沟通最便捷、最有效的手段[1]。对智能语音技术的研究可追溯到上个世纪 50 年代,在经历了萌芽期、起步期、变革期后,目前正在进入发展高峰期。 由智能语音技术驱动的语音用户界面已成为键盘鼠标、触摸之后的新一代人机交互界面。 技术进步也带来了智能语音市场规模的快速增长,德勤报告显示,预计 2030 年消费级应用场景将超过 700 亿元,企业级应用场景在疫情的催化下也将加速发展,预计会达到干亿规模2.智能语音技术发展背景 深度神经网络(DNN,Deep Neural Network)通过多层非线性结构将输入特征转换为更加抽象的高层表示,具有更强3.智能语音关键技术 按语音的应用场景可以将智能语音技术分为人机交互和人人交流两大类

    1.7K10编辑于 2024-06-20
  • 智能来了!2026智能开发全面指南

    智能来了!2026智能开发全面指南 一、 繁华落尽后的“平静”:技术背后的选择逻辑“真正深入使用 AI 之后,我反而更平静了。” 在过去这段时间里,我深入钻研了 Python 编程、探究了 AIGC 的视觉极限、搭建了复杂的流程智能、甚至深入到了 STM32 的硬件底层。 而顶级的 AI 大模型与 Agent(智能),正是我能遇到的认知最高、脾气最好、思维最完善的存在。在我的「心枢」系统里,AI 不仅仅是执行任务的“器”,它更是我最好的老师、朋友、教练和员工。 在这里,我们筛选真需求,击碎伪智能,夺回 AI 时代的协作主权。 礼包内包含(持续更新):多维提示词库:包含智能设计规范、AI 绘画精准词簇、AI 视频叙事 Prompt。ComfyUI 极客工作流:从零搭建好的 json 配置文件,导入即用。

    32210编辑于 2026-01-24
  • 来自专栏算法之名

    AI智能

    messages) print(response.content) 这里的 ZHIPUAI_API_KEY 需要你自己去智普网站 https://open.bigmodel.cn 去注册就有,运行结果 智能助手显神通 你的角色是一个诗人.'), HumanMessage(content='用七言绝句的形式写一首关于AI的诗')] streaming_chat(messages) 运行结果 智能助手显神通

    78010编辑于 2024-09-29
  • 智能穿戴新纪元:语音支付一化,技术方案如何选?

    2026年,智能穿戴设备正从简单的健康监测工具,进化为集语音交互、移动支付于一的个人智能中枢。随着AI技术的深度渗透,语音识别已实现端侧离线高精度响应,支付功能也从扫码向语音、虹膜等无感方式演进。 一、语音交互与支付:智能穿戴的必争之地 当前,智能穿戴设备的交互方式正经历范式转移。端侧AI语音识别技术的成熟,使设备无需联网即可理解复杂自然语言指令,甚至在嘈杂环境中保持高准确率。 极致音视频体验:基于腾讯20年音视频技术积累,支持物联网设备端到端300毫秒低时延通话,结合智能编解码技术,可提供优质的语音对讲和画质超分体验。 结语 在智能穿戴设备迈向语音支付一化的进程中,选择一款功能全面、生态丰富、性能稳定的物联网平台是成功的基础。 建议厂商根据自身产品定位,结合平台特点进行技术选型,以最快速度、最低成本实现产品智能化升级,抢占2026年智能穿戴市场的新高地。

    15010编辑于 2026-02-24
  • 来自专栏云时之间

    智能结构

    智能的结构 迄今为止我们通过描述行为—在任何给定的感知序列下采取的行动—讨论了智能,现在我们不得不将知难而进,去讨论智能体内部是如何工作的,AI的任务是设计智能程序,通过它来把感知信息映射到行动的智能函数 注意智能程序和智能函数之间的差别。智能程序在于当前感知为输入,而智能函数是以整个历史为输入的。智能程序只把当前感知作为输入是因为环境无法得到更多的东西。如果智能的行动依赖于整个感知序列。 那么该智能不得不记住全部感知的信息。 *智能程序骨架还有其他的选择。例如我们可以让智能程序成为协同程序。 行动表明确的表示了每个智能程序实现的智能函数。要用这种方式来建造理性智能。作为设计者,我们必须构造包括各种可能的感知序列的适当行动的函数表。 在这个文章的以下部分,我想概述四种基本的智能程序,他们几乎涵盖了所有智能系统的基础准则: 1:简单反射型智能 2:基于模型的反射型智能 3:基于目标的智能 4:基于效用的智能 然后我们将概括的解释如何把这些智能转换成学习智能

    1.4K70发布于 2018-04-11
  • 来自专栏农民工前端

    智能(Agent)全面解析:什么是智能agent

    一、什么是智能(Agent)? 智能是一个能够自主思考、决策、调用工具的智能代理系统。 智能的出现,让AI从单纯的"对话者"进化为真正的"执行者"。 智能的核心优势 大脑:LLM提供强大的理解和推理能力 记忆:记住对话历史,保持上下文连贯 工具:灵活调用各种外部能力 二、两种搭建智能的路径 根据技术门槛和应用场景,智能的搭建主要有两种方式: 1️⃣ 四、RAG vs Agent智能 RAG(检索增强生成)和Agent是两种不同的技术路线,但可以相互配合。 随着LLM能力的不断提升和工具生态的日益丰富,智能将在更多领域发挥重要作用,成为我们工作和生活中不可或缺的智能伙伴。

    93310编辑于 2026-03-03
  • 智能(Agent)全面解析:什么是智能agent

    一、什么是智能(Agent)?智能是一个能够自主思考、决策、调用工具的智能代理系统。 它不仅仅是简单的问答机器人,而是具备以下核心能力的自主系统:思考能力:理解用户意图,分析任务需求决策能力:规划执行步骤,选择合适工具行动能力:调用外部工具,执行具体操作记忆能力:记住上下文,积累经验智能的价值智能的出现 智能的核心优势大脑:LLM提供强大的理解和推理能力undefined记忆:记住对话历史,保持上下文连贯工具:灵活调用各种外部能力二、两种搭建智能的路径根据技术门槛和应用场景,智能的搭建主要有两种方式 四、RAG vs Agent智能RAG(检索增强生成)和Agent是两种不同的技术路线,但可以相互配合。 随着LLM能力的不断提升和工具生态的日益丰富,智能将在更多领域发挥重要作用,成为我们工作和生活中不可或缺的智能伙伴。您好,我是肥晨。

    2.5K21编辑于 2026-03-02
  • 来自专栏林欣哲

    人工智能智能

    今天来谈谈人工智能的研究工作中所做的一些基本的抽象。 一、智能的概念 人工智能研究的对象称为智能(Agent),其他的外部条件划归为环境。 智能做出什么样的反应取决于输入和输出之间的映射关系函数,这个函数就是智能研究的核心。 编写出智能的程序则具体实现这个数学意义上的函数。 二、智能的性能衡量 我们研究智能是要他能做正确的事,因此需要有一个标准去衡量他的表现,一个合理的智能体会最大化这个期望的标准。 这里要注意一点,我们以最终期望达到的效果来做为衡量的标准,而不要以智能的行为本身作为标准。 总结,人工智能的研究的期望是实现一个,在给定的每个可能的感知序列下,能做出让期望的性能最大化的行动的理性的智能

    2K60发布于 2018-04-10
  • 来自专栏Go语言学习专栏

    7 - AI 智能构建 - AI 超级智能项目教程

    具体内容包括: AI 智能概念与特点 智能实现关键技术 使用 AI 智能的多种方式 OpenManus 实现原理 自主实现 Manus 智能 智能工作流编排 A2A 协议 一、什么是智能? 二、智能实现关键技术 在自主开发智能前,我们要先了解一下智能的关⁠键实现技术,也就是方案设计阶段做的事情。 一个智能负责生成⁠初步结果,另一个智能负责评估和反馈,二者循环迭代优化输出 举个例子,在机器翻译场景中,先由翻译智能输出,再由评审智能给出改进⁠建议,反复迭代直到达到满意的质量。 ,到数据收集智能获取必要数⁠据,然后是分析智能处理这些数据,接着由可视化智能创建直观图表,最后由报告智能整合所有发现生成完整报告。 我们还可以大胆想象,未来开发者可以像调用云服务一样,按需租用或组合不同的智能服务,甚⁠至实现智能之间的自动交易和结算。目前其实就有很多智能平台,只不过智能之间的连接协作甚少。

    64810编辑于 2026-03-17
  • 来自专栏算法之名

    AI智能(四)

    接AI智能(三) memory工具使用 以往,我们都是直接跟大模型进行交互,没有办法系统的实现记忆。 在上图中,用户在向大模型问问题时会首先读取记忆,查看以往是否回答过相同的问题或者相关的文档可以参考。 如果有就会返回并添加到提示词模版中,再通过大模型的处理得到答案,得到答案之后再将答案反写回记忆,这是一个循环的过程。 **智能合约和应用生态**:以太坊拥有强大的开发者社区和丰富的应用生态,这推动了其需求的增长,并对价格产生积极影响。 2. _call(prompt="hello", model="deepseek-ai/DeepSeek-V2.5") print(response) 语音转文字 from langchain.llms.base

    1K00编辑于 2025-02-06
  • 来自专栏算法之名

    AI智能(六)

    接AI智能(五) Dify Dify是一个开源的Agent开发平台,使用Dify有两种方式,一种是使用Dify的在线平台。https://cloud.dify.ai。 一种是进行私有化部署。

    1.1K00编辑于 2025-02-06
  • 来自专栏深度学习与python

    谷歌语音人工智能 AudioPaLM,语音传输瞬间翻译

    作者 | Anthony Alford 译者 | 刘雅梦 策划 | 丁晓昀 谷歌的研究人员发布了 AudioPaLM,这是一个大语言模型(LLM),可以通过语音传输执行文本转语音(TTS)、 自动语音识别(ASR)和语音语音翻译(S2ST)。 InfoQ 最近报道了其他几个多语言人工智能语音模型。 2022 年,OpenAI 发布了 Whisper,这是一个基于 Transformer 的编码器 / 解码器 ASR 模型,可以转录和翻译 97 种不同语言的语音音频。 这项工作主要集中在语音识别和语音翻译,它们的基准比较成熟。为生成音频任务建立更多的基准和指标将有助于进一步加快该研究。 一些用户在 Hacker News 的帖子中讨论了 AudioPaLM。

    2.2K20编辑于 2023-08-10
  • 【AI智能创作】

    AI智能创作思路 AI智能的核心在于模拟人类思维和行为模式,通过算法和数据处理实现自主决策。创作思路通常包括目标定义、数据收集、模型训练、评估优化等环节。 目标定义阶段明确智能的功能边界,比如聊天机器人、游戏NPC或自动化工具。数据收集阶段获取相关领域的语料、图像或其他输入数据。模型训练阶段选择合适的算法架构,如深度学习、强化学习或规则引擎。 案例分析 以智能写作助手为例,分析其设计流程。需求分析阶段确定用户需要语法检查、内容生成或风格转换等功能。技术选型阶段可能采用GPT-3等大语言模型作为基础架构。 GPT2Tokenizer.from_pretrained("gpt2-medium") model = GPT2LMHeadModel.from_pretrained("gpt2-medium") input_text = "AI智能的核心功能包括

    36510编辑于 2025-12-17
  • 认知智能(0)

    其次就是代理的通信模式,也就是[个体间的信息交互]:对话式:发挥不同智能的风格工具调用:控制智能行为和输出广播:智能的自主意识我们以[注意力]为线索,来展开智能的认知能力。 所以认知智能需要加入元认知的能力。 系列文章分成十个章节:第一章:认知AI智能的基础主题:ai代理的定义和类型(reflex、基于目标、基于效用...)开发代理需要的技能(编程、认知架构、llm)环境配置(python、Ollama、litellm 第七章:增强多模态和实时交互主题:语音到文本和文本到语音集成(Whisper、TTS)实时感知(摄像头输入、物联网传感器)跨模态推理(结合视觉、听觉和文本数据)第八章:增强元认知学习和自我学习主题:通过元认知反思实现自我提升 目标:开发能够从结果中学习并自主改进策略的智能第九章:使用RL、世界建模和RAGEN进行拓展主题:强化学习集成(RAGEN管道)用于状态和奖励预测的世界建模多智能体协作与分布式问题解决

    21000编辑于 2025-06-05
  • 来自专栏算法之名

    AI智能(五)

    接AI智能(四) MetaGPT 环境装配 metagpt下载地址:https://github.com/geekan/MetaGPT conda create -n metagpt python= gpt-3.5-turbo api_key: "******" 测试: 在终端命令行中进入Meta-GPT-main目录中执行 metagpt "Write a cli snake game" 单动作智能 多动作智能 import asyncio import sys import subprocess from metagpt.llm import LLM from metagpt.actions import

    76000编辑于 2025-02-06
  • 来自专栏算法之名

    AI智能(二)

    我是人工智能助手智谱清言,可以叫我小智,很高兴见到你,欢迎问我任何问题。'

    64010编辑于 2024-10-05
领券