润乾报表 NLQ 组件正是基于这一洞察,绕开了大模型的技术路线,通过一套精密的“规则词典”,同样实现了高效、可靠的自然语言查询。 业务语义词典:这是让 NLQ“懂业务”的关键。维词:定义了像年、月、省份、产品类别这样的分析维度。NLQ 知道“月”是从日期字段里提取出来的一个层次。指标:定义了像销售额、月活数这样的业务指标。 一个具体的查询过程当用户输入“去年北京发往青岛的订单”时,NLQ 会启动一套精密的解析流程:词汇切分与过滤:NLQ 首先将句子拆解为“去年”、“北京”、“发往”、“青岛”、“订单”等关键令牌,并过滤掉“ “双打”或许是最佳组合既然 LLM 长于“灵活理解”,NLQ 善于“精准执行”,那么为何不让它们组队呢? 经过确认后,再由 NLQ 这个“可靠后台”精准执行,最终得到一个既符合用户意图、又准确的结果。这样,既享受了 LLM 的交互友好性,又保证了 NLQ 的查询准确性和低成本,可谓鱼与熊掌兼得。
通过优先考虑元数据质量和针对性的模型微调来解锁可扩展的 NLQ 到 SQL,以提高准确性和成本效益。 一个 NLQ 的例子是“按销售收入排列前五名的子品牌是什么?” 挑战 3:NLQ 到 SQL 中出现幻觉 大型语言模型(GenAI)在问答中出现幻觉是一个众所周知并被广泛研究的现象。 然而,LLM在根据自然语言查询(NLQ)生成SQL查询时产生的幻觉却是一个鲜为人知的课题。 本文总结了在实现生产级企业级NLQ到SQL系统中的五大挑战。使用这些系统可以持续地达到超过90%的准确率。
别急, NLQ 带来了一条不同的路——一条让中小企业、普通开发团队都能轻松上车、用得安心、花得明白的路。 NLQ 的核心,就是把这套业务逻辑,预先编制成一套机器能严格执行的“业务词典”和“查询规则”。 当然,NLQ 也可以和 LLM 配合使用。 对于那些非常口语化的表达,一个绝佳的搭配是:用大模型(LLM)作为“前端翻译”,把随意的口语转换成 NLQ 能听懂的规范问题,再由 NLQ 这位“老会计”精准执行。 NLQ+LLM= 灵活 + 可靠。如何上手:比你想象得更简单最直接的方式, NLQ 已经作为智能模块,内置在润乾报表产品中。这意味着,使用或集成润乾报表,你就自然获得了这项“智能问数”的能力。
那么,架构中的 NLQ 规则引擎,是如何能像“理解了一门语言”一样,将仍有相当自由程度的规范文本准确地转换为语法严格的 MQL?就像前篇所言,这个 NLQ 已经相当于实现了一个小语言模型(SLM)。 这就是本篇将要解析的NLQ 词典,它是 NLQ 引擎的“大脑”与“规则手册”,支撑整个架构实现准确性。 NLQ 词典:语义的映射基础NLQ 词典是一个结构化的业务 - 数据映射知识库,定义了业务语言中每个“词”在数据世界中身份、行为逻辑和关联关系。 这个过程由懂业务的开发人员实施,技术门槛远低于 AI 模型的训练与调优,确保了 NLQ 方案的普适性和可落地性。 至此,润乾 NLQ 技术解析系列三部曲已完结。我们从“规范文本”破局,用“MQL”实现复杂性,继而用“NLQ 词典”保证准确性。
基于规范文本的 NLQ 架构成功解决了 Text2SQL 的困境,实现了灵活性、准确性和复杂性三者兼得。 NLQ 词典与准确性 NLQ 引擎是另一个关键的技术挑战。它要具备一定程度的语言解析能力,能够准确理解规范文本中多样的表达方式。 这里将先聚焦于解决汉语环境下的 NLQ 解析问题。 NLQ 词典:语义的映射基础 NLQ 规则引擎如何能像“理解了一门语言”一样,将仍有相当自由程度的规范文本准确地转换为语法严格的 MQL? 这就是NLQ 词典的任务。 NLQ 词典是一个结构化的业务 - 数据映射知识库,定义了业务语言中每个“词”在数据世界中身份、行为逻辑和关联关系。 结语 润乾 NLQ 技术已解析完毕。我们从“规范文本”破局,用“MQL”实现复杂性,继而用“NLQ 词典”保证准确性。
可信赖的结果,确保正确性NLQ 组件采用规则引擎技术,通过抽象汉语规律得到规则模型,可以实现精准的 AI 式数据查询,彻底杜绝大模型的幻觉问题。 NLQ 如果识别不了用户的输入,会提示无法查询,请用户换一种说法再尝试。而不会像大模型那样总是给个不知对错的答案。 NLQ 组件给出结果后,会以用户看得懂的形式对这个语句进行解释,如果有多种解释也会让用户选择,比如日期可以是发货日期或者收货日期:BI 领域知识的完美容器NLQ 组件预先用领域知识建立词典,导入数据结构 支持有复杂指标的高级分析NLQ 组件内置的查询语言 MQL 包括 DQL 和 SPL。 搭配大模型,润乾报表 NLQ 使 ChatBI 不仅好玩而且管用规则引擎对自然语言的规范性有一定要求,不能使用太随意的词句。
润乾 NLQ 正是这条技术路径的实践者。 润乾 NLQ 的解析能力足以覆盖绝大多数数据分析需求。明细查询:想要什么数据,直接列出来从最基础的字段查看到智能的跨表组合,NLQ 都能精准应对。 通过这些例子可以看到,基于规则的润乾 NLQ 引擎并非只能处理简单查询。 正因清晰地认识到上述边界,润乾 NLQ 与 LLM 的协作才显得尤为恰当与务实。 可以引入 LLM 作为“智能前端翻译”,将用户灵活多变、不甚规范的自然语言提问,转换为符合 NLQ 词典与语法规范的查询语句,再由 NLQ 引擎进行精准的数据查询。
破局之路:基于“规范文本”的 NLQ 架构针对上述困境,润乾 NLQ 提出了一种新的三阶段架构,其核心在于通过可确认的 "规范文本" 这一设计,重构了人机协作的查询生成流程。 实施的核心工作转变为构建 NLQ 业务词典,这一任务的技术门槛远低于模型训练,普通开发人员即可胜任。任务简化还带来了明显的成本优势。 NLQ 引擎基于规则实现,涉及的词汇在数千到数万量级,不需要多大算力,用普通 CPU 即可实现高并发处理,整体成本很低。 基于规范文本的 NLQ 架构成功解决了 Text2SQL 的核心困境,实现了灵活性、准确性和复杂性三者兼得。 NLQ 引擎的开发挑战另一个关键技术挑战在于 NLQ 引擎。该引擎需要具备一定程度的语言解析能力,能够准确理解规范文本中多样的表达方式。
深入解析从NLQ到AIAgent的进化,揭示对话式分析的正确方向随着企业数据量的爆炸式增长,如何高效、便捷地从数据中提取价值,已成为决定企业成败的关键。 正确的进化方向:从NLQ到AIAgent既然单纯的Text-to-SQL是歧途,那么正确的道路在何方? 答案是向更高级的智能形态进化:从基础的自然语言查询(NLQ),经由对话式分析,最终到达具备自主决策能力的AIAgent。 第一阶段:自然语言查询(NLQ)与语义层NLQ是起点,它通过NLP技术将自然语言映射到数据库查询。但要使其可靠,关键在于引入一个“中间层”来弥合语义鸿沟。 果断转型,拥抱未来:放弃较为初级的NLQ功能,证明了单纯的Text-to-SQL路线在实践中遇到了瓶颈。其转型方向验证了Agent模式的正确性。
润乾 NLQ 选择了一条不同的工程化路径。 要理解润乾 NLQ 的突破,需看清当前主流技术路径的局限。问题核心在于,无论是端到端生成还是引入中间表示,其本质都依赖于 LLM 的概率性生成与泛化能力。 免疫原理:润乾 NLQ 的确定性编译架构上面那个噩梦级的 SQL,其实是润乾 NLQ 从“各省的员工数量、产品数量和订单数量”这句话生成的(因为程序生成,里面的中间表名明显是没有业务意义的),Text2SQL 更多实例基于维度对齐和确定性编译的思想,润乾 NLQ 能够系统性地化解各类让 Text2SQL 方案棘手的 JOIN 难题。 润乾 NLQ 这套方案,说直白点,就是稳、省、简单、好接入。不靠 AI 去“猜”复杂的多表关联该怎么连,而是用一套可靠的规则引擎来“算”,所以结果非常准,不会出现时灵时不灵的情况。
在基于 "规范文本" 的 NLQ 架构中,MQL(Metrics Query Language)作为规范文本的确定性编译目标,承担着关键使命。 我们通过具体实例说明这一机制:比如用户输入“请帮我查一下北京发往青岛的订单”,首先会由 LLM 转换成标准文本“北京 发往 青岛 订单”,接下来 NLQ 引擎解析后生成 MQL:SELECT 发货城市 到这里润乾 NLQ 架构的各个组件均已呈现:LLM 保障灵活性:处理自然语言的多样性规范文本确保准确性:通过可确认的中间层解决语义幻觉MQL 提供规范性:建立精确的查询语义基准DQL 处理数据关联:通过维度建模简化复杂的数据关系 润乾 NLQ 通过 MQL、DQL、SPL 的协同设计,构建了一个层次清晰、职责分明的 Text2SQL 架构。 在接下来的文章中,我们将继续深入探讨基于词典的 NLQ 引擎如何将规范文档准确地编译成 MQL。
国内代表:瓴羊Quick BI:集成通义大模型,支持中文自然语言查询(NLQ)与自动化归因分析,主攻电商与SaaS领域。 /月Power BI微软生态协同自然语言查询、AI Copilot、Office无缝集成中小企业、微软生态用户10–40 美元/用户/月瓴羊Quick BI云上智能分析通义大模型集成、自动化归因、中文NLQ
它基于已在 Text2SQL 场景中得到验证的润乾 NLQ 规则引擎( 万字长文解析 Text2SQL 破局,兼得灵活复杂准确 ),将“自然语言转精准操作”的能力,从数据查询无缝延伸至后续的多维分析阶段 先从 NLQ(自然语言查询)开始,得到查询结果:接下来针对这个结果做进一步分析,点击“新建报表”,进入多维分析界面:下面我们通过汉语命令来指挥数据分析工作。 润乾 BI 的这套自然语言交互能力,延续了与 NLQ 一脉相承的规则引擎技术路线(而非依赖 LLM)。这带来了一个显著特点:极高的准确性与可靠性,从根本上杜绝了“幻觉”。
从早期复杂报表到自助式BI,再到自然语言查询(NLQ)与ChatBI,人机交互方式持续进化。2025年,AI Agent成为推动BI从“问答模式”转向“自主探索与行动模式”。 3.2 分阶段实施策略阶段一:基础建设与试点(3-6个月)选择1-2个数据规范的场景(如销售业绩查询)试点;构建初始语义层(20-30个核心指标);配置知识库(同义词、业务术语);评估NLQ
从简单的自然语言查询(NLQ)到具备多轮对话和自主分析能力的AI智能体(Agent),其功能深度和交互模式各有千秋。 ThoughtSpot优势:AI原生架构,技术理念领先;Agentic分析能力提供了更深度的智能体验;专注于NLQ和搜索,体验打磨精细。 五、市场趋势与未来展望通过对以上产品的分析,我们可以看到ChatBI领域的几个明显趋势:从问答到代理(FromQ&AtoAgent):简单的自然语言查询(NLQ)已成为基础能力,未来竞争的焦点将是能够理解复杂意图
微软生态协同 自然语言查询、AI Copilot、与Office无缝集成 120-480美元/用户 中小企业标准化分析、微软生态用户 瓴羊Quick BI 智能商业分析 通义大模型集成、自动化归因分析、中文NLQ
阶段3:生成式AI增强规则管理用NLQ(自然语言查询)生成初始决策表(比如“请创建一个根据订单金额和客户等级自动打折的规则”);AI检查规则冲突(比如促销策略和风控规则有矛盾)。
新版本革命性升级NLQ自然语言查询能力,业务人员通过口语化指令即可完成80%分析任务。 功能特点生态无缝协同:Excel公式一键转DAX模型,Teams频道实时推送预警低代码开发:NLQ自然语言查询,业务人员独立完成80%分析任务个人版免费:企业版订阅价10-40美元/月/用户产品优势全球用户超
cloud.tencent.com/developer/article/2631667OpenClaw配置Skills打通苹果生态公众号:https://mp.weixin.qq.com/s/TCPAEG9d442I9ehzia8nlQ
一、自然语言查询BI工具的市场概况 自然语言查询(Natural Language Query, NLQ)是一种通过自然语言与计算机系统进行交互的技术,它基于自然语言处理(NLP)和机器学习技术,将用户的日常语言转化为结构化查询语句