
数据工作者目前最火爆的方向就是在探索 AI 和数据的结合,目前看来最成熟方向还是 TEXT2SQL 方向,但该方向的实际落地仍存在较大挑战。今天给大家推荐一下:AskTable,99元/月(SaaS 版本),助你实现数据智能驾驶室。
AskTable.com 是中国首家企业级表格智能体(Table Agent as a Service)服务商,基于世界领先的大模型(比如DeepSeek、通义千问、GPT、Claude等)打造,专为企业提供基于自然语言的数据分析体验,广泛支持Excel、数据库、数据仓库和知识库的智能查询。用户无需懂 SQL,只需用“说”的方式,即可获得实时数据洞察。核心架构:
从上图来看,AskTable 对语义到 SQL 的生成高度依赖大模型。生成 SQL 后,目标数据库执行并返回结果,其中一部分数据直接返回,另一部分则通过 AI 进行自动语义处理。从官方网站看,支持的数据类型也较多。
这里以 Databend 为例,为简便起见,直接使用 Databend Cloud(https://app.databend.cn)。本例使用的是 Github events 2025年5月15日当天的数据。
进入实战
1. 连接 Databend Cloud,AskTable 每个会话默认最多支持 100 张表。只需选择所需的表即可。
选择完表后,等待 AskTable 获取表的元数据和一些统计信息然后和大模型交流,这块感感觉表如果太多和字段太多和大模型交互需要一些时间。 等待完成后,我们就可以开始第二步。
2. 验证智能数据分析
Q1: 基于数据当前热门的 top 10 的项目
下面是对应的 SQL
这个表里其实只有当天 2025年5月11日一天的数据,SQL 产生的逻辑好像是从数据的最小值到当前时间。
AskTable 给提供的可观测性数据:
下面是 Databend Cloud 提供的 SQL 执行相关的日志:
在 Databend Cloud 的 SQL 日志上看大概执行的时间为: 640ms ,但整体感觉时间应该也有 9 秒左右,从两边时间上看还有不少地方可以优化。下面是上述 SQL 在 Databend Cloud 上的执行计划:对应环节及用时。
从可观测性看 AskTable 和 Databend 都具备比较好的可观测性来分析性能问题。 AskTable 私有化也是带可观测平台交付。
Q2: 最火的开发语言有哪些,显示 top 10 , null 的不统计
Q3: 显示一下被点 Star 的最多的项目 top 10
Q4:显示 5月15日 databend 相关 repo 都有谁在活跃
这里显示竟然没有结果, 比较奇怪,看一下对应的 SQL 把 repo_name 写成了 like '%Databend%' 主要是 D 大写了。需要给他一个提示
给提示后可以完美的展示出结果。 这类问题也可以通过 AskTable 术语表解决,提前配置一下也可以。
Q5: 5月15日 github 上共有多少事件
这个和 Q4 行成了反差,这次提问都有点不通顺,反尔AskTable 也可以完美理解及完成工作。
总结
通过测试,AskTable 在生成 SQL 方面,尤其是单表查询,表现相当出色。此外,AskTable 还支持基于 RAG(Retrieval-Augmented Generation)方式的提示,在大模型功能强大的支撑下,能够实现较为完善的自助查询能力。在单表模式下,对 github_events 每个字段的提示均准确,生成的 SQL 也较为精确,令人感叹大模型的强大。
AskTable 的最佳使用方式是在平台内部嵌入会话窗口使用,让平台快速具备 AI 分析数据的能力。