首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >跨越鸿沟-从本体论建模到AI原生应用的构建

跨越鸿沟-从本体论建模到AI原生应用的构建

作者头像
人月聊IT
发布2026-04-17 16:17:08
发布2026-04-17 16:17:08
2160
举报

大家好,我是人月聊IT。今天继续分享我最近做的一个关于本体论和AI原生应用构建的PPT材料。即如何更好的应用本体论建模的思想,来构建一个AI原生应用。

要聊本体论,仍然要从西方哲学本体论思想的逐步形成,从本体论拆解为了本质和存在两个核心概念,包括从本体论到认识论的发展过程来谈。简单来说就是本体论不仅仅是研究本质,也研究存在。不仅仅是研究形而上抽象后的模型,也研究模型的动态构建过程。

公元前六世纪,爱琴海边的米利都城。人类第一批哲学家在这里仰望星空,追问那个永恒的问题——这个世界,究竟由什么构成?本体论的种子,就此萌芽。泰勒斯说,万物源于水。阿那克西美尼说,是气。恩培多克勒说,是水火土气四种元素。他们用肉眼可见的物质来解释世界,这是人类寻找万物本源最朴素的起点。

真正让本体论诞生的,是巴门尼德。他第一次剥离具体物质,把"存在"本身作为哲学对象,提出:存在者存在,非存在者不存在。这是人类思想史上的惊天一跃。

这些早期哲学家,更偏向于宇宙论而非本体论。他们研究的是世界的构成材料,而非"存在"本身的意义。但正是这些朴素的追问,铺就了通向本体论的第一块基石。

公元前四世纪,柏拉图在雅典城外建立了西方第一所高等学府。在他看来,我们眼见的世界不过是真实世界的劣质复制品。真正的实在,是永恒不变的理念世界。柏拉图用洞穴寓言说明这一切。囚徒们只能看见墙上的影子,以为那就是真实世界。唯有走出洞穴,才能看见真正的实在。哲学,就是那条通向阳光的出路。在柏拉图的本体论中,理念才是最高的存在。一匹真实的马,只是"马的理念"这个完美蓝图的残缺投影。现实世界的一切,都是对那个完美原型的不完整模仿。柏拉图认为,感官是欺骗性的。只有理性,才能通达真实。这种将世界二分为"可感世界"与"可知世界"的思想,深刻影响了整个西方哲学两千年来对本体的理解。

柏拉图最杰出的学生,却成了他最大的反对者。亚里士多德将老师飘在天上的理念拉回大地,认为具体的这匹马、这个人,才是最根本的真实——他称之为第一实体。

亚里士多德区分了第一实体与第二实体。具体的苏格拉底是第一实体,是对象实例。而"人类"这个抽象概念是第二实体,是抽象类。没有具体的人,抽象的人类就失去了存在依托。亚里士多德还提出四因说:质料因、形式因、动力因、目的因。以雕刻一尊雕像为例,大理石是质料,图样是形式,雕刻家的动作是动力,雕像的意义是目的。四者缺一不可。本体论至此,同时包含了静态结构与动态过程。事物是什么,由质料与形式定义。事物如何生成,由潜能走向现实。亚里士多德的四因说,奠定了两千年本体论思想的基础框架。

时间跨越千年,来到中世纪。古希腊哲学的火种,在基督教的神学土壤里重新燃烧。托马斯·阿奎那站在亚里士多德的肩膀上,将本体论推向了一个全新的神学高度。

阿奎那提出了本体论史上最重要的区分:本质与存在是分离的。一朵玫瑰的定义,并不包含它必然存在的逻辑。就像剧本写得再好,角色也需要聚光灯,才能从潜能变为现实。

阿奎那构建了宏大的"存在之链",从上帝到无机物,形成严密的层级体系。在这个体系的顶端,上帝的本质就是存在本身——他是万物存在的终极运行环境与驱动根源。

阿奎那对本体论最深远的贡献在于:他将"存在"定义为一种持续的动态行为,而非静态属性。万物时刻依赖外部的赋予才能维持存在,脱离了这个赋予,事物便归于虚无。

十八世纪的爱丁堡,苏格兰哲学家大卫·休谟拿起了怀疑主义的手术刀。他的致命问题是:你所谓的"实体",你的感官真的体验过吗?两千年的本体论大厦,就此动摇。休谟指出,我们从未直接感知过苹果背后的"苹果性",只感知到红色、甜味、圆形这些离散属性。根本没有底层实体,事物只是一束知觉的集合。这就是著名的束理论。休谟对因果律的攻击更加致命。我们看见台球A撞击台球B,但我们真的看见了那个驱动力吗?所谓因果必然性,不过是大脑的条件反射——是心理习惯,而非客观规律。休谟的怀疑主义,将远在普鲁士的康德从独断论的迷梦中惊醒。康德的回应是:建立人类认知的边界地图。我们能认识的,只是经过大脑先天框架过滤之后的现象世界。

康德区分了现象与物自体。物自体,也就是事物真正的本质,永远在我们认知能力之外。本质存在,但永远不可知。这道防火墙,是康德留给整个西方哲学史最深刻的遗产。康德建立了人类认知的绝对边界,规定现象与物自体不可逾越。但这也留下了巨大的哲学缺口——如果本质永远不可知,那我们又该如何理解这个世界真正的存在?

面对康德留下的这道防火墙,黑格尔选择将它彻底炸毁。他的逻辑极其霸道:如果本质永远躲在幕后,永远不展现,它就等同于无。本质,就是它自己显现的全部动态过程。宇宙的运行遵循黑格尔的辩证法——正题产生矛盾,矛盾推动否定,否定升华为合题。整个宇宙历史,就是"绝对精神"通过不断的自我矛盾与自我超越,最终走向自我觉醒的漫长演算。

二十世纪初,海德格尔向整个西方哲学史发出诊断:两千年来,你们全都搞混了"存在者"与"存在"本身。亚里士多德、阿奎那、黑格尔研究的都是存在者。存在本身,被遗忘了。

海德格尔把目光转向人类自身——这个唯一会追问自身存在的特殊存在者,他称之为"此在"。此在不是封闭的主体,而是始终处于世界之中,与万物交织在一起的动态存在。

最后,维特根斯坦用一句话点破了本体论的终极价值:世界是事实的总和,而非事物的总和。孤立的事物没有意义,只有当事物进入逻辑命题的关系网络,才构成真实的世界

从泰勒斯到维特根斯坦,两千五百年的本体论之旅,是人类用理性丈量存在的漫长跋涉。掌握了事物与命题,掌握了结构与规律,我们就不再是场景的奴隶,而成为定义世界的架构师。

要去研究事物的发展变化,研究事物内在的构成,所以在哲学里面其实有两个大的分支。一个叫本体论,一个叫认识论本体论,它本身是一个形而上的东西,它的核心的本质就是抽象建模,它是研究存在的本质和世界的本源。认识论不一样,认识论它是研究的知识的本质,它是告诉我们如何更好地认识和理解世界。但是你脱离认识论谈本体论,那就没有意义。

本体论最终只是一个结果。更核心的是我们分析研究事物的方法,但是你脱离本体论坛认识论也没有意义。因为所有我们对世界的认识的方法,最终它都要有一个抽象模型结果的沉淀,所以认识论和本体论这两者本身是相辅相成的。

再回到整个软件工程的建模。它其实分了相当多的阶段。从最早期的RUP 的4+1软件架构视图,当时面向对象的分析建模和UML设计相当的火,然后再到我们的MDA模型驱动架构,包括提出了PIM平台独立模型和PSM 平台特定模型。其实 MDA 模型驱动架构就是在软件开发领域最早的本体,然后到再到最近七八年小10年推出的云原生微服务领域建模,去找到核心的领域对象识别领域对象的能力。所有的这一些面向对象分析设计里面,它其实都蕴含了体现了本体论的思想。

但是各种传统的对象建模方法论更多的是模型驱动开发,模型的作用是为了设计和构建一个完整的软件系统使用的。在系统构建完成后,模型就被抛弃掉了,而不是继续服务于系统的运行和推理分析。

在模型驱动构建完了以后,到后期的 IT 治理,其实出现了断层。断层包括两个方面,第一个就是数据孤岛,比如我们常说的烟囱竖井式的应用。第二个就在语义断层的核心的原因就是数据库落落地的数据模型。它本身只有数据对象之间的关系,它缺少了数据形成的业务语义。

大家要注意对于数据断层,往往我们可以通过类似SOA集成平台,ESB集成总线,数据集成等各种技术平台来解决集成问题。但是对于语义断层,实际在传统IT建设中并没有太好的解决方法,数据库中没有业务语义,业务语义往往在你的应用程序逻辑层和代码里面。

正是由于这两个原因。我们可以看得到了后期IT治理的时候出现一个重要的问题。由于这个业务语义的断层导致我们的IT系统更多的只能回答是什么的问题,但是没办法回答前因后果为什么的问题。

所以我们才会提出一个很核心的内容就叫IT架构范式的演进,从最早的面向对象分析建模到 MDA到 DDD领域建模,再到当前我们提出的基于本体模型加 AI 大模型驱动的新的 AI 原生架构的构建模式。

简单来说就是,我们希望构建一套建模方法既能够有效的支撑从0到1的IT系统的构建和生成,同时这套模型又能够很好的支撑后续业务语义的理解,基于这套业务语义驱动AI大模型更好的进行语义对话和深层次的业务推理。

为什么突出构建模式的核心?

我其实也讲过了,就是传统的建模,它只是记录了结果而丢失了过程语义。他缺少关键的行为建模规则建模。所以说现在核心的本体论的建模,其实就是在传统的数据模型的基础上去补充这一些行为过程规则事件的建模补充原来丢失的业务语义,实现静态和动态两个层次的建模并进行融合,这样才能够真正的一个构建数字原生的应用。

打通端到端的业务流,包括我原来也讲过本体论的核心。其实就三个对象建模行为建模规则建模对象里面不仅仅是数据模型,当然也包括了数据之间的关系行为建模。也就是要说清楚数据形成的原因,包括数据状态发生变化以后,对后续数据对象行为的影响。是关键的行为语义的补充。

包括规则建模,在我们现在是把它独立出来,因为对象行为上面需要调用规则,但是很多规则它是可以复用的。在我最新的本体论建模规范里面规则建模,它是一个独立的模型文件。

再来看从知识图谱到本体模型。我在前面也讲过了,对于传统知识图谱,虽然说知识图谱里面也有Schema的概念,但是原来我们去构建传统知识图谱的时候,往往是弱化了Schema这一层。而现在的本体建模,大家一定要理解成它是两层语义。

第一个就是 TBox的抽象概念层,第二个就是ABox的实例对象层。抽象层就类似于知识图谱里面的Schema。这一层实例层是基于实际的业务场景实例化对象以后的泛化以后的基于对象实例的关系依赖的建模。

而对于本体建模,重心一开始不在实例层,而是要优先进行TBox的抽象模型层建模。将对象,行为,规则抽象为独立的模型文件。包括我们在实践中也发现,简单的应用类似OWL本体模型实际很难对抽象模型进行完整表达。特别是对于复杂规则的定义难以支持,包括对于对象间的相互影响定义难以表达等(在我构建的模型规范中采用EDA和事件建模来解决该问题)。这也是我为何又重构了一套本体建模规范的原因。基于我的本体建模规范完全可以转出OWL文件,但是OWL文件却无法形成我当前自己原创的本体建模Yaml文件。

如果当前我们已经有了类似ERP,CRM等OLTP类系统;也有了类似传统BI,数据中台等分析类系统。但是我们经常会发现一个问题就是两类系统完全是脱节的。即使分析类系统发现了指标异常也无法快速地穿透到业务系统中发现问题和解决问题。

因此进行本体建模,构建对象行为规则的融合模型。在存量系统和IT环境下,其核心作用就是要打通 OLTP 到 OLAP 的鸿沟,通过统一本体论本体模型作为一个关键的核心的连接中枢,允许数据洞察直接穿透到业务行为,建立分析与执行的闭环。

包括前面我有专门文章,也谈到了怎么样通过本体模型来解决ChatBI智能问数的幻觉问题。大家要清楚传统的ChatBI或Text2SQL更多都是基于底层静态的数据模型,只有数据对象和数据之间的关心,缺少了数据形成过程的业务语义,缺少了数据变化相互影响的业务语义。

因此要提升ChatBI的准确性核心就是要在传统的底层数据模型的基础上,将其扩展为一个包括了对象,行为,规则的综合模型,即我们常说的本体模型。注意有了本体模型支持,我们的ChatBI就不仅仅是简单的查询出数据,更加重要的是能够清楚的解释清楚数据。

大家可以看得到,本体论驱动的架构里面有一个相当关键的东西,就是我们讲的这个核心的场景,它是一个静态模型和动态模型的融合。它在传统数据模型的基础上补充的行为补充的规则,补充的事件,形成一个完完整整的融合的模型。

这个模型真正实现了静态结果和动态行为的融合,既能够发现问题,又能够按照前期定义的行为规则约束展开推理链条,真正去探寻问题根源,即我们常说的解决问题。也就是本体模型再结合大模型的能力,真正实现了从问题发现到问题分析,再到问题解决的完整闭环。因此这个本体模型才能够真正的描述业务阐述业务。它不仅仅是一个数据的发现问题的系统,它更是一个 AI 语义的动态的操作系统。

包括前面我也专门讲了一个Palantir的本地建模的回写参考,其核心步骤可以描述如下:

  • 数据采集和集成处理-数据中台指标展现
  • 数据中台指标触发预警
  • 垂直场景的本体模型构建-对象模型引用管理到中台ODS表
  • 对象保留的Function行为和指标关联
  • Function行为触发事件,进入消息事件管道
  • 事件触发本体大模型规则计算,评估选择最优行动方案
  • 行动方案通过业务系统提供API接口回写

所以说Palantir 构建这个本体模型,它其实不是说去构建一个新的完整的业务系统,而是去架构一个你原来已有的数据分析类应用和你的业务系统之间的沟通桥梁,实现通过本体模型和AIP层去动态的分析决策,形成相关的改进建议。

然后再通过回写接口回写回业务系统,这样形成一个完整的闭环,包括我在前面也专门有文章谈到了AIP平台,它是整个如何去完成实现一个动态推理的过程。本体模型就是构建了 Foundry 和AIP之间的一个关键的桥梁,在传统的数据模型上面增加了业务语义。

当然,Palantir整个平台如果你原来没有数据中台数据分析类的平台,你的所有的数据可以存储在这儿。但是你原来已经有数据中台,它实际整个模型它是可以对接到你有的已有的数据中台的ODS层的。

本体模型就是构建了 Foundry 和AIP之间的一个关键的桥梁,而对于AIP平台则是基于用户问题触发本体模型对象Action-》获取数据装载上下文。在数据装载进来后,基于前面定义的本体模型行为规则,再通过AI大模型自身的推理能力完成整个分析推理过程。

包括这里的推理已经不再推荐基于OWL的DL查询推理,而是直接采用大模型的自己的推理机制,如果装载的数据量过大,可以在前面再接入一个图数据库进行数据推理前的预处理和预推理操作。

包括前面我也专门做了另外一个事情,就是对我的合同管理系统原始需求进行了本体建模,这个就是完全参考我的本体建模规范做的一个建模。里面就包括了对象模型,行为模型规则模型场景模型,主体模型,异常补偿模型和质量约束模型。

本体模型建完了以后,它就会形成7个独立的Yaml文件。Yaml文件就是完整的整个合同管理需求的本体的描述。在这个地方就可以看得到它形成的Yaml文件最终的一些格式。

这套建模文件实际在我构建的早期只有对象,行为,规则,场景四大模型。到后期扩展了事件模型,主体模型,异常补偿模型,实现了基于EDA驱动架构的消息解耦和事件回写。同时再后来又增加了UI建模的Yaml文件和技术架构的Yaml文件,方便实现基于本体模型一键生成完整的AI原生应用系统。

有了这个本体模型以后,我又做了一个小验证,整个本体模型,它还可以转成标准的OWL的语义标准的文件,然后可以把它导到类似于斯坦福的本体模型编辑器,类似于在线的知识图谱浏览。

当前我还通过AI编程构建了一个本体模型的动态行为模型界面。我们可以更加形象完整的看到整个本体模型究竟长什么样子,包括我们也可以对整个本体模型进行动态模拟。

我们可以基于不同的场景流程,类似于合同录入合同开票,让他一步一步动态的模拟整个对象行为规则的调用关系在前面,我也专门有演示视频来讲这一块。可以参考下我前面的公众号文章详细说明。

接着我又去在整个建模完成了以后,我又用 AI 编程输出了一个完整的本体模型编辑器。本体模型编辑器就是一堆压文件的可视化编辑。在这个编辑器里面,大家就可以看到完整的本体模型,它就是这么一个对象行为规则事件的树状结构。

但是简单的把它理解成树状结构也不全面,因为这一些对象之间相互之间有双向的依赖,它更像是一种类似于知识图谱的网状结构。包括我们进行可视化的知识图谱的展示。

好了,在本体建模完了以后,接着其实我做了一个重要的事情就是基于这套本体模型能不能基于 AI 大模型和AI 编程的思路去完整生成一套 AI 原生的应用系统。

如果可行,那么这种方式构建的本体模型就可以一方面支撑应用的生成和构建,一方面又支持系统生成完后期运行态的语义理解和对话,这样构建的系统,我们才叫 AI 原生应用。因为 AI 的能力不是系统后续附加上去的,而是从系统一开始有诞生想法开始就就天然融合进去共同生长的能力,包括后续的学习和自我进化。

这样的在我统一了本体模型以后,我们构建的一个应用,它同时支持OLTP和OLAP这两类应用。一开始它就不是割裂的,就是完整的整体。

所以基于这个东西,我们又做了一个本体驱动的 AI 原生应用的架构蓝图,包括有交付层认知层底座层,执行层包括底座层里面就含了相关的本体模型。语义的解释包括形成一个完整的 AI 原生的应用的架构设计,最上层就是我们的本体模型层中间是我们的能力层,以大模型为核心,以主域的 Skills 技能包为核心的能力。

AI 在充分理解了语义以后,它能够去智能的对Skills技能包进行动态的编排来回答问题。对于最终的 UI,它是一个 hybrid 的一个杂交式的 UI界面风格。即它既有 AI 自动生成式的 UI 内容,也有提前预设的一些复杂 UI操作界面。当然在这个里面就有几个关键点。

第一个就是整个 AI 原生应用,它是本体模型驱动加 AI 意图识别路由加生成式 UI。第二个它是基于整个领域建模的思路。它构建了完整的对象模型和聚合根,通过聚合根来方便对整个完整的业务对象,事务管理和控制。

第三个它是基于EDA事件驱动的架构。通过事件的定义,包括行为规则和事件关系和依赖的性定义,形成了完整的事件链,方便实现后续事件驱动场景下的推理触发或改进建议的回写操作。

当然它还有基于我们经常说到的SOA架构,因为以后的所有的业务流程场景,它可能都是动态变化的。AI 大模型在理解了你的业务场景以后,它完全可以动态的去组装底层本底层的原子服务能力来解决你的问题。我们的能力组件和Skills是可以穷尽的,但是对于业务场景是无法穷尽的。而对于AI原生应用我们也没有必要去穷举所有的业务场景,已有对新业务场景的满足,全部通过AI充分理解业务后,自己选择合适的Skills技能包进行灵活组装来完成。这才是AI原生和语义操作系统的关键能力。

我们再比较一下 AI 原生下面整个软件开发范式会发生一个相当大的变化。不管是在核心建模方式还是交付方式还是数据闭环,还是整个的开发演进都发生了相当大的变化。在这个地方我就不详细再展开了。

基于这个例子,我基于我的本体模型,我就完整让 AI 通过Codex+GPT5.4 静默编程差不多2~3个小时输出了一个完整的 AI 原生合同管理应用。就是一个简单的 AI 原生合同管理应用的界面,在这个界面左边就是一个 AI 大模型的对话框,右边可能是我提前预设的一些复杂交互的界面。在这个时候,它就可以实现自然语义的业务操作,包括自然语义的查询,整个合同管理的整个实现的过程。

对于整个AI原生应用的构建,刚才也强调了,可以分成几个步骤。

第一个本体建模。在这个过程中,跟 AI 有多轮的对话迭代。最后完成一个精确的本体模型的语义定义。第二个就是借助 AI 大模型,它要去开发底层的本体模型的能力层的skill 的技能包。第三步实现本体驱动的混合交付式前端UI。第四部分最终的运行态,基于用户的意图,自然对话式的运行。

这个系统还有一个例子,就是我在前面跑通的,就叫基于本体模型加 AI 大模型辅助的供应链智能计划。这里面有个关键的观点就是传统的 APS,它是基于 TOC 约束理论的精确建模。但是复杂的供应链场景,它往往是一个非线性规划和组合最优化的问题,无法提前预设规则,也是在供应链领域可以引入本体和 AI 大模型的关键点。

整个核心的构建逻辑首先仍然是有了构想以后让 AI 大模型辅助输出完整的技术方案。基于这个技术方案,细化本体模型,再接着基于本体模型去输出完整的Demo原型,最后完成一个完整的可运行的系统。

后续的逻辑,我们完全可以再进一步在知识图谱上面进一步可视化动态演示。AI 辅助推理过程,包括图,我们就可以看得到。我们选择了不同的场景。以后AI 大模型会基于场景自动分析判断,给出决策,包括给出推理的说明原因,包括整个推理过程究竟应用到了哪一些对象,哪一些规则?所以整个本体加 AI 驱动的供应链智能计划推理过程,它真正的去实现了一个传统的业务系统,传统的本体和 AI 大模型和本体更好结合的一个过程。

同时整个的推理过程是本体模型是业务语义驱动的。它是一种没有提前预设规则的动态推理过程,更像是 AI 原生模型下的智能推理,这个才是我们真正需要的一些业务场景。

整个原型系统本身还需要结合实际情况去做进一步的细化。但是从我提出这个构想到完整的原型系统跑通,现在已经完全得到验证。

终极的愿景,我把它理解就叫万法归一,因为我们现在本身也还在做一个完完整整的把我刚才讲的本体模型的建模AI 代码生成可运形态的业务语句交付系统。这三个系统完整打通的完整的产品。

最后,简单总结下就是。本体论或本体模型都不是什么新鲜东西,但是本体论思想在当前AI大模型下变成了企业构建自己核心业务语义层的关键思想,本体模型本身也是最佳的业务语义承载模型。有本体模型,可以真正实现数据操作类系统和分析类系统的融合,实现从发现问题到解决问题的跃迁,让本体模型+AI成为真正的业务语义操作系统。

好了,今天的简单分享就到这里,再见。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-04-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人月聊IT 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档