首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >从知识图谱到本体建模-本体论核心思想

从知识图谱到本体建模-本体论核心思想

作者头像
人月聊IT
发布2026-04-24 20:43:42
发布2026-04-24 20:43:42
700
举报

大家好,我是人月聊IT。

我在前面专门谈到从西方哲学发展史谈本体论。里面就谈到了本体论包括了本质和存在,分离本质和存在是西方哲学本体论发展的一个关键。因为不同时期哲学家对本质的争论很大,有些认为根本就没有本质,有些认为本质是存在的但是无法感知,还有哲学家认为本质存在并可以无限探寻本质。而对于存在大家从来没有否定过。如果本质是抽象和形而上的的静态模型,那么存在就是模型是如何形成的,模型本身的内在行为关系是如何的。这也是我们现在研究本体论的基础,即对本体的研究不仅仅是抽象的静态模型,还包括了动态的行为和关系,包括这些行为关系导致了模型表现出了哪些外在的行为特征。

虽然我现在写文章也经常会用到本体论,本体模型这个词。但是我还是想再次强调实际是否叫本体论真的没有关系。真正的核心是抽象建模,是从你观察到的实例对象中抽象模型来体现实例层的一般规律。包括我多年前谈思维的时候用到元模型,其实就是思维的本体模型。

我一直在思考本体模型和知识图谱关键差异究竟在哪里?包括我前面文章专门谈到,对于知识图谱类似对实例的观察,然后找寻实例的关系,对应到个人知识管理,类似于已经有大量文章了,我再考虑构建文章间的双向链接或引用。虽然知识图谱的时候也有Schema,包括后面也有了TBox和ABox建模,但是核心还是在实例对象的研究。但是本体模型不同,本体模型的重点一定是在抽象模型层,类似大量文章中我应该如何先抽象元模型,先构建元模型间关系,然后再考虑知识泛化。注意本体建模过程中,实际不会针对实例再去大量构建实例间的关系和规则,而是将本体模型抽象层的逻辑代入到了实例层,用于实例层后续的推理逻辑。

所以再次重申我的观点,即在本体建模中,不会对实例层单独建模,实例层不存在单独建模的问题,只涉及到实例数据的存储问题。而对于实例数据的存储你仍然可以存放在类似传统的结构化数据库里面,但是结构化数据库本身不具备推理能力。因此基于特定场景需求,我可能需要拉取对应场景的实例数据,那么数据拉取出来后可以做两个方面处理。要么是只保留实例数据中的核心关系,连接,规则语义,然后将实例数据存储到图数据库后应用图数据库的推理能力。要么是实例数据同样按推理需求进行分层压缩,比如和推理无关的属性字段直接抛弃掉不用存储,比如首先进行汇总处理,然后抛弃明细数据。在进行分层压缩后,再直接使用AI大模型的推理能力进行推理。

谈AI大模型应用可以脱离本体模型,但是当前谈本体论应用一定要结合AI大模型的能力。大家可以思考下为何在AI大模型出来之前,对于知识图谱,图数据库应用等都不温不火,仅仅应用在少量知识管理领域,风控应用。而本体论+AI大模型往往更加容易发挥出更大的优势。一个方面是本体论建模让大模型的AIGC生成更加精确化,一个是大模型本身可以充分发挥意图识别,非既定精确规则的复杂推理能力。

对于Palantir本体论,我再次说明其核心是构建数据分析和数据行为操作,OLAP和OLTP之间的桥梁。或者说本体模型构建了传统的数据模型和AI大模型之间的沟通协同桥梁;其核心运作机制我再重申一遍,即基于业务场景,目标或已经的指标分析预警关联到本体模型,然后本体模型关联和映射到最终的数据库表对象,拉取符合场景需求的对象实例,然后将对象实例+本体关系规则进行推理最终做出行动决策。因此Palantir的本体建模不是用于IT系统构建的,而是应用数据分析和数据到业务映射的。

我研究的本体论,一直强调要起到两个作用。一个是类似传统的OOA和MDA模型驱动架构的思路,能够通过本体模型+AI编程来从0到1构建IT系统。其次是构建的IT系统天然基于本体模型理解业务语义,让IT系统具备业务语义理解和对话的能力,具备推理的能力,具备持续进化的能力。

如果按上面的思路,那么我们构建的新的IT系统可以叫做AI原生应用。为何叫AI原生,因为AI的能力是一开始就随着IT系统生长出来的,而不是你IT系统已经有后再去简单的扩展了一个IT模块。包括前面我在谈HerMES的时候看到一个重点,就是自我学习进化能力,那么这类AI原生应用如果结合HerMES,那么这种AI原生系统就应该在用户使用过程中不断自我优化底层本体模型,完成自我进化和迭代升级。这个应用能力是远远超过了简单的业务语义对话能力的。

最近我和客户和一些朋友交流,老会听到一种声音。就是虽然应用了本体论,但是并没法彻底解决幻觉问题;其次就是本体论本身的在后期大模型AI推理的性能问题,当然还有类似成本,本体建模复杂性等各种问题。但是我想强调的是任何新鲜事物或新技术的应用,往往都会带来新问题,但是只要我们确认目标和方向正确,我们就可以继续解决新问题,持续迭代。任何技术的突破,产品的创新往往都是不断突破传统思维束缚,不断解决新问题得来的。简单来说就是不要应用存在问题而不去尝试,要勇敢的走出第一步。企业全域本体论建模很难,包括整个ERP要用本体论思想全部重建也很难,但是我们完全可以在某个细分的业务领域优先应用本体模型思维,如果觉得应用本体模型构建AI应用也难,那我们也至少可以类似palantir的思路,构建一个本体模型来实现数据分析和业务行为操作之间的贯穿。

如果大家关注最近国家发的文件或新闻公告,会看到一个词叫穿透式监管。啥叫穿透式?实际你反着想就是原来没有穿透。简单来说就是原来的监管可能可以发现问题,但是无法穿透到具体是哪个业务系统,哪个业务行为导致了问题。也就是数据分析类的问题无法快速的穿透或追溯或业务系统,可以发现问题但是没法解决问题。当我谈到这你是否会发现这个和Palantir做的事情很类似,但是这里没有提本体论和本体建模。这个是真正存在业务需求和业务痛点的地方,如果应用本体论可以更好的解决这个问题,那么本体论就能够更好的体现业务价值。

最后再次强调,本体论或本体建模本质是一个业务建模的事情。脱离业务场景和问题谈本体论没有任何意义。真正推动本体论应用的一定是问题驱动和场景驱动,核心是解决业务问题,带来业务价值。不管是黑猫还是白猫,真正要抓得住老鼠的才是好猫。

备注和Claude大模型对话:附件是我对本体论和本体建模的思考。结合你对本体论,AI原生和palantir本体论的理解,帮我整理800到1000字左右的点评。

务实与前瞻兼备的本体论思考

这篇文章最大的价值,在于作者始终坚守一个立场:本体论不是哲学游戏,而是解决业务问题的工具。这种务实的态度贯穿全文,是区别于很多空谈本体论文章的核心所在。

文章开篇从西方哲学史切入,将"本质"与"存在"的二元张力引入IT语境,这个过渡做得自然。尤其是将"本质"类比为抽象静态模型、将"存在"类比为模型的动态行为与内在关系,这种映射并不牵强,反而为后续讨论本体建模的"动静结合"奠定了坚实的概念基础。很多人谈本体论只谈类与属性的静态定义,而忽视了行为、规则和关系的动态推理部分,作者在此点明,颇有见地。

本体模型与知识图谱的辨析是全文最有价值的部分之一。作者明确指出两者的根本差异:知识图谱的核心在于实例层的关系发现,而本体建模的重心在于抽象模型层的构建,实例层不需要单独建模,只涉及数据存储。这个判断是准确的。知识图谱领域确实长期存在"重实例、轻模式"的倾向,TBox层(术语层)往往被弱化,而ABox层(断言层)才是主战场。作者反其道而行之,强调先建元模型、再泛化知识,这在工程落地上确实更利于后期的推理和维护。

对于实例数据的处理,作者提出了两条路径:一是保留语义关系后存入图数据库做图推理,二是分层压缩后直接交由大模型推理。这个框架简洁清晰,具有实践指导意义。不过值得补充的是,这两条路径并非互斥,在复杂场景下往往需要混合使用——例如用图数据库处理结构性强的关联推理,用大模型处理模糊意图识别与上下文补全,两者协同才能发挥最大效能。

Palantir本体论的解读同样精准。作者将其定位为"数据分析(OLAP)与数据操作(OLTP)之间的桥梁",抓住了Palantir本体论的本质——它不是用来建IT系统的,而是用来打通业务场景、数据模型与行动决策之间通道的。这与Palantir官方所强调的"ontology as the operating system for data"高度契合。但作者自己的研究目标更进一步:不仅要用本体模型驱动数据分析,还要用它从零构建具备语义理解、推理能力和自我进化能力的AI原生系统。这个野心更大,也更难,但方向是对的。

"AI原生"这个概念的阐述是文章的另一亮点。作者区分了两种AI集成方式:一是事后打补丁式的AI模块扩展,二是AI能力从系统诞生之初就内嵌于本体模型中随系统共同生长。前者是当下大多数企业的现状,后者才是真正的AI原生。结合HerMES所提到的自我学习进化能力,这类系统理论上能够在用户使用过程中持续优化底层本体模型,实现闭环迭代,这不仅是技术愿景,也是企业数字化转型真正值得追求的终态。

对于"幻觉问题"和"推理性能"等实践挑战,作者没有回避,也没有过度辩护,而是以"方向正确就持续解决新问题"的态度回应,这种心态是成熟的。确实,本体论结合大模型并非银弹,幻觉问题的根源之一在于大模型对边界条件的处理缺乏约束,而一个结构清晰的本体模型恰恰可以提供这种约束框架,但这需要本体建模本身足够精准,否则"垃圾进、垃圾出"的问题同样存在。

文末引入"穿透式监管"的政策背景,是一个聪明的落地切入点。监管穿透的本质需求——从数据异常快速追溯到具体业务行为——正是本体模型擅长解决的问题:业务语义、数据实体与操作行为之间的映射关系一旦建立,追溯路径自然清晰。这个场景具体、痛点真实,是本体论商业化落地的优质突破口。

总体而言,这是一篇兼具哲学底蕴与工程视角的思考文章,观点有层次、有边界、有落地意识。若要进一步完善,建议在"本体建模复杂性"这一挑战上补充更多具体的降低门槛的方法论,例如领域优先、渐进建模的实操路径,这将使文章的实践指导价值更加完整。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-04-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人月聊IT 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档