跳到主要内容

3. 工业数据建模

工业智能化的地基,不是算法,而是数据模型。现实工厂中,企业 → 工厂 → 产线 → 设备 → 传感器构成层层嵌套的组织结构,每一层都承载着特定的业务含义。TDengine IDMP 通过工业数据建模将这套结构引入数字世界——为资产及其数据构建有序、可检索的知识目录,让原本散落在各处的数据孤岛连接成一个有血有肉的整体。

本章涵盖在 TDengine IDMP 中对工业环境进行数据建模所需的全部内容:从定义单个资产及其属性,到数据的情景化与标准化处理,到数据关联性与工业本体的构建,批量创建元素与属性,再到大规模资产目录的浏览与检索。

一次建模,处处受益。完善的数据模型不仅支撑精准的可视化展示和可靠的事件检测,更是 AI 洞察的前提——只有经过情景化的数据,才能成为真正的 AI 就绪数据资产,驱动跨团队的高效协作与持续的智能分析。

工业数据建模是什么

工业数据建模,是在数据存储层数据应用层之间,构建一个统一的工业本体层。这一层本身并不存储任何原始数据,而是在原始数据之上,搭建一个让 AI 、应用和人都能理解、访问与使用的语义网络。它由三个部分组成:一个面向 AI /应用/人 的统一数据门户、一份数据地图与目录、一张数据关联网络。

1. 一个面向 AI 、应用与人的数据门户

工业数据建模,首先是一个数据门户:它一头对接数据源,一头对接 AI应用三类不同的数据消费者,分别做接口适配,让每一类消费者都能用自己最自然的方式理解、访问与使用数据。

这一思路与业界讨论多年的 Data Fabric(数据编织)理念高度一致:通过元数据驱动的统一语义层,让数据摆脱物理位置的束缚,以"数据资产与数据服务"的形态被组织、被治理、被消费。在 IDMP 中:

  • 数据 → 资产:原始时序点被赋予名称、单位、上下限、目标值、类别、位置和归属,从一串裸数字升级为可被业务理解的工程量。IDMP 在元素模板与属性模板中统一定义这些情景化字段,由模板派生到所有实例,做到"一处定义、处处生效"(参见 3.3 数据情景化);
  • 数据集 → 资产库:分散的资产被统一归集到一棵可治理、可检索、可订阅、可授权的资产目录中,形成企业级的数据资产库。IDMP 以资产目录树作为统一入口,支持按路径下钻、按模板/分类/属性过滤,以及全文检索,并以子树为粒度做权限授权与共享(参见 3.7 元素与数据查询);
  • 数据消费 → 服务化:人通过 Explorer 浏览、面板查看、AI 问答提问,系统通过 REST API / JDBC / ODBC / Kafka / MQTT 接入,AI Agent 通过 MCP 直接调用——三类消费者共享同一份语义模型。IDMP 把同一份数据模型,以原生 REST/JDBC/ODBC 接口、流式 Kafka/MQTT 订阅、以及面向 AI Agent 的 MCP 等方式对外提供数据服务,接口不同,但共享同一份基础数据(参见 15. 与其他系统集成)。

这是 IDMP 与传统时序库、传统组态平台最本质的区别:它管理的不是表与列,而是数据资产与语义关系

2. 一份数据地图与数据目录

工业场景的数据来源非常丰富:有时序数据库(如 TDengine TSDB),有关系型数据库(如 MySQL),有各种工业生产流程与管理系统(如 MES、WMS、ERP 等),还有格式多样的文件系统(如文档、图片、视频等)。

工业数据建模的目标之一,就是要成为一份覆盖所有工业数据的数据地图数据目录——它把分散在 TDengine TSDB、关系型数据库、工业流程系统,以及各种文件系统中的原始数据,映射到一棵或多棵由元素与属性组成的资产目录树上。

对上层应用来说,这一层屏蔽了底层数据的所有复杂性:

  • 不需要关心数据存在哪个系统、哪个集群、哪个数据库、哪张表;
  • 不需要关心数据类型是时序点、关系表,还是文件、图片、视频;
  • 也不需要关心数据的命名规范、单位换算、采样频率的差异。

IDMP 通过统一的连接管理对接 TDengine TSDB、关系型数据库、OPC、MQTT、Kafka 等多种数据源,并以元素 + 属性的方式把它们映射到资产目录树上(参见 12. 数据接入)。上层应用只需要使用 IDMP 数据模型——/Elements/卷烟一厂/制丝车间/A线/烘丝段/薄板烘丝机-01/出口水分——去调用数据,IDMP 会完成后续必要的映射、转换与单位换算。原始数据被一次性"翻译"为包含业务语义的工程量。

3. 一张工业本体的数据关联网络

工业数据建模不止于数据映射,更重要的是——它建立并管理了数据之间的联系,让数据成为一个包含业务语义的有机整体,而不是彼此割裂的数据集。

工业现场充满了各种实体对象,这些对象之间存在着丰富而复杂的联系:

  • 它们有层级关系(集团 → 工厂 → 产线 → 设备 → 测点),也有上下游关系(原料 → 真空回潮 → 烘丝 → 加香 → 储丝);
  • 一个对象可以拥有多个父对象多个子对象——一台风机既属于"某地理区域",又属于"某设备类型库";一个公共风量测点会同时影响多条工艺线。IDMP 通过强引用弱引用组合引用等多种引用形式,表达这些不同强度、不同语义的联系。
  • 对象都带有属性,属性可以来自不同的数据源;属性既可以是对象的某个评估维度(测量值 / 标签),也可以是某个业务统计 KPI;属性的取值可以是数值、布尔等基础类型,可以是枚举类型,也可以是对象类型(文件、图片、视频、属性引用、元素引用等)。
  • 对象之间、属性之间、对象与属性之间的所有这些联系,统称为 Reference(引用);每一种 Reference 都附带一个 Reference Type(引用类型),用于说明这条联系的业务语义。
  • 围绕这些对象与属性,IDMP 还提供面板、仪表板、分析、事件、注解、文档等一系列描述信息与功能模块,作为不同视角下的信息消费入口,挂载在工业场景的对象节点之上。

所有这一切共同构成了一张复杂的工业本体网络——它看上去是一棵简单的 Tree,实际上 Far Beyond Tree,是一张具备业务语义的 Networking。这张网络,就是现实工业世界在数字空间中的虚拟镜像,也是 IDMP 实现工业本体的基础。

IDMP 实现数据关联管理的详细说明,参见 3.5 数据关联与工业本体

工业数据建模的覆盖范围

IDMP 所建设的这一工业数据模型,目标不只是时序数据,而是要覆盖所有工业数据——包括关系型业务数据、文件类工程资料、图像与视频,乃至外围系统的状态与事件。

在当前阶段,IDMP 产品已实现的能力主要围绕时序数据展开;未来会逐步扩展到更多数据类型、对接更多种类的数据源,最终实现对现实工业世界的完整覆盖。一旦完成,IDMP 提供的就不再只是"看时序数据的窗口",而是一套面向工业场景全要素的数据业务语义管理体系。

这套语义体系对 AI应用都有独立而重要的价值:

  • 对人:业务人员、工程师、运维和管理者,可以脱离系统术语,直接用业务语言(元素名、属性名、工艺段名)阅读、查询和讨论数据。
  • 对应用:上层应用(BI、MES、APS、第三方分析工具等)通过一致的语义接口取数,不再为每一个数据源单独写适配;数据模型升级时应用自动适配,无需改造。
  • 对 AI:这套语义体系真正释放价值的舞台。

这套体系对 AI 的独特价值

AI 对数据有一项独特的需求:它不仅要"取得到"数据,更要"看得懂"数据。没有语义的数据,对 AI 而言就是噪声——一个 4.7 的读数,如果不知道它是哪台电机的振动值、单位是什么、正常范围在哪,AI 唯一能做的就是"幻觉"。

让 AI 真正理解工业数据,至少需要四件事,而这四件事恰好都由 IDMP 的语义体系统一提供:

  1. 稳定的对象身份 —— 元素不是一串字符串,而是有路径、有模板、有归属、有上下游的"业务实体"。AI 推理时面对的是 薄板烘丝机-01,而不是 tag_7831
  2. 完整的数据情景 —— 工程单位、上下限、目标值、类别、运行工况、关联文档、历史事件,共同构成了 AI 判断"当前是否正常""偏离意味着什么"的输入。
  3. 可遍历的关联网络 —— 当 AI 做根因分析、影响分析时,它沿着 Reference 在元素—属性—事件—面板组成的网络中遍历,定位上下游、找到相似事件、检索关联资料。
  4. 统一的访问接口 —— 通过 MCP(Model Context Protocol),AI Agent 用同一套协议即可访问任意元素、任意属性、任意分析、任意事件,无需为每个数据源单独适配。

正因为这套语义体系存在,IDMP 上的 AI 智能体才能在毫秒级跨越分散的数据源与异构系统,完成理解 → 推理 → 回答 → 行动的完整闭环。这也正是 TDengine "AI 时代的工业数据基座"这一定位的真正内涵:工业数据建模,是 AI 在工业场景真正落地的基础能力与前提条件。

本章内容

本章后续小节将逐层展开这套语义体系的构建方法: