跳到主要内容

8.9 缺失数据填补

工业环境中的时序数据经常存在缺口——传感器离线、网络中断延迟数据传输,或硬件故障导致短暂的测量丢失。缺失数据填补使用估算值填充这些缺口,确保下游分析、平均值计算和 KPI 计算不受缺失读数的影响而产生偏差。

备注

通过 TDgpt 进行缺失数据填补需要与 IDMP 一同安装 TDgpt 模块,无需大语言模型连接。

IDMP 通过 TDgpt 提供基于 AI 的缺失数据填补功能,该引擎利用信号历史行为中学到的规律来估算缺口期间应有的数值。

缺失数据填补工作原理

TDgpt 的缺失数据填补能力在缺口周围的历史数据时间窗口上运行。它应用经过训练的模型来预测缺失时间戳最可能的数值,并将这些估算值写回数据中。填补值被标记为估算值,与实际传感器测量值区分。

缺失数据填补是对 TDengine 原生插值函数(INTERPFILL)的补充。原生插值使用简单策略(线性、前值、后值),适合短小且可预测的缺口。TDgpt 缺失数据填补使用学到的规律,更适合较长的缺口、不规则信号,或简单插值会产生不真实数值的情况。

配置缺失数据填补

缺失数据填补直接从趋势图面板配置。打开显示具有缺失数据属性的趋势图,然后使用图表右侧的填补控制图标启用缺失数据填补并选择方法。

支持的 TDgpt 算法

算法特点
MEAN使用周围值的局部均值填补缺口——对稳定信号快速且鲁棒
IEM迭代期望最大化——适用于相关的多变量信号
LSTMPyTorch LSTM 模型——捕获复杂非平稳信号的时序依赖关系
TDtsfmTDengine 时序基础模型

在趋势图中查看和切换缺失数据填补

填补值与实测数据一起显示在趋势图面板和属性历史视图中,在视觉上与实际传感器测量值可区分。

在趋势图面板中,图表右侧的填补控制图标允许您直接从图表视图切换缺失数据填补的开启和关闭,无需更改属性配置。使用此功能可比较原始数据(含缺口)与缺失数据填补后的视图。