近年来,预测性维护受到市场的广泛关注与重视,一度被预言是工业物联网的“杀手级”应用,吸引着众多企业涉足该领域,但它的应用却一直不及预期,被认为是当下最有需求、最有前途,也是最难落地的技术之一。
近年来,预测性维护受到市场的广泛关注与重视,一度被预言是工业物联网的“杀手级”应用,吸引着众多企业涉足该领域,但它的应用却一直不及预期,被认为是当下最有需求、最有前途,也是最难落地的技术之一。
那么,预测性维护落地难的原因是什么?在实施前应做好哪些准备?如何有效推进预测性维护的落地?带着这些问题,e-works记者采访了中山大学先进制造学院副教授冯建设博士。
复制推广是预测性维护落地的最大挑战
预测性维护(PdM, predictive maintenance)是伴随着工业技术发展和维修理念进步而逐渐兴起的一种新兴维修策略,其发展历经了事后维修、预防性维修和基于状态的维修CBM(condition based maintenance)。
冯建设博士指出,预测性维护依托于企业不断提升的设备状态感知能力,通过收集与分析设备的运行数据,洞悉设备性能演变趋势,以此制定高度适配的维护策略。但其本质仍是一种针对维护活动的策略设计,核心在于优化和提升企业现有运维活动,实现运维成本最优化。
在长期的设备运维实践中,企业逐步形成了大量的维护经验和知识。然而,想要超越传统运维模式,构建一个既蕴含工业现场工程师的操作经验,又兼具数据驱动洞察能力的预测性维护系统,仍存在较大的难度与挑战。
“在推进预测性维护项目的过程中,企业通常会选择1-2个关键点进行试点(pilot study),如产线上的某个关键主轴、齿轮箱或电机等,再逐步扩展到一条产线、多条产线,甚至整个企业。
在试点项目中,企业往往可以取得较为显著的项目成果与价值产出,比如对某个关键部件特定故障的有效识别及寿命预测。然而,关键问题在于试点成功后如何复制推广?”冯建设博士表示,在落地推广阶段,企业可能会面临多重挑战,从而陷于“试点陷阱”。
● 技术定制化程度高。由于预测性维护模型往往难以泛化,须根据具体的设备和运行环境进行训练和优化。因此,试点项目的成功经验和方案很难直接复制到其他场景或企业。
● 业务价值难以量化。预测性维护技术在初期需要大量资金投入,投资回报的不确定性使得企业在决策时面临巨大挑战。由于技术实施和推广需要长期迭代和改进,短期内难以体现显著的经济效益,很多企业在资金压力下对预测性维护项目持观望态度,甚至可能放弃。
● 文化和组织变革障碍。推行预测性维护需要企业从传统维护模式转变为基于数据驱动的决策机制,这要求变革内部的业务流程、组织结构、员工技能和文化氛围。面对这些变革,企业可能会遇到员工的抵触情绪和组织惯性等阻力。
突破“试点陷阱”,与企业的业务体系融合是关键
推进预测性维护,企业需要一套系统化的落地实施方法论。
在冯建设博士看来,数据驱动方法本身的泛化能力和通用性存在一定限制,须与应用场景、机理和经验相结合,而这种融合往往需要一定的时间和数据积累。另外,预测性维护更是一种价值驱动的策略,而非仅仅是技术驱动,它强调通过技术手段实现业务价值的最大化。在试点阶段,企业可以聚焦通过引进新技术驱动变革,实现预期的成果;但真正在落地推广阶段,应更注重技术对整个生产流程、产品质量和整体效益的积极影响。
基于这一认识,企业可以遵循以下方案有序推进预测性维护系统的建立:
第一,确立明确的目标。梳理目前在设备维护管理方面面临的主要挑战,是设备故障导致生产节拍频繁被打断?或是产品品质一致性难以保证?亦或是运维成本过高?针对这些痛点,聚焦“提质增效,降本减存”,定义项目目标。
第二,执行前的可实施性研究和评估。基于企业当前制造水平的全面评估,制定分阶段实施计划,评估投资回报率,还应考虑现有人员配备情况,以及特殊设备对应的预测性维护技术成熟度。
第三,选择最需要关注且能够速赢的实施对象。首先,明确监控层次,是部件级、设备级、产线级还是工厂级,如:对于设备运转率较低的现象,应深入分析具体原因是特定部件频繁故障导致的停机,还是产线间缺乏有效的生产协同,从而找到关键瓶颈。
其次,综合考虑投入产出效益来确定实施对象的优先级。并非所有对象都需要进行精细化监测,只需对故障发生频次不确定,但一旦发生故障会导致较长停机时间和较大经济损失的设备对象进行监控(注:具体方法可通过IMS实验室设计的设备运维优先级四象限图来判定,如下图)。
再次,选择优先关注的故障模式。可结合FMECA(Failure Mode, Effects and Criticality Analysis故障模式、影响和危害性分析)方法,选择对产品性能、安全性或可靠性影响较大的故障模式进行重点关注和优先处理。
图1 预测性维护实施对象选择方法(来源:冯建设博士PHM课程资料)
此外,企业还需对技术路线进行可行性评估,包括考虑设备数据收集的情况,如数据的可获取性、完备性、可靠性、数据质量等,基于收集的数据能否评估部件的衰退程度,以及对应用开发和落地的成本考虑等。
冯建设博士指出,试点项目的速赢,不仅可以验证技术方法论的可行性,还能增强团队继续执行项目的信心。同时,还可以快速检验特定场景是否具备大规模推广的可行性。
以上三个步骤是企业推进预测性维护的基础性工作,也是确保企业决策合理性和项目成功实施的关键。
第四,模型的开发与上线。该阶段主要涉及数据采集与预处理、特征提取、特征筛选、模型开发、模型验证、模型部署与上线等内容。
图2 模型开发流程(来源:冯建设博士PHM课程资料)
基于不同的应用场景,企业构建的模型种类会有所不同,包括设备状态监测模型、设备健康评估模型、故障诊断模型、故障预测模型等。同时,根据监测的设备规模以及数据的质量,选择不同的建模方法,主要包括基于机理的方法、数据驱动模型的方法和混合模型的方法等。随着预训练大模型等新技术的发展,多场景通用化模型落地的可能性正在逐步成为可能。
图3 常用的建模方法(来源:冯建设博士PHM课程资料)
冯建设博士强调,跨越“试点陷阱”的关键在于:(1)建立系统化的工业智能落地实施方法论;(2)PHM技术应用与企业现有流程体系的有效融合。首先,技术层面上必须确保系统性方法论稳定可靠地实施;其次,企业在规划层面不应只是为了引入新技术而盲目投入,而是需要考虑投资的长期回报和实际应用价值;第三,应用的设计应注重与现场运维体系的融合,充分考虑现场维护人员的操作习惯和需求,提供简洁直观的用户界面确保易用性,使维护人员能够方便地使用这些技术工具;最后,应确保新技术能够顺利与现有业务系统(如ERP、MES等)进行融合,基于PHM系统反馈,从业务运营层面扩大PHM技术落地的产业价值。
数据采集规模,取决于问题边界
数据采集的充分性是实现预测性维护的关键。那么,采集多少数据量合适?是否越多越好?
冯建设博士认为,数据采集量的大小通常是由企业的具体需求和预期目标来决定的。例如:现有良率的潜在增长空间有多少?关注对象是某个关键部件、设备,还是整条产线?现场更关注生产过程的实时异常监控,还是关键工站的故障模式判定?同时,还要考虑数据获取的成本及可实施性,技术的成熟度等因素,从而进行综合判断。例如,如果关注点在于某生产过程的异常预警监测,可首先考虑统计过程监控的方法,那么企业通常只需采集低频的电压、电流扭矩等能量相关参数即可;如果关注点是对某个高价值工件加工过程的精细化管控,就需要考虑设备传动系统衰退、刀具磨耗、润滑质量等综合性因素,对应的,需要对关键部件的振动状况、刀具震颤、加工噪声、油液磨粒等数据进行采集与分析建模。
数据收集是一个逐步积累的过程。特别是对于新造车间,由于设备刚刚投入运行,故障样本相对缺乏,数据多样性难以保证,往往不足以支持对预测性维护这一相对宏大主题所包含的异常监测、故障诊断、故障预测等多个应用场景的完整性建模。在这种情况下,冯建设博士建议,这类企业可以先通过采集健康状态下设备的数据,基于半监督或无监督模型来分析、识别与基线数据不一致或不符合预期模式的异常情况,首先实现对生产异常和设备异常的监测预警。在积累了较为完备的典型设备运行故障模式数据之后,再尝试建立故障诊断与预测模型。
他强调,预测性维护应用的建设,往往不是通过一次性投入即可获得长期成功的,需要企业持续的数据积累、经验沉淀和模型优化迭代。
准确率低,是一个预设命题
预测性维护从被寄予厚望到遭受质疑,当前大部分此类项目预测准确率低,是人们的普遍看法。但在冯建设博士看来:
预测性维护应用准确率低,是一个预设命题。他表示,如果将预测性维护应用与电子制造车间的AOI视觉检测对比,前者的衡量指标相对复杂多样,检测类应用的数据来源稳定,工作目标相对明确,主要关注在识别准确率的提升,与产品合格率的关系较为直接;而预测性维护应用的项目目标则相对复杂,如上所述,涉及异常监测、故障诊断、产品良率、生产波动、运维决策等相对多样化、差异化的诉求,价值链路更长。预测性分析的结果通常是整个生产维护活动的起点,为全局维护策略的制定提供参考。只有与整体运维活动紧密结合,才能真正产生价值。例如:对于具体的生产活动,除了需要提供设备宕机的预警外,还需提供故障定位、故障根因分析以及维护维修策略优化建议等,才能完整地实现预测性维护的价值。
因此,
从这个角度来看,针对预测性维护类项目,仅将准确率作为项目成败与否的唯一指标是有其局限性的。冯建设博士认为,根据数据积累与知识经验的丰富程度,在一个新的场景实施预测性维护的目标设计需要经历异常监测、故障模式识别、根因追溯、剩余寿命预测等逐步深入的阶段,而在这一过程当中,数据的可监测性、可诊断性与可预测性、模型的健壮性与可解释性、应用推理的及时性与可操作性等指标逐步得到提升,再通过优化数据质量、融入领域专家的经验和知识、在线更新与优化模型等方法,从而不断提高模型的综合性表现才是预测性维护项目更加科学化的实施路径。从这个意义上来讲,
单纯追求算法或模型的准确率是不够的,更需要关注算法的可解释性、模型的可靠性与健壮性、系统的执行效率以及多工况下的泛化能力,才能最终保障整个项目的成功。
此外,
模型在动态工况下的持续高水平性能表现也至关重要。当前大部分预测性维护模型主要依赖历史数据,在离线环境中训练得到。这些模型部署上线后的初期可能表现良好,但随着时间的推移,受环境变化、原材料波动、设备性能退化等动态因素的影响,其准确率往往会出现逐步下降的现象。
针对这一问题,冯建设博士认为企业可以采取以下策略:首先需建立一套科学化的评估机制,用于定期监测生产数据的分布是否发生了显著变化;在此基础上,利用新收集的数据,通过贝叶斯优化、迁移学习、参数微调等现代化的人工智能方法,及时进行模型参数的在线自适应更新;最后,通过设计相应的评估指标来验证新模型的性能,从而保障模型在波动工况下的持续高水平表现。
最后,冯建设博士提到,当前行业内已有较为丰富的数据采集系统、机器学习模型开发平台、低代码数字孪生框架、AIOps运维工具以及边缘化部署套件等AI工具及平台可供使用,这在一定程度上加速了以PHM为代表的工业智能应用的开发与落地。然而,需要指出的是,目前业界尚缺乏能够实现全流程打通、端到端解决用户问题的通用化工具,这无疑为工业智能应用的规模化复制推广带来挑战。可喜的是,
随着预训练模型、检索增强生成等大模型相关技术的出现,有望实现覆盖多场景的通用化模型构建,降低知识迁移的门槛,加速预测性维护项目的应用及推广。
预测性维护技术落地困难,不仅源于这一问题本身的需求复杂性与场景多样性,还在于企业缺乏系统化的工业智能应用实施方法论。“预测性维护落地难的核心挑战并不仅仅在技术层面,难的是对预期目标的清晰厘定,与企业现有流程体系的深度融合,以及在组织、执行策略和业务管理层面的变革创新等。”冯建设博士总结说。