CMM 2021研讨会在线 CMM 2021研讨会在线 CMM 2021研讨会在线
维护可靠性工程

风险门槛调查出生

T

风险阈值调查(RTI)方法是由Anthony (Mac) Smith开发的,以支持大辛辛那提城市污水处理(MSDGC WWT)部门寻求提高可靠性。本文将带您回顾RTI的诞生,解释什么是RTI,它为什么被创建,它在哪里适合于维护可靠性计划策略,它是如何执行的,并通过一些实际结果展示它的实际作用。

“20/80系统需要一种简单的方法来在大海捞针”

引入RTI

RTI的思考过程始于这个问题:

“在系统中有一些潜在的设备问题或失败,即使一个整体而言,也可能是相当严重的,这可能是一个”乖巧“?”

行为良好的系统(即20/80)通常表现出相对较少的严重问题。相比之下,麻烦的系统(例如,80/20)在它们的边界中有更多的组件,可能有50%或更高,这些组件可以被归类为导致showstopper问题的原因。RTI的目的是确保当以可靠性为中心的维护(RCM)在有问题的系统上进行时,一些严重的问题没有被忽视,这些问题可能永远不会受到任何形式的RCM分析的影响。

RTI过程在系统级进行,而不是组件级别。这是因为已经知道20/80系统的失败历史相对良性。80/20的系统并非如此,这些系统具有“吃午餐”的历史。20/80系统需要一种简单的方法来“在干草堆中找到针头”。因此,RTI诞生了。

RTI之所以出现,是因为人们发现临界方法在几个方面存在缺陷。在一项基于部件的临界性研究中,一个部件可以从它的23个临界性标准问题中收集足够的点,以被其定义视为“临界”,但不一定是“风险”,因为它的故障对核电站的后果相对来说是良性的。组件故障的大多数后果在这个词的真正意义上并不是真正的风险。这个想法是集中精力找出那些真正会让人感到厌烦的问题,并尽量避免它们。

在RTI分析中,只考虑了七个后果区域:安全、环境、停机时间、操作、法规要求、单点故障和经济。RTI方法依赖于系统专家维护技术人员、操作人员和可靠性工程师的经验,来考虑20/80系统边界的任何特定问题是否会在7个指定后果区域中的一个或多个造成风险。

基本的想法是定性识别潜在的问题或失败在20/80系统实际发生和导致问题在一个或更多的七个领域,还穿过一个阈值,结果被认为是足够严重,特别注意减轻或消除风险。

RTI如何适应R&M战略

2011年,MSDGC WWT部门制定了一个可靠性和维护(R & M)战略,并组建了团队来改善三个关键领域:

  • 可靠性工程,特别强调环境保护和风险降低,使用RCM、以经验为中心的维护(ECM)、风险阈值调查(RTI)、根本原因分析(RCA)和缺陷消除(DE);
  • 计划和安排维修工作,强调增加主动维修和减少被动维修;
  • 监测资产状况,重点是内部化和扩大所有适用资产的覆盖范围,使用尽可能多的预测、状态监测技术和相关能力(例如,机械激光对准)以达到成本效益的可行性。

整体策略的可靠性工程元素如图1所示。1

让我们看一下图1中提到的每个最佳实践。

图1:R&M战略的可靠性工程部分

帕累托分析识别系统的RCM, ECM和RTI分析-顶部的条形图描述了MSDGC 7个WWT工厂中最大的10个系统(通过代码编号识别)的故障数量。这样做是为了首先对最麻烦的系统进行直接操作。这种对系统进行排序的方法采用了成本分析、维护工时、停机时间或其他影响组织目标的措施。

图左边最高的条形图称为帕累托图,用来识别80/20系统或坏的参与者。他们代表了大约20%到30%的系统产生了大约70%到80%的故障。图中右边的系统的条形图显示了较少的故障,称为20/80系统。这些系统中的大多数,大约70%到80%,只产生了20%到30%的故障。2,3

BAD演员系统的RCM分析- MSDGC WWT人员选择了经典的RCM作为坏参与者系统的方法论。它们大约占所有水浸系统的20%,其中80%的问题会影响环境、安全和工厂整体性能和成本。对一个主要系统的经典RCM分析可能需要两到三周的时间来执行,使用一个有经验的主持人(例如,一个专门从事RCM的顾问,直到一个雇员获得足够的经验来执行该任务)和一个由内部的维护、操作和可靠性主题专家组成的团队。

ECM分析4.- ECM为更好的良好的系统(即,20/80系统,只有大约20%的问题发生)。这样做是为了尽量减少MSDGC WWT人员从事整体可靠性提升倡议的影响,减少对改进倡议的工厂预算的财务影响。每种系统都需要快速外观,大约两到四天,由一个内部的,由专家领导的多学科分析团队在促进的促进方面带领以下问题:

  1. Are current tasks (if any) performed on the system really worth it in terms of applicability (i.e., they work and actually do or can find failure modes) and is each task cost-effective relative to some alternative, such as allowing the asset to run to failure?
  2. 如果在适当或适用的预防或预测维护任务到位,可以避免或减轻在过去五年(或多或少)在系统上执行的任何纠正维护事件?
  3. 团队是否可以假设前两个问题中没有涉及的、可能产生严重后果的故障模式,比如影响安全性或导致需要大量停机和/或强制停机维护的停机后果?

对于20/80系统,可能永远不会受RCM的系统- MSDGC WWT人员对良好行为系统的20/80系统进行短期,一天或更短的RTI分析。由于两个或更多危险因素,在某些情况下不可接受的风险,RTI可以使用ECM分析触发更深入的外观。RTI结果用于优先考虑所识别的ECM分析的系统。

当存在不确定性时,所有系统的RCA-当问题发生时,所有的工厂系统都要进行根本原因分析,以减少或消除问题,所有的原因都不确定。MSDGC对RCA选择了因果关系的方法。为未来的调查小组参与者和促进者举办了有关方法的课程。5.

需要RCA,因为RCM和ECM无法识别导致系统生命周期中发生故障的所有贡献和/或潜在因素,尤其是涉及人类的贡献。即使在最彻底的RCM或ECM分析完成后,还记录了更良好的维护过程,程序和工作指令即使在最彻底的RCM或ECM分析后也会导致失败的原因。缺乏正常培训和经验的新人才能赶到危机情况,可以忽视完成维修的关键步骤,从而恢复运营后不久的婴儿失败。6.贡献失败的其他原因包括来自组织供应链中的替换部件,润滑剂和其他项目的变化以及操作条件,系统配置或实践的变化。

在分析时处理资产条件和系统配置的RCM或ECM超出的其他原因也需要RCA作为在上述分析完成后减轻或消除重要意外故障的工具。当任何原因都没有发生分析方法并且发生重大事件时也需要。RCA调查可能需要几天时间,调查结果的报告和纠正措施的建议可以漫长。

缺陷消除-这是MSDGC WWT部门在维护可靠性策略中应用的最后一个工具。在RCA之外加入DE的方法和基本原理是为了消除由老化、磨损、粗心或执行不良的工作习惯、需要更坚固的组件的操作条件改变、或不满足资产当前应力水平的不充分更换部件所造成的已知缺陷。DE分析会议通常可以在一天内完成,因为它们处理已知的缺陷。调查结果和建议行动的报告被有意限制在一页之内。7.

“他们(坏演员)代表大约20%至30%的系统,这些系统大约产生了70%至80%的失败。”

RTI的方法

在它决定雇用RTI的地步,在MSDGC WWT中进行了总共八种古典RCM分析。这是由于许多限制,包括但不限于可用于雇用促进者的资金的流速以及缺乏可用的人营业时间服务在分析团队。此外,RCM分析结果的实施是滞后的。对人员的需求参加其他维护可靠性举措,同时推出,包括不同的资产状况监测方法,对仍然不得不处理纠正措施的日常工作负荷和预防性的维护。渴望考虑可能影响废水处理目标和目标的所有系统,以便最大限度地减少人员的影响,并最大限度地影响其努力的影响导致决定再次优先考虑员工活动。

该问题直接与风险的主题相关。概念上,风险是在植物系统及其设备中的故障(例如,硬件和/或软件)方面思考,并且在故障概率和失败后果方面测量。不可接受的风险被认为是重大后果和实际发生的实际机会(即概率)的结合。一些行业,例如核电发电和石化加工,花费大笔资金来定量定义风险因素,然后非常注意设计和操作植物,以减轻事故的风险。在MSDGC和大多数其他WWT工厂中发现了许多相同的设计功能。这些包括设备冗余,适当的设计边距和备用操作能力,可以防止人员伤亡,泄漏和未经处理的废水排放到环境中。

MSDGC WWT部门人员已经认识到了多年来,需要定义有效的策略来消除或至少减轻植物和系统中意外失败的影响。2007年,该组织采用了组件临界评分方法,以试图识别此类风险和关键性驻留的地方,然后使用该过程指定所选的预测任务应采用以降低这些风险的位置。组件临界方法使用在组件级别应用的多维临界指数。根据关于安全,环境,维护和运营后果的23个问题的答案,使用复合加权分数评估关键性。然后,组件的分数用于从顾问的图书馆分配预测性维护(现在也称为资产条件监测或ACM)策略。这产生了一些好处,如图2所示,通过2008年和2009年的主动维护增加。主动维护从略高于30%以上增加到超过40%,但随后在2010年的更高图中程度。

2009年,管理层调查了一个不同的过程来获取此问题,即使用帕累托分析来识别植物系统(不是组件)的可靠性计划,这是造成过度纠正维护和系统停机成本的主要罪魁祸首,然后适用从经典RCM开始的方法组合,以定义维护策略以消除或减轻这些故障。到2013年底,这种方法表现出重要的额外结果,基于组分关键性增加了更远的更远的维护。这在图2中展示了维护劳动力(小时)的增加,这些劳动劳动力(小时)在2010年的截至2010年的40%以上至2013年的70%以上。

图2:应用ACM策略的结果

因此,MSDGC WWT部门使用了80/20系统的经典RCM方法,通过Pareto分析系统故障和维护劳动成本确定。使用RTI方法解决了20/80系统的风险。RTI结果可以触发更详细的分析,例如ECM。因此,RTI方法被认为是在RCM系列方法中,因为它可以解决可以打败这些功能或导致其他安全或环境问题的系统,其功能和特定的故障模式。8.

失败事件要求纠正措施的下降并没有此前预期通过正确的点或PdM任务和总体失败事件开始下降,导致无功成本的减少维修超过120万年的2011美元,528000年的2012美元和752000年的2013美元。9.

RTI进程利用经验丰富的技术人员和/或一线维护监督员和运营商的经验和判断进行分析。通过RTI方法的专家促进,进行图3所示的五步过程。这些步骤模仿在一定程度上,在一定程度上进行了经典RCM研究中使用的分析,但停止远离收集的综合信息并进行审议在古典的rcm。

图3:五个风险阈值调查步骤

RTI的五个步骤是:

  1. 选择20/80系统。这可以从Pareto分析中确定。
  2. 对于选定的20/80系统,达到了该系统界限的集体团队决定。本步骤的目的是建立共同的团队对分析期间所包括或排除在内的共同团队。通常,这将很快实现。
  3. 列出所选20/80系统的系统功能。列出函数有助于识别与具有值得考虑的特定结果的函数相关的影响。分析推动者将这些功能列在板上或挂图上,完成后用相机捕捉。该数据用于RTI报告。
  4. 列出驻留在边界内的主要组件,包括仪器,如有必要,用于控制或安全。
  5. 该团队利用其集体经验,讨论边界内的每个组件,以确定它是否有或可能有任何合理可能的问题或失败,这些问题或失败将导致表1中7个结果中的一个或多个。该团队试图回答这个问题:

这种问题或失败可能是系统功能方面不可接受的风险的来源吗?

如果答案是是的,然后讨论该结果是否会超过商定的阈值措施,可接受或不可接受,以及后者是否值得进一步注意,以消除或减轻风险之前的实际事件发生。

表1 - 故障标准区域矩阵

通过点击监控维护其系统,工艺技术人员和监督员的ACM / PDM专家的经验和判断,识别问题和/或失败以及产生一种或更严重后果的潜力是最好的。它。如果最有经验的人员参与分析,最好的结果将会来。

“...... 2011年的反应性维护成本降低超过120万美元,2012年的528,000美元和2013年的752,000美元”

实际的RTI结果

两个MSDGC WWT系统的案例研究

系统名称:

  • 在磨溪污水处理厂返回活性污泥(RAS)
  • 废物活性污泥(是)在Mill Creek废水处理厂

日期进行:2013年3月19日

团队成员

  • 液体流工厂主管
  • 机械小组负责人
  • 仪表机构领导者
  • 操作员
  • RTI专家和MSDGC WWT可靠性工程师(facilators)

系统边界

  • 从:薄壁溢出出曝气坦克
  • 结束:在入口处返回曝气池的管道
  • 二次浓缩和最终焚化炉的泵输出

系统功能

  1. 活性污泥适当返回曝气池
  2. 合理利用活性污泥进行二次浓缩
  3. 流量信号到可编程逻辑控制器(PLC)

表2提供了该分析的结果。

表2.-返回活性污泥(RAS)和废物活性污泥(是)系统分析

系统结果

  • 该团队花了大约四个小时开发表2中摘要的信息。
  • 从风险的角度来看,两个不可接受的在该系统中识别出问题:将具有中临界性的排出阀和RAS放电管道通气。两者都可能导致禁止的成本和系统和/或植物停机时间。
  • 如果未启动PM任务以定期锻炼阀门,则在手动流量控制阀(RA到曝气罐手动控制阀,中临界索引1200)和旁路阀(低临界索引450)中可以开发第三个可能不可接受的问题。排除失败的打开状态。

所有这三个问题都应该由工厂维护主管和适当的技术人员进一步审查,并将结果报告给可靠性工程师。

RTI团队参与者的观察

Eric Stevens,CMRP,CRL

就像RCM学习一样,RTI将所有玩家放入房间,每个人都学习有关系统如何运行的信息以及如何维护。操作和维护不知道其他工艺在做什么。将每个人聚集在一个房间里,并讨论系统的功能让每个人都在同一页面上。在Mill Creek WWT工厂,当我们做了RAS系统时,大多数团队都不认为我们会发现任何东西都是剧案。我们错了,发现表2中确定的一些问题。这些问题是在MSDGC WWT持续改进计划中解决的。
RTI过程也是工厂解决20/80系统的好方法。它比在每个系统上进行全吹的RCM更快和更便宜。虽然公司可能想要在每个系统上完成完整的RCM,但那些需要时间和金钱。组织应首先在80/20系统上首先进行RCM,并且如果可能的话,在20/80系统上执行RTI。Pareto分析用于优先考虑系统。RTI快速指出任何可能是整个系统的展示者的资产。一旦RTI进程完成,我们就可以对有任何可能破坏过程函数的系统进行ECM研究。
在经历了关键过程,并被询问了23个问题,这些问题似乎更多地关注于资产而不是系统的功能,RTI过程是一个受欢迎的变化。它直接与系统功能相关,比如安全性,并且从风险的角度给出了关于哪些资产真正更重要的更具体的答案。

参考文献

  1. 在2014年SMRP年会上的一个研讨会上,MSDGC WWT和支持承包商人员展示了图1中的一个版本。描述的策略是由当时MSDGC WWT的维修经理John Shinn, Jr., p.e.提出的。
  2. 汗,F.I.”糟糕的演员计划正常运行时间杂志,2019年8月9日,第56-60页。
  3. 科赫,Richard。《80/20原则:用较少的资源获得更多的秘密》第四版。波士顿:Nicholas Brealey Publishing Lt., 2014年1月2日。
  4. Hinchcliffe, Glenn R. and Smith, Anthony M. RCM: Gateway to world - world Maintenance。沃尔瑟姆:Butterworth-Heinemann, 2003。
  5. 选择的具体原因和结果方法是德克萨斯州休斯顿的ThinkReliability公司的。www.thinkreliability.com
  6. 尼古拉斯,杰克。成功的秘诀迈尔堡:可靠性威布尔威布欧洲杯德国意大利竞猜尔2014年;请参见第7章。
  7. Ledet, Winston P.,和Abshire, Sherri M.。不要只是解决它,改善它!前往精密域的旅程。迈尔堡:Reliabil欧洲杯德国意大利竞猜ityWeb.com,2009。
  8. 米切尔,约翰斯。物理资产管理手册,第四版。Fort Myers: 欧洲杯德国意大利竞猜Reliabilityweb.com, 2012。
  9. MSDGC WWT人员和支持承包商(包括本文的作者)在2013年SMRP年度会议上进行的讲习班,包括成本降低。