采用数字化设计来实现物理可靠性

文章作者:Wendy Luiten和John Parry

在设计周期的早期,越来越多地使用数字设计来预测零小时标称性能和获得可靠性。

利用计算机模型来模拟产品的行为进行了第一次主要用于更换硬件原型在开发周期的结束,以评估设计性能。然而,随着越来越强大的计算资源,数字化设计越来越早在设计周期来预测零小时的标称性能和访问可靠性。

可靠性是“系统在规定的条件下,在规定的时间内执行其预期功能而不发生故障的概率。”这个定义的第一部分关注的是性能——产品必须毫无故障地执行其预期功能。第二部分讨论使用方面——在什么条件下使用产品。第三部分讨论时间——产品将运行多长时间。

V曲线图示出了用于系统开发的步骤 图1在这个系统开发图中,需求向下流动,能力向上流动。

为性能进行数字化设计的流程通过众所周知的v模型(图1)——需求向下流动,能力向上流动。业务和营销需求依次流向系统,然后是子系统,以及v左侧的组件。设计完成后,验证组件是否能够顺利完成其子功能,以及子系统和系统的能力。最后,整个系统将根据业务和市场预期进行验证。

可靠性设计的三个部分

数字设计通过计算指定的系统、子系统或组件的输入是否会产生所需的输出来改进和加快验证步骤。此外,数字设计可以用来指导建筑和设计选择。为了设计和分析电子冷却,在设计数据被提交到电子设计自动化(EDA)和/或机械CAD (MCAD)系统之前,在概念阶段使用三维计算流体动力学(CFD)软件构建系统的热模型。然后,在开发过程中,使用从机械和电气设计流程中导入的数据对模型进行详细阐述,以创建一个数字双胞胎产品的热性能,然后可用于验证和分析。

可靠性条件设计的第二部分包括代表系统生命周期不同阶段的用例。这些场景包括传输、准备使用、首次使用、正常使用和使用结束场景。产品应能承受正常运输条件,如跌落、振动和极端温度。在处理过程中出现错误时,它不应发生故障。在正常使用过程中,不同的温度和湿度环境下会出现不同的负载条件。

使用结束后,产品应易于回收,且不会造成环境损害。与典型的正常使用条件相比,这些用例代表了更广泛的场景组。仅在实验室工作的产品不被视为可靠的产品。数字设计用于模拟生命周期中的特定步骤,例如,模拟运输条件的跌落和振动测试。此外,数字设计用于运行假设情景,模拟更糟糕的环境条件。

可靠性定义的第三部分是关于一个产品在没有故障的情况下完成其预期功能的时间跨度。这是通过失败率来衡量的,失败率被简单地定义为在一定时间内失败的跑步人群的比例。如果我们从100个运行单元开始,我们有10%的恒定故障率,那么在t = 1,90个单元(100的90%)仍然在运行,而在t = 2,81个单元(90%×90)在运行。

带注释的显示浴缸曲线的图形 图2浴缸曲线显示了故障率随时间的变化。资料来源:维基百科

随着时间的推移,故障率发生了变化。一个硬件产品的性能可以用浴缸曲线(图2).第一阶段,婴儿期,在不成熟的设计和生产的过程中,失败率下降。初期故障的根本原因包括由零件公差引起的制造问题,以及由运输或存储条件、安装或启动引起的问题。这一阶段是确认制造出来的产品按照设计的方式执行。

请注意,这是从业务的角度出发的,因此失败并不涉及产品的单个实例,而是涉及业务产生的人口。影响浴盆曲线各部分的一个重要因素是温度,因此在此阶段需要对系统的热性能进行检查并与仿真模型进行比较。

下一阶段是正常寿命,故障率降到浴缸曲线的平坦部分。来自各种超应力来源的随机失效组合成一个恒定的总失败率。超应力被定义为超出已知安全操作限制的行程。在曲线的第三部分,失败率增加,因为产品磨损随着时间的推移,它是使用。

失败与成熟的阶段

图1中的V形图表明,通过遵守制造产品的要求来确保可靠性。不符合这些要求的零件被视为有缺陷的零件,因为我们可以假设它们会提前失效。通常,较高级别是许多较低级别的集合。例如,一个电子组件将包含多个板,每个板将包含多个组件和更多的焊点。这也意味着较低级别需要逐渐降低故障率,以确保较高级别的可靠性。在高可靠性环境中,故障率用百万分率(ppm)和过程能力指数(Cpk)表示。

在电子工业供应链中,电子组件的最大可接受故障率范围为Cpk为1.0,对应于2,700 ppm,超出了规格上限或下限。对于关键部件(< 1ppm),大型供应商的Cpk通常从1.33 (60 ppm)到1.67。在汽车应用中,电子子系统的增长,特别是那些与安全相关的,正在推动供应链实现更低的不良率,现在在单个组件的水平上接近1ppm。

一个可靠性能组织是一个设置为从经验中学习和工作积极。这IEEE 1624 - 2008为引导组织能力的可靠性在可靠性能力成熟度模型(CMM)中定义了从阶段1到阶段5的五个阶段,阶段1完全是被动的,阶段5是主动的。表1显示了从矩阵中提取的内容,包括从第2阶段开始的可靠性分析和测试。

表1IEEE 1624能力成熟度矩阵摘自可靠性分析与测试

IEEE 1624可靠性阶段表

对于一个复杂的设计,大量的故障条件和用例会导致许多潜在的故障条件,在硬件中测试这些情况是昂贵和耗时的。基于硬件的测试需要一个后期设计的成熟产品。因此,对于一个复杂的产品,第1阶段的方法很快就显示出对预测建模的需求。

数字化设计,计算机模拟和建模,从CMM阶段2.部署在较低水平,这是纯粹的性能和环境驱动。该产品可以执行其预期的功能,在所有用例,无故障,根据额定输入和输出?试运行,制造业投资和寿命试验设计冻结后,通常开始。

这些需要时间和金钱的投资,不允许迭代方法。阶段2的公司通常将提供计算机模拟作为设计冻结前的设计验证。经验表明,经常需要进行设计返工,以满足部件的安全操作限制的要求,例如,最高环境温度。

由阶段3,虚拟分析应高度与故障情况相关,例如,通过使用场数据和专用可靠性测试,其提供通过虚拟分析检测故障发生之前的高可能性的。在设计故障模式及影响分析(DFMEA),危险优先级号(RPN)被分配给产品故障作为分数严重性,发生,和检测。增加检测的可能性可以降低多达80%的RPN。

在CMM阶段4,典型地模拟在设计过程的早期使用。它不仅用于计算的标称性能,而且还统计分布。换句话说,失败的计算更多的粒度,不作为是/否二进制结果,而是失败的概率,这是设计的统计能力,如Cpk值表示。在DFMEA,这进一步降低了RPN通过备份低或远程产生得分的权利要求。在热设计,较高的CMM公司发展为使用测量通过确认材料特性和沿热流路径粘结线的厚度,以支持仿真模型的保真度。

早期设计的机型,如所示那样图3对于汽车ADAS控制单元,在EDA设计流程中,在组件放置关闭之前进行模拟,可用于支持冷却解决方案的选择,应用确定性设计改进,并探索输入变量变化的可能影响。

汽车ADAS设计的Simcenter Flotherm模型 图3这个汽车ADAS单元的初始设计是在Simcenter Flotherm

计算机模拟和统计技术的结合在解决标称设计和统计设计能力方面是非常强大的。在实验设计(designofexperiments,DOE)中,由许多特定案例组成的场景可以计算为一系列虚拟实验。选择这些案例是为了能够分离出输入和输入组合的影响,从而将标称性能输出作为设计输入的量化函数。在较低的CMM级别,该功能可用于选择设计输入,以便设计在所有规定条件下满足其预期功能。

成为高能力、高可靠性的公司

在更高的CMM级别上,v -模型还包括了解输入的统计分布,以及对允许失败概率的要求,通常表示为Cp/Cpk统计能力或sigma水平。同样,一个DOE可以用来确定作为设计输入和噪声因素的函数的输出性能。随后,噪声的影响和输入因素的统计分布就可以确定,例如,通过蒙特卡罗模拟. 对于每个设计输入和每个噪声系数,从相关分布中选取一个随机值,并在方程中进行替换,以计算性能输出。

这被重复了很多次,例如5000次。因此,5000倍的设计输入和噪声被选择并代入函数来计算性能输出。这将产生一个包含5,000个性能输出值的预测数据集,可用于显示预期的统计分布、预期的统计能力和失败率。

更高级别CMM的块工作流 图4这种更高层次的CMM工作流程结合了数字和统计设计。

更高级别CMM的工作流程如所示图4,并显示了5,000个模拟的性能分析结果,以改进图3所示的设计。演示的Cpk为1.05远低于1.33,因此预期的故障率远远超过可接受的ppm水平。由于寻求的失败率较低,因此需要进行的蒙特卡罗实验次数较多,如图5

在软件程序中显示结温预测的图形 图5在5000个模拟中,对关键IC7组件的结温预测考虑了输入参数的统计变化留意软件。

积极主动的而非被动的做法

低水平的CMM组织对正常使用中的高水平失败有一种反应性的方法;即,名义计算,影响故障率在浴缸曲线的平坦部分。成熟的组织同时在更多的领域工作,并针对浴缸曲线的不同部分部署数字设计的名义和统计模式:产品初期、正常使用和磨损。

第5阶段CMM组织还投资于了解故障的根本原因,这些故障机制是正常寿命和磨损中随机故障的基础。过度应力和磨损需要更广泛的调查,以便能够将寿命预期与工作条件联系起来。这通常需要将特定测量与故障条件和模拟联系起来,以识别压力源、故障物理和加速机制。

西门子EDA已经创造了一种电力电子测试解决方案,将有功功率循环与自动的、符合jedec的热阻抗测量相结合。对封装热结构的评估可用于校准详细的3D热模拟模型,以在设计期间提供最高的预测精度。的图图6运行的IGBT的Simcenter Flotherm软件模型的散热结构的功能的结果进行比较,以在测试的实际部分POWERTESTER

图像显示Simcenter Powertester,和IGBT模块的热模块,以及测试结果的图形 图6该图像示出了Simcenter POWERTESTER,IGBT模块的热模型,以及测量的和校准的结构的功能的曲线图。

这些系统都提供了不同的使用情况的条件综合循环策略和捕获范围能够被施加到所述模型中,除了运行的常规热瞬态测试的电和热的测试数据。例如,该结果可以被用来识别损坏封装互连或零件的热结构内定位劣化的原因,从而满足CMM级4的测试要求和提供必要的数据,以实现阶段5。

这篇文章最初发表于经济日报

Wendy Luiten是西门子EDA的热工专家,也是六西格玛(DfSS)设计黑带大师。

John Parry博士是西门子EDA的电子行业经理。

相关文章

留下你的评论