测试成本飙升

2020-04-05 23:23:10·  来源:自动驾驶测试验证技术创新论坛  
 
在安全和任务关键型市场中使用更复杂的芯片正在改变制造的定价公式由于对汽车和数据中心中先进节点设计的可靠性以及在那些市场和其他市场中芯片寿命延长的担忧,
在安全和任务关键型市场中使用更复杂的芯片正在改变制造的定价公式

由于对汽车和数据中心中先进节点设计的可靠性以及在那些市场和其他市场中芯片寿命延长的担忧,测试成本在制造成本中所占的百分比正在上升。

几十年来,测试被限制在总制造成本的2%之内,这是在芯片制造商和代工厂看到测试成本不断上升的轨迹之后,在千禧年之前开发的一种公式。他们的回应是大大限制了在制造过程中对设备进行测试的时间。反过来,这为能够在多个管芯或晶片上同时执行多个不同测试,并最终在系统级测试中实现不同功能的高度自动化测试设备铺平了道路。除此之外,检查和计量能力也相应提高。

今天,这些测试百分比再次上升。根据最终市场以及该技术的最新程度,在某些情况下,这些数字可能会增加一个数量级或更多,而在另一些情况下,这些数字基本保持不变。

这些峰值背后有许多原因。关键之一是在汽车和关键任务应用中快速部署AI系统,这需要更多的计算元素来处理更多的数据。实际上,如今,在最先进的节点上开发的一些AI / ML / DL芯片已被拼接在一起,以提高处理能力,使其超出标线片大小的芯片所能容纳的计算元素数量。在AI中,更好的是更好的,尤其是在训练和推理方面,这在各种自动驾驶汽车以及边缘和云计算中尤其重要。但这也意味着所需测试数量和复杂性的增加,以及完成足够覆盖所需的测试时间。

OptimalPlus半导体业务部门副总裁兼总经理Doug Elder表示:“在7 / 5nm时,对功能测试,扫描链测试和系统级测试的依赖性更大。” “关键是要获取尽可能多的数据,以便可以尽可能多地加载基线比较。您需要处理的数据越少,对数据驱动方法的质疑就越困难,并且也无法使您充分利用AI。您还需要查看数据的结构,因为由于数据量和设备的结构,收集过程可能很困难。”

这有助于解释为什么许多芯片制造商仍然严重依赖于老化,这是一个耗时且成本越来越高的过程,该过程会在整个芯片或系统上提供单个图像(或多个图像)。

埃尔德说:“他们不愿意放弃它,因为如果有潜在的缺陷,他们想找到它。” “但是,当收集老化数据时,从统计上发现,大多数设备都不会出现老化故障。他们看到的另一件事是大量RMA(退货授权)数据。如果返回了ADAS摄像机,您想知道为什么失败,尤其是在闭环系统中。但是您需要一直收集到最终用户级别的数据,然后将其与制造过程关联起来。这在汽车中变得非常重要,在汽车中,您需要了解为什么传感器在60 MPH时会失效。因此,您可以收集信息,反馈信息并进行关联。”

所有这些都增加了系统的复杂性,并将测试过程延伸到了制造之外。

PDF Solutions全球技术销售主管Keith Arnold说:“测试的成本并不仅仅是增加,因为您并不会总是增加芯片在ATE机器上花费的时间。” “有很多您以前做不到的事情。现在,您可以查看从铸锭到成品的多个过程步骤。很少有人拥有可以利用此功能的系统,但它已经发展到可以预测早期生命失败以及每个模具在现场失效的可能性的程度。”

Arnold指出,在过去的几年中,通过应用机器学习,可以使用数据来了解缺陷的根本原因。“但是现在,如果您进行物理故障分析,电气故障分析和数据故障分析,则可以使用它们来预测何时发生故障。这只是冰山一角,您可以使用这些东西做什么。”

最终,这可以减少责任问题并限制昂贵的退货和召回次数,但这需要在系统级别上进行计算。如果按计划进行,测试和分析成本仍将上升,但其他成本(例如老化)将下降。

尽管如此,这仍必须应用于组成复杂系统的数千个组件,例如自动驾驶汽车。单个封装可以包含多个管芯,数百个IP块,I / O,存储器,各种类型的互连以及从保形膜到刚性基板以及各种类型的凸块和焊球的不同材料的混合物。

包装增加了这个问题的另一个方面,因为即使已知的良好管芯也可能在包装过程中被损坏。尽管如此,大多数愿意花费数亿美元开发芯片的公司也希望通过缩短信号传输距离来最大化该性能。因此,尽管缩小功能为更多的处理元素提供了更大的空间,但在最先进的工艺节点上,仅缩小功能并不能在功率和性能方面带来显着改善。

这是复杂的体系结构更改成为重点的地方,它们为测试增加了又一个复杂度。

yieldHUB的收益管理专家Carl Moore表示:“测试所代表的成本比以前更高。” “如果您想到旧的饼图,则成本是晶片,包装和少量测试费用。测试部分越来越大。您现在正在内部测试数百个节点。这些设备也越来越大,并且随着多芯片技术的发展,它们越来越高。同时,由于引脚会花费金钱,因此存在一种趋势,即最大程度地减少了引脚数量。”

这使得使用标准方法进行测试变得更加困难,并且使得设计芯片变得更加困难,因此可以在这些测试中包含芯片的足够区域。

芯片制造商正在采取一种不同的方法,而不仅仅是在工厂中同时进行更多的测试。尽管整个半导体行业一直将重点从验证和软件开发转移到某些初始测试策略上,但在某些市场(例如汽车和服务器)中,并发趋势正在向左和向右推动测试。。

西门子业务部门Mentor的汽车测试市场经理Lee Harrison表示:“在硬件测试方面,随着汽车行业开发自己的AI,人工智能和汽车之间存在着巨大的交叉。” “我们可以在系统测试中运行很多这样的系统,其中您具有处理核心阵列,并且可以使整个过程保持运行,以确保硬件正确。但是,对具有自动驾驶功能的使用的需求也不断增加,并且预计基础技术的运行时间将大大增加。同时,减少了汽车的循环时间。因此,您需要在系统中运行测试,一个AI芯片中可能包含多达1,000个相同的处理核心。对于更大的AI芯片(将成为汽车的大脑),您还需要实施逻辑修复。我们已经看到内存修复,这代表了大多数芯片上的大量内容。现在,使用AI芯片,您将需要在芯片的整个生命周期内进行核心级别的维修。”

这是一种认识,即在安全关键型应用中,一个AI系统中有成千上万个内核,即使在某个时候,即使杂散的alpha粒子对晶体管造成损坏,也会出问题。关键是要通过持续的测试和监视来了解何时发生这种情况,并能够立即故障转移到备用处理器或晶体管。在系统的整个运行过程中,所有这些都必须反复进行监视和测试。

但是出于更积极的原因,也正在应用测试。在由1000个相同的处理元素组成的数组中,也可以在任何时候分配计算负载,以使电路的老化过程变得均匀。可以持续测试这些电路,并根据需要进行校正。

哈里森说:“有时您希望所有1,000个内核都达到峰值使用率。” “但是,如果您降低到10%,则不希望全部都放在骰子的左上角。因此,您可以制作一个棋盘图案,并尝试尽可能延长组件的寿命。不过,您不希望所有内容都多余,因为如果您有100个额外的核心,则会降低系统的效率。也许您从故障率100%的系统降低到看不见故障的90%的性能。”

要了解这已经变得多么复杂,请考虑EAG实验室的情况,该实验室同时测试材料和芯片故障。

EAG客户经理丹尼尔·沙利文(Daniel Sullivan)说:“至少我们有1.5亿美元用于设备。” “我们有大约100或120种不同的技术。如果您开始谈论技术内部的细微变化,则可能有200种技术。”

找出缺陷的原因可以使每个缺陷花费数千美元。与闲置晶圆厂的成本相比,这显得微不足道,但是每天的成本可能高达数百万美元。因此,找出问题出在哪里,例如材料的纯度受到破坏,可以节省大量资金。这就是在这种情况下愿意支付更多测试费用的意愿,以及制造方面出现问题时的紧迫感。

“这些机器的价值不等,但对于某些机器来说,每台机器的价值可能在150万到200万美元之间,” Sullivan说。“他们还拥有博士学位。谁已经做了30年了,研究技术并弄清楚发生了什么。然后他们从中立的第三方那里获得正式报告。所以博士必须去找他的小贩说:‘您在其中输入x y,z。您不应该这样做。”他们说,“哦,不,那是您的考验。您刚刚做好了。’那是事情来临的时候。我们被视为无私的第三方。因此,有些公司为您提供了帮助。‘我以为应该是别的东西,合同说的是事实。如果错的话,您欠我1亿美元。如果您说对了,我就倒闭了。’所以您需要该第三方,因为这两个人不会互相信任。另外,如果您有一个从事该行业很长时间的专家,他们可以与双方交谈,‘嘿,我以前见过这个。问题看起来像这样,测试显示了这个问题,因此这可能是问题的原因。他们俩都认为,与其战斗,不如去尝试解决问题。但是在很多时候,有人在加工某些东西或正在开发某些产品,并且系统中存在一些污染,他们认为这没什么大不了的。”

测试成本在几十年来首次再次上升,但是目前很难评估多少是必不可少的,可以削减的,以及可以用测试结果和持续的监控数据来完成的其他工作在过去完成。如果测试费用占制造成本的25%,但它将责任成本降低了30%,那就是可观的节省。另一方面,如果测试成本上升而责任成本保持不变或上升,则需要确定该过程。

现在说这将如何在一系列新市场中发挥作用还为时过早。但是,很清楚的是,与半导体历史上的任何时候相比,持续监控提供的洞察力将为供应链的更多部分提供更多信息。现在的问题是,该行业是否会在基础数据中找到足够的价值来继续增加投资,这可能需要数年的时间才能决定。

作者:-苏珊·兰博(Susan Rambo) 
分享到:
 
反对 0 举报 0 收藏 0 评论 0
沪ICP备11026620号