人工智能将重塑半导体产业

文章作者:Lauro Rizzatti

有道理的是,我们会发现很多应用,我们可以利用人工智能的力量来改善我们的流程,更快地制造芯片。

西门子商业顾问公司Mentor的高级营销总监Jean-Marie Brunet在DVCon美国分会就人工智能(AI)和机器学习(ML)这两个热门话题进行了热烈讨论,并担任了主持人。

在长达一个小时的会议上,Achronix副总裁兼首席技术专家Raymond Nijssen参与了讨论;Rob Aitken, Arm的技术总监;AMD高级研究员Alex Starr;Mythic的硬件工程副总裁Ty Garibay;以及英伟达应用深度学习研究主管萨阿德•戈迪尔。

以下是基于小组会议记录的内容。它涵盖了布鲁内的第一个问题,即人工智能如何重塑半导体行业,特别是芯片设计验证和小组成员的印象。

雷蒙德Nijssen:如果你看看正在发生的变化,我们会发现FPGA行业发生了巨大的变化。我们来自传统的应用,在这些应用中,你可以看到DSP应用在fpga中嵌入DSP处理器,而在数据移动和计算性质方面,它们的架构更适合于机器学习应用。这些计算的根相当简单。所有这些算法之间都有一个共同点,它基本上是由很多很多乘法组成的,以各种聪明的方式实现。当然,有很多方法可以解决这个问题。在一天结束的时候,从概念的角度来看,这是一个相当简单的芯片,然后你重复很多很多很多次。

复杂性不是来自芯片的多样性或异质性。这些芯片倾向于同质,强调数据移动和基本运算。从这个意义上说,从传统设计验证的角度验证这些芯片与你已经知道和做的没有什么不同。系统的性能验证要复杂得多,因为系统中有太多的软件。

所有的软件堆栈都是支离破碎的,不同的人用不同的方法解决同一个问题,这导致了完全不同的解决方案。您可能会发现,您在芯片中放置了大量的乘数,以实现高TOPS率。你发现你不能让他们忙,因为在你的记忆子系统的某个地方的瓶颈,或在访问数据的方式,特别是当你有稀疏矩阵。这将会很复杂。最后,人工智能芯片的验证可能比验证处理器更复杂。

罗伯•艾特肯:*我认为这很像验证处理器,因为机器学习单元本身在进行处理。它不是GPU;它不是CPU;但作为程序的一部分,它做了很多乘法和加法。我认为有趣的验证问题就像有人描述的那样——这是这些处理单元如何相互作用以及系统在做什么。

你可以看到,当你建造了一个每瓦能做2000 -无穷大极限的加速器。但你不知道如何将它连接到任何东西上因为你不知道数据是如何从系统内存进入盒子的。然后,当它完成计算时,如何报告结果。

加速度如何适应整个控制流。就像Raymond说的那样,不仅要构建处理问题的软件还要构建硬件,这样才能尽可能地消除许多瓶颈。此外,这样您就可以识别仍然存在的瓶颈,并设计您的系统,使其尽可能快地执行。我们已经做了大量的工作,但还有很多工作要做。

从机器学习验证的角度来看,我认为这是EDA问题的一个有趣子集。如果你看看EDA,在过去的30年里,人们建立了大量的启发式,这些启发式实际上非常好。

不像其他很多问题,如果你只是把机器学习应用到一个典型的EDA问题上,结果不一定会变得更好,你的解决方案可能会更糟。如果你回顾20世纪90年代的人工智能浪潮,有一大堆关于机器学习和你最喜欢的验证方面以及其他EDA问题的论文。其中大多数都没有成功,因为计算能力并不真正存在,而且深度神经网络与浅层神经网络的学习概念还没有真正形成。

我们现在发现的是,看一些具体的问题,你可以找到好的解决办法。例如,Arm所做的一些工作着眼于选择哪些测试向量更有可能在验证套件中增加价值。这个问题很容易表述为机器学习问题,尤其是图像识别问题。一个标准的神经网络集可以计算出这个向量集看起来很有希望,而那个集看起来不太有希望,我们能够在整体验证吞吐量上获得大约2X的提高。除了我们现在都在以某种形式构建人工智能芯片这一明显的解决方案之外,还有一些ML在算法方面发挥作用的解决方案。

亚历克斯·斯塔尔:*我会从我们今天所发展的复杂系统设计的基础开始。万博投注网址我们的多芯片和多插座产品很常见,当然是针对AMD的,所以我们已经面临着规模的挑战,这在人工智能方面是显而易见的。很多设计都需要处万博投注网址理这个问题。从某种意义上说,我们已经用了很多方法来解决这个问题,包括使用基于混合引擎的流程和在验证和仿真中更抽象的建模。

当我看到它的时候,正如前面提到的,这些设计中的计算引擎相对于我们今天在gpu和cpu中使用的一些现有的计算引擎来说是相当简单的。万博投注网址从IP级别的角度来看,这可能相当简单。你如何处理大型设计的缩放?万博投注网址这实际上是一个软件问题——整个系统是如何运行的?

所有这些设计都将根据它们执万博投注网址行这些机器学习算法的速度来衡量。这是硬件和软件/固件的问题。我认为整个行业将不得不考虑如何优化性能,而不仅仅是设计本身,而是整个生态系统。这就是我在AMD的工作。这是我的激情所在,也是我们多年来一直在做的事情,努力改善整个系统的生态系统,并从中获得性能。我们必须解决一个巨大的性能优化挑战。关于“构建复杂设计”的问题,我认为对我们来说,这主要是正常的业务,没有真正的人工智能具体内容。

从“我如何在验证过程中使用AI”的问题来看,我认为这是一个很大的扩展领域。今天,我们可以在混合系统上运行大型设计并处理大量数据。万博投注网址我们如何处理这些数据?历史上,我们一直在观察波形以获取微观细节,但这些都是大型的生态系统,有多个软件堆栈在运行。我如何调试我的软件?当我想优化这个系统时,我应该把我的工程师放在哪里?提高这方面的能见度是关键,人工智能可以在如何分析我们从系统中获得的数据方面发挥作用,并在我们的方法中更具针对性。

泰Garibay: *在我们芯片上工作的设计团队和验证团队基本上实现了一个生成式对抗网络。你有了设计,你有高效的人试图攻击它,设计随着时间的推移而发展,设计师不断修正它,使它变得更好,实际上创造了一个新的芯片。

挑战在于这个芯片是独特的,没有基线数据,或者从芯片到芯片的基线数据的可见性有限,除非你在做衍生品或下一代x86或类似的东西。在目前的环境下,我们正在构建机器学习芯片,就实现而言,我们就像在蛮荒的西部,每个人都选择自己的方式做事情,声称有一种特殊的酱汁。很难看出我们在哪里可以像Arm那样获取大量信息,但他们能够从构建Arm核心的Arm测试流中获取信息。

这与Breker Systems公司的Trek系统类似,该系统可以生成针对内存系统的测试。这个工具以它自己的方式学习,即使它是一个有限的学习工具。随着我们对第二代产品的深入研究,这里显然存在机会。我们了解我们在寻找什么,使用我们收集的数据,并利用这些数据在验证中提高生产率。

萨阿德Godil: *我同意我的很多同事说的话。在构建人工智能芯片的过程中,我还要补充一点考虑。人工智能领域正在快速变化,这将给验证团队带来有趣的挑战。今天,我们必须构建能够快速适应规格变化的验证环境。这就更重要了。

让我用一个例子来说明这个概念。我的同事们每周都有一个读报小组。他们每周阅读不同的人工智能论文。有一周,有人说,“让我们回去读一篇经得起考验的经典老论文。”那篇论文发表于2017年,被认为是该领域的老论文!

制造芯片需要时间,这意味着你要和一个移动的目标生活在一起。你应该构建验证环境,让你在短时间内做出反应,这将使你在交付这些人工智能芯片方面具有竞争优势。

在制造人工智能芯片的话题上,总体而言,该行业已经在设计能够处理规模化问题的芯片。从这个角度来看,我认为它并不独特。我确实认为这是这个环境的一个属性,我希望我们能让更多的人在这个领域工作。我期待着人们在这个领域能想出一些很酷的解决方案,但我不认为只有AI才有什么独特之处。

另一个问题是,人工智能将如何影响验证。我对此持乐观态度。很多人都说人工智能是一种新的电力,很多行业都会受到它的影响。我绝对相信,我们的设计行业将是其中之一。看看我们所拥有的数据量,以及我们所做工作的复杂性。我们会发现很多不同的应用,我们可以利用人工智能的力量来改善我们的流程,更快地制造芯片,这很有道理。

留下你的评论