64位,Linux的处理器,以加速计算on-on-onthing

文章:Nitin Dahad

Cortex-R82是ARM最高性能的Cortex-R处理器,具有64位支持和Linux功能......

ARM已经宣布了Cortex-R82,它的前64位Linux的处理器,用于实时计算固态驱动器(SSD),硬盘驱动器(HDD)和内置存储解决方案的存储功能作为计算存储应用程序。

实时嵌入式系统,如SSD历史上需要小于4GB的DRAM和可寻址空间,并且不需要运行Linux。随着存储容量和性能要求的不断增加存储主机接口的吞吐量,4GB限制和无法运行Linux正在增加复杂性,并且在某些情况下成为障碍。

Cortex-R82处理器,一个能够寻址最多1TB的64位处理器,可针对此类系统进行优化,从而实现更高的性能,实时计算,具有更高的可寻址空间以及为下一代计算运行Linux的能力存储设备。

它的Linux支持为简化的计算存储架构和芯片(SOC)设计的灵活系统铺平了道路,可以根据更改工作负载或不同产品动态地重新分配计算资源。万博投注网址

ARM Cortex-R82
ARM Cortex-R82在单个核心中将MPU和可选MMU集成,允许像Linux这样的高级操作系统执行(图片:ARM)

ARM表示Cortex-R82是第一ARM处理器,其将基于实时上下文和内存管理单元(MMU)的上下文组合在单个核心中。在传统的Cortex-R实时行为中,Cortex-R82核心仍然可以配置内存保护单元(MPU)来运行裸机和RTOS。在Cortex-R82中,也可以使用可选的MMU配置相同的核心,以允许高级操作系统,如Linux执行。

实时和MMU上下文都可以由同一核心同时处理,或者集群中的所选核心可以专用于实时或Linux,这增加了SoC设计的灵活性,以适应多个产品和市场。此选择由软件处理,甚至可以动态更改,从而可以根据需求进行动态调整余额。

Cortex-R82有三个例外水平(ELS)。EL2是最高级别,可以为OEM代码和客户代码分离/隔离虚拟机。更具体地,在EL2上运行的MPU上下文处理MPU和MMU上下文的上下文在EL1与OEM和/或OS代码的上下文,而用户代码在EL0运行。Linux可以运行,当发生实时事件时,处理器可以切换以处理实时事件,然后切换回Linux。安全性可以隔离主固件,并启用基于Cortex-R82的设备的最终客户,以添加自定义软件,实时或基于Linux。

处理器的40个地址位允许它直接解决高达1TB的可寻址空间,这使得非常大的内存或设备实时系统以及对窗口解决方案的提高性能。可以通过AXI或CHI访问此大型地址空间,以使包括原子和缓存藏品在内的额外功能。

Cortex-R82处理器在标准基准测试中提供性能隆起,在实际合作伙伴代码上甚至更高的提升。与Cortex-R8相比,合作伙伴代码执行显示74-125%性能隆起。Cortex-R82处理器还在运行SpecInt2006基准测试时提供Cortex-A55的21%性能隆起。性能隆起满足最苛刻的实时嵌入式工作负载,并轻松运行完整的Linux发行版。

Cortex-R82性能隆起
使用O3的ARM编译器6.14作为优化级别,由于霓虹SIMD指令,EEMBC消费者基准显着提高。实际的客户代码基准测试显示,在Cortex-R8上显示74%至125%。(图片:手臂)

Cortex-R82处理器可选地包括最新的霓虹灯指令,以大大加速机器学习(ML)工作负载,其中具有DOT产品支持等功能。这对于氖可以加速ARM计算库和ARM NN库的计算存储器特别有用,例如用于在充满图像的驱动器中搜索特定图像。

单核根据需求调整为工作负载

在同一核心或核心集群上运行实时和Linux的能力是新兴技术(如计算存储)的键。数据传输通过SSD的数据传输需要实时功能,就像传统的SSD一样。在驱动器上直接运行Linux和相关的软件工具促进计算工作负载管理和文件系统识别,以便在大大降低数据移动,延迟和能量消耗的驱动器上生成洞察力。

存储VS计算工作负载ARM Cortex R82
相同的Cortex-R82核心可用于调整在存储控制器上运行的工作负载类型。因此,可以通过软件动态配置相同的产品,以便在白天运行SSD功能,并在夜间切换到计算存储。(图片:手臂)

例如,通过Cortex-R8核心群集和一个Cortex-A用于Linux核心的群集可以实现这种相同的能力,但是通过Cortex-R82简化了整个系统架构,因为它可以处理两者。这降低了模具尺寸,成本,最重要的是,能够灵活性。相同的SOC可以用于普通企业SSD并重新配置为CSD产品,在较小的过程中保存大的蒙版设置成本以创建多个SOC。甚至可以通过软件动态配置相同的产品以在白天运行SSD功能,并在夜间切换到计算存储。

开发工具

ARM有一套技术和工具,可以支持,加速和降低基于Cortex-R82的存储控制器的开发风险。ARM开发工作室和快速模型使早期硬件和软件合作开发和循环模型允许超越硅可用性的定制基准和性能优化。培训和设计审查服务和Cortex-R82 Artisan物理IP和Pop IP可以帮助加速市场和降低风险。ARM正在开发TSMC 7FF POP,以提供Cortex-R82用例所需的最佳PPA。

发表评论