一款颠覆性的RISC-V芯片
据IEEE报道,英国Pragmatic Semiconductor 公司及其同事研发的新型超低功耗 32 位微处理器可以在弯曲时运行,并可运行机器学习工作负载。该微芯片的开源 RISC-V 架构表明其成本可能不到一美元,使其能够为可穿戴医疗电子产品、智能包装标签和其他廉价物品供电,其发明者补充道。柔性电子产品具有与软材料相互作用的任何应用的潜力,例如佩戴在身上或植入体内的设备。这些应用可能包括皮肤上的计算机、软机器人和脑机接口。但是,传统电子产品是由硅等刚性材料制成的。
开源、灵活、速度足够快
尝试用硅制造柔性设备需要对易碎的微芯片进行特殊封装,以保护它们免受弯曲和拉伸的机械应力。相比之下,用 IGZO 制成的柔性薄膜晶体管可以直接在低温下在柔性塑料上制造,从而降低成本。
“我们的最终目标是通过开发免许可的微处理器来实现计算的普及,”Ozer说。
“我们在设计 Flex-RV 时选择了Olof Kindgren 设计的Serv ... 作为开源 32 位 RISC-V CPU,”Ozer 说道。“Serv 是开源社区中最小的 RISC-V 处理器。”
每个 Flex-RV 微处理器都有一个 17.5 平方毫米的核心和大约 12,600 个逻辑门。研究小组发现 Flex-RV 的运行速度可以达到 60 千赫兹,而功耗却不到 6 毫瓦。
硅微芯片可以以千兆赫的速度运行,比 Flex-RV 快得多,但 Ozer 表示这应该不是问题。“柔性电子领域的许多传感器(例如温度、压力、气味、湿度、pH 值等)通常以赫兹或千赫兹的频率运行,运行速度非常慢,”他说。“这些传感器用于智能包装、标签和可穿戴医疗电子产品,这些是柔性微处理器将大有裨益的新兴应用。以 60 kHz 的频率运行微处理器足以满足这些应用的要求。”
以下为关于这项技术的论文全文翻译:半导体已经对社会产生了非常深远的影响,加速了科学研究并推动了更大的连通性。未来的半导体硬件将在量子计算、人工智能和边缘计算方面开辟新的可能性,用于网络安全和个性化医疗等应用。就其精神而言,开放硬件为教育、学术研究和行业之间的更大合作和创新提供了机会。
这里我们介绍了 Flex-RV,这是一款基于开放 RISC-V指令集的 32 位微处理器,采用铟镓氧化锌薄膜晶体管在柔性聚酰亚胺基板上制造,可实现超低成本可弯曲微处理器。Flex-RV 还在微处理器内部集成了可编程机器学习 (ML) 硬件加速器,并演示了扩展 RISC-V 指令集以运行 ML 工作负载的新指令。它经过实现、制造和演示,运行频率为 60 kHz,功耗不到 6 mW。其组装到柔性印刷电路板上时的功能在平坦和紧密弯曲条件下执行程序时得到验证,平均性能变化不低于 4.3%。
Flex-RV 开创了低于 1 美元的开放标准非硅 32 位微处理器时代,并将使计算访问变得普及化,并解锁可穿戴设备、医疗保健设备和智能包装中的新兴应用。
文章重点
我们推出了 Flex-RV,这是一款基于开源 32 位 RISC-V 中央处理单元 (CPU) 的 32 位 RISC-V 微处理器,并扩展了机器学习 (ML) 功能,采用铟镓氧化锌 (IGZO) 薄膜晶体管 (TFT) 制造,可为新兴应用提供超低成本且适应性强的微处理器。
新兴应用尚未嵌入微处理器,例如快速消费品(例如智能标签和包装)、医疗保健可穿戴设备(例如智能贴片和敷料)、一次性医疗保健植入物(例如神经接口)和一次性医疗保健测试条(例如横向流动测试、微流体)主要是因为成本和外形尺寸。成本是实现这些应用的决定性因素,特别是在智能标签和商品包装中。
此外,就物理灵活性和可弯曲性而言,外形尺寸对于医疗保健可穿戴设备和植入物非常重要。这些新兴应用对速度和通信带宽的计算要求并不高。这些应用中的传感器所需的数据采样率不高于 200 Hz;在某些情况下,采样率可以高达 1 kHz,因此以低时钟频率(例如 <100 kHz)工作的微处理器可以满足应用的计算要求。
50 多年来,硅 (Si) 一直是开发微处理器的基础半导体技术,在其发展道路上不断改进性能、面积、功耗和成本,这主要受到摩尔定律的推动。在此期间,微处理器的速度从 kHz 提高到 GHz,因为晶体管的几何尺寸从几微米缩小到今天的 2-3 纳米,低端微控制器的单位成本高达几美元。然而,对于许多新兴应用来说,微处理器几美元的单位成本是行不通的。单位成本无法降至不到 1 美元的水平有三个主要原因:(1) Si 晶圆厂的资本成本;(2) CPU 指令集、知识产权 (IP) 许可和非经常性工程 (NRE) 成本;以及 (3) 微处理器芯片封装成本。
1.硅晶圆厂资本:
最先进的硅制造厂需要数百万的资本投资,主要专注于先进节点的高端微处理器(例如 2-3 纳米)。低端微处理器(如嵌入式系统的微控制器)可以在较旧的传统晶圆厂(>65 纳米)中生产,以最大限度地降低投资成本。然而,工厂在传统晶圆厂的投资相对较少,这会导致运营和合规成本随着时间的推移而增加,同时还会带来环境问题。
2.IP 许可和 NRE 成本:
每个微处理器都有一个 CPU,它根据其特定的指令集架构 (ISA) 执行程序,该架构可以是专有的(例如,Intel 和 AMD 的 x86、Arm 的 ARMvX)或开源的(即 RISC-V)。专有 ISA 提供了成熟的生态系统,但许可成本高昂,并且由于添加新指令通常受到限制,因此提供的定制有限。替代方案包括许可现有 CPU(会产生前期 IP 成本),或开发新的专有 ISA,这需要 CPU 设计 NRE 成本和软件工具集开发费用,这两者都会增加单位成本。
3.芯片封装:
硅芯片对环境条件(包括机械应力)敏感。它们易碎,需要组装到单独的封装(例如塑料、陶瓷)上以保护它们免受环境影响。芯片连接、组装、封装材料和封装芯片测试的成本增加了微处理器的名义单位成本。此外,将刚性硅微处理器嵌入这些可穿戴或可植入设备之一具有挑战性,因为微处理器的芯片封装将限制设备在刚性和厚度方面的能力。必须消除刚性芯片封装材料,以降低微处理器的成本并使其在新兴应用中具有适应性。
我们需要一种超低成本、可适应并提供可接受性能的微处理器,以满足新兴应用的要求。为了实现价格低于 1 美元且物理上灵活的微处理器,两种支持技术可以帮助我们克服以前的限制:
1.RISC-V ISA:
必须将低于 1 美元的微处理器中 CPU 的 NRE 成本降至最低(例如,ISA/IP 许可)。RISC-V是一种开放且免费的 ISA 标准,允许任何人开发实现 ISA 的 CPU,从而消除了 ISA 许可费,从而消除了微处理器开发的 NRE 成本。此外,RISC-V 生态系统鼓励创新,不限制修改或扩展(例如,新指令),使设计人员能够定制微处理器以满足定制或应用需求,而无需承担额外成本或限制性许可的负担。
2.IGZO TFT:
低于 1 美元的微处理器必须采用替代 Si 的半导体技术在比 Si 晶圆厂(包括传统晶圆厂)便宜几个数量级且碳足迹更少的晶圆厂中制造,其中的碳足迹是指芯片设计和制造过程中的二氧化碳排放量。
IGZO 是一种金属氧化物半导体材料,可用于使用低温光刻工艺在柔性聚酰亚胺基板上开发 TFT 。TFT 是通过在绝缘体基板上沉积半导体、电介质和电极来制造的,而不是在刚性硅晶片上使用掺杂 Si 来开发 MOSFET(金属氧化物半导体场效应晶体管)。
Pragmatic的FlexLogic晶圆厂可以制造由 IGZO TFT 制成的柔性芯片或 FlexIC ,与同等 Si 晶圆厂相比,每个 FlexIC 的碳足迹要低几个数量级。此外,FlexIC 不需要像 Si 芯片那样使用额外的芯片封装(例如塑料、陶瓷)来保护它们免受机械应力,因为它们不易碎,可以抵抗弯曲等机械应力。这可以将微处理器的单位成本进一步降低到低于 1 美元的水平,同时还具有弯曲功能。
之前曾有过基于柔性基板的非硅微处理器原型。早期的研究基于使用低温多晶硅 TFT 和有机、混合氧化物和金属氧化物 TFT 的 8 位 CPU 。在下文中,作者 介绍了 PlasticARM -第一款基于专有ARM ISA 的 32 位微处理器,该 ISA 使用基于 IGZO 的TFT。
PlasticARM不是可编程微处理器,其片上只读存储器中只运行三个硬连线程序。虽然不是基于柔性基板,但展示了一种源自 RISC-V ISA 的 16 位 CPU,该 CPU 使用互补碳纳米管晶体管在传统硅晶片上构建。除了非硅微处理器外,先前的研究已经展示了使用在柔性基板上制造的 IGZO TFT 设计和实现的几种ML ASIC(专用集成电路)。
Flex-RV 在三个方面不同于之前的非硅微处理器:(1)32 位微处理器是可编程的,可以运行用高级语言(例如 C)编写的任意编译程序。(2)RISC-V 的开源性质允许使用新指令扩展 ISA,因此 Flex-RV 还具有可编程 ML 加速器,该加速器与 CPU 紧密耦合,并添加了自定义 RISC-V 指令。(3)我们通过使用为此工作开发的创新技术(称为边缘印刷或 OEP)将微处理器裸片组装到柔性印刷电路板 (FlexPCB) 上,展示了微处理器在晶圆级测试之外的功能,而所有其他以前的工作都是在晶圆级上演示的,无需从玻璃载体上释放并切割。
这样,我们就可以在运行程序的同时对 Flex-RV 进行物理弯曲测试,以验证其在机械应力下的功能。我们演示了组装到 FlexPCB 上的 Flex-RV 的功能,并在多个测试程序中量化了其性能。我们的结果表明,组装在 FlexPCB 上的 Flex-RV 可以以高达 60 kHz 的速度运行,同时功耗不到 6 mW,并且可以弯曲到曲率半径小于 5 mm 时仍能正确执行程序。
这项工作开启了下一代智能、普适计算的大门,其中灵活、可编程的处理器与 ML 功能的集成将智能感知嵌入到日常物品中。
Flex-RV 系统架构
我们使用开源 Serv RISC-V CPU 来实现微处理器,这是迄今为止开发的最小的开源 RISC-V CPU 之一。Serv 是一种位串行 CPU,其中 32 位计算是逐位执行的,而不是像更典型的 CPU 那样并行执行。这以牺牲性能为代价降低了 32 位 RISC-V 处理器的设计复杂性,其低设计复杂性是选择 Serv 作为 Flex-RV 的 CPU 的主要原因。我们围绕 Serv CPU 设计了一个简单的片上系统 (SOC),以开发可以与外界通信的微处理器。
Flex-RV 被设计为一个简单的 SOC,由一个 Serv RISC-V CPU 和附加外设组成。作为 Serv 参考平台开发的 Servant SOC 被用作 Flex-RV 的起点。如图1a所示,Servant 包含 Serv CPU、寄存器文件 (RF)、调试开关、多路复用器开关、仲裁器、随机存取存储器 (RAM) 接口、片上 RAM 块和通用输入/输出 (GPIO) 接口。Serv 支持 RISC-V RV32I ISA,它具有 32 个通用寄存器和 4 个额外的控制和状态寄存器。代码和数据通过调试开关从外部存储器加载到片上 RAM 中。GPIO 接口可用于与外部世界通信(例如显示器)。
我们修改了 Servant 中的某些功能来开发 Flex-RV,如图1b所示。例如,Serv 经过修改以支持 RV32E ISA,它支持与 RV32I 相同的指令集,但仅使用前 16 个寄存器。我们删除了调试开关和片上 RAM。由于当前的 FlexIC 技术出于面积/功率原因不允许我们放置相当大的片上存储器(例如,>1kB SRAM),我们选择使用片外存储器来访问代码和数据,因此添加了自定义串行外设接口 (SPI) 或 C-SPI 块来与外部存储器通信。C-SPI 块从外部存储器获取 32 位 RISC-V 指令,并对存储器执行 32 位数据加载/存储操作。使用 C-SPI 与外部存储器通信而不是使用并行数据、地址和控制总线访问它的主要原因是为了减少片外焊盘的数量,从而简化将 Flex-RV 组装到 FlexPCB 上的过程。C-SPI 块的详细信息(包括内存事务)可在方法中找到。
我们还设计了一个可编程的 ML 加速器,它是一个 SIMD(单指令多数据)引擎,用于加速当代 ML 算法中常用的矩阵乘法和后处理操作。ML 加速器作为自定义功能单元 (CFU) 与 Serv 紧密耦合,并在 RV32E ISA 中添加了四条新指令,以便可以对加速器进行编程。方法中描述了 ML 模型、加速器架构、四条新指令和编程接口的详细信息。
Flex-RV 已使用 RISC-V 架构合规套件针对 RV32E ISA 进行了验证。还开发了几个测试基准来验证其功能,这些基准是用 C 语言编写的(带有一些内联汇编代码),并使用 RISC-V GNU 编译器工具进行编译。测试基准和编译环境的详细信息可以在方法中找到。
我们使用 Pragmatic 的 0.6 µm FlexIC 技术实现 Flex-RV,该技术采用由 n 型 IGZO TFT 和电阻上拉组成的单极逻辑。芯片实现(即综合、布局布线、静态时序分析、布局布线后仿真和签核)是使用商用电子设计自动化 (EDA) 工具执行的。RF 是一个双端口阵列,具有一个读端口和一个写端口,阵列大小为 20 × 32 位(或 80 字节)。它使用布局邻接方法通过锁存器实现,以增加阵列的密度(详情请参阅方法 )。芯片的布局和芯片照片如图2所示。测试芯片的芯片尺寸为 9 mm × 6 mm,有 20 个引脚,芯片中装有两个 Flex-RV 微处理器。每个 Flex-RV 微处理器的核心面积为 17.5 mm² , NAND等效门数为 12,596,3 V 时的功耗为 5.8 mW。由于电阻上拉逻辑,5.8 mW 功耗主要是静态的 (99%)。
测试芯片是在 Pragmatic 的 FlexLogic 晶圆厂中制造的,采用薄膜沉积工艺,在厚度为 30 µm 的 200 毫米聚酰亚胺晶圆上制造的,该工艺可创建金属氧化物 TFT 和电阻器的图案层,具有四个可布线的金属层和一个额外的 RDL(重新分布层),用于将芯片的核心焊盘重新布线到将成为与外部世界接口的外围焊盘。
测试基础设施和结果
测试基础设施由两个完整阶段组成:(1)玻璃晶圆测试和(2)FlexPCB 测试。
MicroZed Zynq-7000 现场可编程门阵列 (FPGA) 板用于测试 Flex-RV。FPGA 芯片经过编程以模拟外部存储器,并通过同样在 FPGA 上实现的 SPI 块与晶圆上的 Flex-RV 通信。编译后的测试基准的二进制文件被加载到 FPGA 上的内存中,FPGA 板重置测试芯片中的每个 Flex-RV,然后它们开始执行每个内核。测试基准的结果通过每个 Flex-RV 的 GPIO 引脚传输,该引脚通过 FPGA 连接到个人计算机 (PC) 的通用异步接收器-发送器 (UART) 接口,以在屏幕上显示结果。FPGA 板还为每个测试芯片提供电源、时钟和复位信号。
在第一阶段,使用半自动晶圆探针台(图3a)对晶圆上的测试芯片进行功能测试,以识别功能正常的 Flex-RV。在第二阶段,使用 OEP(一种为这项工作开发的新组装方法)将第一阶段识别的功能正常的 Flex-RV 组装到 FlexPCB 上(图3b)。然后,组装好的 FlexPCB 通过 FPC 连接器连接到 FPGA 板(图3c)。基于 FPGA 的测试基础设施和 OEP 组装过程的详细信息可以在方法中找到。
图3d显示了测试芯片中的 Flex-RV 微处理器在 13 个组装的 FlexPCB 上运行所有测试基准时可达到的最高时钟频率(以千赫兹 (kHz) 为单位)的分布。13 个 FlexPCB 上的平均和最大时钟频率分别为 52 kHz 和 60 kHz。
最后,我们在机械应力下验证了 Flex-RV 组装的 FlexPCB 的功能,并测量了最高可实现时钟频率的变化。机械应力是通过将每个 FlexPCB 沿着与 FlexPCB 连接器平行的轴(也沿着 Flex-RV 的长度)滚动在非导电圆柱体上来实现的,直到测试芯片弯曲到圆柱体的曲率半径。已知 IGZO TFT 可以弯曲到 3 毫米的曲率半径而不会损坏,并且器件参数(例如迁移率和阈值电压)在不同的应变情况下会发生变化。但是,这些测试针对的是单个 IGZO TFT 器件,而我们主要研究 FlexIC 级别的可弯曲性公差。
目前尚未有研究证明像 Flex-RV 这样的复杂 FlexIC 单独或在 FlexPCB 上组装时通电运行时的可弯曲性。我们使用三个不同的圆柱体(半径分别为 3 毫米、4 毫米和 5 毫米)证明了组装在 FlexPCB 上的 Flex-RV 的可弯曲性,并在拉伸(即芯片的曲率向外)和压缩(即芯片的曲率向内)模式下对其进行测试,如图4a、b分别所示。总共对包含九个 Flex-RV 微处理器的七个组装 FlexPCB 进行了可弯曲性分析测试。这是一个动态可弯曲性测试,因为在芯片中的两个 Flex-RV 微处理器都在运行测试基准时,会滚动 FlexPCB 并弯曲 Flex-RV 芯片——图4c中显示了一个示例。
当 FlexPCB 平放时,测试基准开始在微处理器上运行。在程序运行时,FlexPCB/Flex-RV 会绕圆柱体弯曲至拉伸模式,然后恢复至平坦状态。接下来,它们会弯曲至压缩模式,然后再恢复至平坦状态。每个 FlexPCB 上的 Flex-RV 微处理器都会重复此操作两次。
图4d显示了在三个不同弯曲半径下弯曲实验的加速结果。在动态弯曲测试期间,当芯片处于拉伸或压缩模式时,在每个 Flex-RV 微处理器上运行测试基准直至完成。我们在拉伸或压缩模式下测量 Flex-RV 微处理器在所有测试基准中可实现的最高时钟频率,并将其与平坦时可实现的最高时钟频率进行比较,即时钟频率的加速。我们的结果表明,当每个微处理器回到其最高可实现时钟频率时,即在两个平坦位置、两个拉伸和压缩模式之间,Flex-RV 微处理器表现出灵活性。
我们还观察到两种趋势:(1) Flex-RV 在拉伸模式下运行速度更快,但在压缩模式下运行速度更慢,这归因于设备(即 TFT 和电阻器)和导线参数(例如电阻和电容)的变化。(2) 随着曲率半径的减小,其在拉伸模式下的性能会提高。这是因为随着芯片的拉伸力增加,器件和导线参数会按比例变化,从而提高 Flex-RV 的性能,而在压缩模式下则相反。弯曲实验表明,Flex-RV 在 3 毫米的弯曲半径下可以正常工作,并且平均而言,与平坦位置相比,Flex-RV 在拉伸模式下的运行速度可以提高 2.3%,在压缩模式下的运行速度可以降低 4.3%。
结论
我们开发了一款低于 1 美元、可弯曲且灵活的微处理器 Flex-RV,它采用基于 0.6 µm IGZO TFT 技术的非硅技术,并支持开放的 RISC-V 指令集。此外,我们在 Flex-RV 中加入了可编程硬件加速器,以支持 ML 应用。Flex-RV 在低成本、低环境足迹的 FlexLogic 晶圆厂中在厚度为 30 µm 的聚酰亚胺基板上制造,然后组装到厚度为 45 µm 的 FlexPCB 上,构建超薄计算系统。我们的实验结果表明,Flex-RV 的运行速度可以高达 60 kHz,总功耗不到 6 mW,并且可以在低至 3 mm 的弯曲曲率半径内正常运行,运行程序时的性能变化范围平均为加速 2.3% 到减速 4.3%。因此,它可以满足快速消费品、可穿戴设备和医疗保健设备中许多新兴应用的需求。
Flex-RV是构建不依赖任何传统电子元件的超低成本可弯曲计算机的重要里程碑。
参考链接
https://www.nature.com/articles/s41586-024-07976-y
页:
[1]