雷锋网 11-01
RISC-V基金会如何支持HPC和AI领域的公司?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

在北美 RISC-V 峰会上,RISC-V International 的首席执行官 Calista Redmond 在演讲中表示,2024 年,使用 RISC-V 内核的 SoC 数量将达到 20 亿,到 2031 年这个数字将增长到 200 亿。随后登台的 NVIDIA 多媒体架构副总裁 Frans Sijstermans 在演讲中表示,NVIDIA 很可能在 2024 年出货超过 10 亿台使用 RISC-V 内核的设备。

RISC-V ISA(Instruction Set Architecture,指令集架构)的核心价值在于它提供的使用自由度,任何组织都可以利用 ISA 设计最适合其特定需求的核心,没有地区限制或许可成本。倪光南院士曾称 RISC-V 不受垄断制约,是中国最受欢迎 CPU 架构。

近日,海外科技媒体 TechPowerUp 对 RISC-V International 的技术 VP Andrea Gallo 进行专访,就 RISC-V 生态系统碎片化、高性能计算领域、移动行业、AI 和 RISC-V 面临的难题等话题进行交流。

Andrea 于今年 6 月份加入 RISC-V International,负责 RISC-V International 的技术进步以及全球影响力的建立。在加入 RISC-V International 之前,Andrea 曾供职于由 ARM 公司发起的开源组织 Linaro 以及 STMicroelectronics,分别担任 VP 以及设计组组长,具备扎实的产业经验。

来源:RISC-V International 官网

以下为 TechPowerUp 与 Andrea Gallo 的对话内容:

提问:RISC-V 基金会如何支持高性能计算领域的公司?

Andrea:在高性能计算领域,有两方面需要增强:性能和安

性能方面:我们已经批准了矢量扩展,并正在定义矩阵扩展,旨在提高性能。

在安全方面:我们最近批准了与控制流完整性有关的重要扩展。这些功能可确保在函数调用时,返回地址保持完好无损。我们还批准了指针掩码,这是向内存标记迈出的关键的第一步,在进程地址空间内屏蔽的地址位以后可以支持内存标记。此外,我们还在研究主管域访问保护(SMMTT)。

总之,这些努力将增强高性能计算和数据中心的性能和安全性。

提问: 我们看到移动设备计算能力正在大幅提升,RISC-V 基金会希望如何融入其中?是推动更高性能的设计、更高效的设计,还是其他?

Andrea:在 GitHub 上有一个 Android 特别兴趣小组(SIG)和一个 Android RISC-V 64 项目,围绕 RISC-V 支持 Android 开展大量活动。现在市场上新的芯片都支持 RVV 1.0 向量扩展。我们也开始看到使用这些向量扩展的开发板,如 Banana Pi 和 Deep Computing DC-Roma II 笔记本电脑。从开发人员的角度来看,这一点非常有价值,因为在目标平台上进行原生开发至关重要。

还有与高性能计算领域类似的性能计划,重点关注矢量扩展并提供商业开发平台。此外,我们还有一个开发板计划,对采用最新芯片和扩展的新开发板进行审查,确保它们具有最佳性能和安全扩展。我们储备这些开发板,并将其提供给生态系统中主要的维护者和开发者,确保操作系统发行版得到移植和测试。

今年我们已经向关键维护者提供了 200 多块板卡。任何关键维护者需要板卡都可以通过 help@riscv.org 联系我们,以获得支持。

提问:当前的技术热潮实际上是人工智能,有一些加速器是专门为加速人工智能而开发的。这包括矩阵乘法、累加和所有这些特定的东西。有一些公司,比如 Esperanto AI 和 Tenstorrent,正在做基于 RISC-V 的加速器。未来我们是否有可能看到人工智能特定指令的扩展?

Andrea:不仅仅是 Esperanto 和 Tenstorrent,Axelera、NVIDIA 和 Meta 都公开表示他们正在使用 RISC-V。NVIDIA 将 RISC-V 集成到他们的 GPU 中,Meta 在他们的 AI 加速器中使用它。所以,RISC-V 无处不在 AI 中。

说到定制指令,我们有一个 AI/ML 特别兴趣小组。这个小组的工作是分析特定领域,找出差距,突出产品机会,并为新的开发工作提供合理依据。

当我们批准一个新的扩展时,我们知道市场需要这样的产品。例如,Linux 中的开源开发。除非有明确的需求,否则子系统维护者或高级架构维护者不会接受新代码、子系统或贡献。每次增加扩展都会增加你的拥有成本,以及从一个版本到下一个版本的负担。同样的原则也适用于 RISC-V ISA。特别兴趣小组分析差距,确定解决方案。就 AI/ML 而言,我们列出的所有公司都有能力提出具体的新指令。

扩展批准的规范过程非常严格。最近批准的 BFloat16 就反映了 AI/ML 对浮点格式的需求。而围绕矩阵扩展正在进行的工作实际上是由机器学习算法驱动。

提问:这些特别兴趣小组(SIG)批准 ISA 扩展规范的速度有多快?

Andrea:速度取决于提案的复杂程度。如果是重要程度较低的内容,可以走快速通道,可能需要几个月的时间。如果是重要的规范,则应通过所有流程,并有特定的审查窗口,这可能需要六个月或更长时间。所以,时间的长短主要取决于复杂程度。

对于 RISC-V,有一个普遍的误解,那就是每个人添加新的自定义指令会造成巨大的碎片化。根据我的体验,我是六月底加入 RISC-V International 的。第一天参加的是欧洲峰会。审查过程的严谨性和彻底性给我留下了深刻印象。编写规范的工作组会对规范进行审核,之后有一个架构审查委员会,然后是一个月的公开审查。最后,是技术指导委员会进行审查,所有委员会主席和董事会都会进行审查。有一个严格的过程,避免不必要的分散。

提问:前面简短地谈到了每个人都在执行自己的定制指令。举例来说,如果我们想构建一个 RISC-V 加速器,我们可以使用基础 ISA,然后添加我们的特定应用指令集来加速人工智能程序。这些自定义扩展功能的存在对生态系统造成巨大的碎片化。RISC-V International 如何解决这个问题?

Andrea:我前面提到了编写、修正和扩展新规范过程的严谨性。如果你想声称自己兼容 RISC-V,那么就需要一个架构兼容性测试套件来验证你是否符合 ISA。我们在黄金参考模型上运行相同的测试,并比较测试特征值,以确保与规范保持一致。

防止碎片化的下一步是在软件移植层面。在嵌入式系统中,供应商或设备制造商可能采用垂直集成的软件方法,以著名的 " 意大利面条代码 "(一种编程术语,指的是结构混乱、难以理解和维护的代码)工作方式控制整个垂直软件栈。然而,现代应用处理器需要运行二进制操作系统发行版,而无需进行更改。因此,如果一个操作系统供应商只针对跨产品的最小兼容性,那么它将是最基本的 RV64I 或 RV64G,这只是一个很小的子集。为了解决这个问题,我们正在开发配置文件。

我们有大量按配置文件分组的扩展。具体来说,我们有一个应用处理器配置文件,我们会升级这些配置文件规范,这是一组强制扩展和一些可选扩展。我们刚刚批准了 RVA23 配置文件,新批准的 RVA23 Profile 是 RISC-V 软件生态系统的一个重要版本,将有助于加快工具链和操作系统的广泛实施。

再下一步是平台。为了进一步改善和加速跨垂直领域或同一垂直领域内跨产品的软件重用,作为一个生态系统,我们正在商定一套硬件和软件接口,这些接口将是相同的,也是平台规范的一部分。有一个团队正在开发服务器 SOC 和服务器平台。包括为定时器、时钟、IOMMU、RAS 和相关错误报告机制提供相同的接口。我们应该为特定的外围设备使用相同的接口,例如服务器平台的一部分。

提问: 为什么需要另一个商业指令集?RISC-V International 会比 Arm 和现在的 x86 等竞争者做得更好的是什么?

Andrea:我想从两个不同的角度来回答这个问题:创新和不受约束

RISC-V 生态系统的创新速度、能量和步伐令人难以置信。任何人都可以从 RISC-V 网站上的培训课程开始,学习如何开发 RISC-V 内核和添加自定义扩展。从开发人员的角度来看,能够从零开始开发 RISC-V 内核具有巨大的价值。与此同时,作为 RISC-V ISA 的管理者,我们还能将其注入新的标准中。所有这些都是其他架构无法实现的。作为市场竞争对手的公司在 RISC-V 国际会议上为实现共同目标而合作,我们有超过 4500 名成员,这在其他地方是看不到的。

另一个非常重要的方面是不受约束。这不仅仅是授权模式或版税的问题,而是能否掌控自己的命运,而不依赖于可能突然停止支持你的另一个实体。如今,这可能是一个国家安全问题。现阶段,许多国家和政府都从数字主权的角度投资 RISC-V。前面我们提到了人工智能,人工智能在我们的生活中正变得至关重要,各国都在为数字主权进行投资,以确保在能力、专业知识以及知识产权方面建立起开发本国人工智能解决方案的能力。

我们在全球都看到了这种势头。欧盟正在资助合作项目,开发基于 RISC-V 的软件定义汽车。中国有广为人知 " 一生一芯 " 计划,由北京开源芯片研究院和中科院牵头。他们有数以千计的学生基于 RISC-V 设计芯片,其中有十多个已经成型并投入使用。几个月前,巴西加入了 RISC-V 国际组织,成为其成员,因为他们希望在巴西发展和加速基于 RISC-V 的项目。当然,加州大学伯克利分校也继续在学术研究方面发挥作用。世界各地的大学、政府和跨国公司正在掌握自己的命运,投资 RISC-V 以解决本地问题,同时在全球范围内参与 RISC-V 生态系统。

提问:你的意思是 RISC-V 成功的两条道路是:首先,向开发人员提供硬件,让他们学习 RISC-V,这将帮助他们成为熟练的工程师,最终可能在开发 RISC-V 软件和硬件的公司工作。第二条路径就是亲自推动这一进程,对吗?

Andrea: 是的,包括学生、学术界、初创企业、跨国公司和国家。

提问:您认为 RISC-V 在未来 10 年的发展前景如何?

Andrea:回顾过去,RISC-V 从加州大学伯克利分校的一个学术项目发展到今天的规模,这是一段不可思议的历程。2023 年生态系统的整体业务量比 2022 年增长了 2.5 倍。据 SHD Group 预测,到 2030 年,RISC-V 将在消费、计算机、汽车到数据中心和工业等垂直行业占据市场约 30% 的市场份额,每年基于 RISC-V 的 SoC 出货量将超过 200 亿颗。我们不再计算内核,而是计算芯片,每个芯片包括很多很多内核。10 年后,我希望看到 RISC-V 成为每个新产品设计的首选 ISA。

本文由雷峰网编译自:Interview with RISC-V International: High-Performance Chips, AI, Ecosystem Fragmentation, and The Future | TechPowerUp

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

ai nvidia risc-v 首席执行官 院士
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论