来源:Frontiers of Computer Science 发布时间:2024/1/11 15:12:24
选择字号:
FCS | 文章解读 | 云中的FPGA共享:综合分析

论文标题:FPGA sharing in the cloud: a comprehensive analysis(云中的FPGA共享:综合分析)

期刊:Frontiers of Computer Science

作者:Jinyang GUO, Lu ZHANG, José ROMERO HUNG, Chao LI, Jieru ZHAO, Minyi GUO

发表时间:15 Oct 2023

DOI: 10.1007/s11704-022-2127-0

微信链接:点击此处阅读微信文章

原文信息

标 题:

FPGA sharing in the cloud: a comprehensive analysis

发表年份:

2023年

原文链接:

https://journal.hep.com.cn/fcs/EN/10.1007/s11704-022-2127-0

引用格式:

Jinyang GUO, Lu ZHANG, José ROMERO HUNG, Chao LI, Jieru ZHAO, Minyi GUO. FPGA sharing in the cloud: a comprehensive analysis. Front. Comput. Sci., 2023, 17(5): 175106

01 导读

云供应商正在积极地将FPGAs应用到他们的基础设施中,来提高性能和效率。随着云服务的不断发展,FPGA(现场可编程门阵列)系统将在未来发挥更重要的作用。在这种情况下,多租户场景中的FPGA共享对于FPGA在云中的广泛采用至关重要。最近,人们在云计算堆栈的不同层上进行了许多工作,来实现有效的FPGA共享。

在这项工作中,本文对FPGA共享的最新工作进行了全面的调查,从不同的方面研究现有技术,并就几个关键主题概括相关建议。

一方面,本文讨论了FPGA资源共享方案的代表性论文;另一方面,本文还总结了支持有效共享的重要软件/硬件技术。重要的是,本文进一步分析了FPGA共享背后的系统设计成本。最后,根据本文的调查,确定了FPGA共享在未来云场景中的关键机遇和挑战。

02 概述:FPGA共享

对灵活性和可持续性的要求使FPGA在可选的处理技术中脱颖而出,云供应商将FPGA集成到他们的基础设施中是一个大趋势。主流的云服务提供商(CSPs)采用这种可编程设备来改进云计算在过去十年的效率。

FPGA业务模型

大量的工作证明了FPGA在性能和效率方面的优势,CSPs可以利用FPGAs来提高其云服务的灵活性和可持续性。在不同的云服务模型中,云服务提供商可以根据用户的需求提供各种面向FPGA的计算服务模型。具体来说,基于FPGA的计算服务模型可分为:

1)IaaS中的FPGA。CSPs通过整个FPGA板提供计算服务。设备反应为可定制的未配置计算资源。

2)PaaS中的FPGA。CSPs通过配置好的开发平台提供FPGA服务。

3)SaaS中的FPGA。CSPs将FPGA作为定义的加速器提供,用户可以使用带有特定APIs的预配置功能

此外,还有一些新兴的FPGA本地服务模型在文献中也有讨论,FPGA可以看作是计算服务的独立形式。BlastFunction和Fasten将无服务器计算扩展到FPGA上,并发现了一种称为FPGA即服务(FaaS)的新模型。Skhiri等人提出了一种硬件设计的中间表达,将其定义为ip即服务(IPaaS)的新模型。

FPGA共享的分类

多租户中的FPGA共享是FPGA在云中广泛应用的关键。云FPGA的使用往往更加灵活,具有相应的体系结构。撇开机制不谈,FPGA在不同业务模型中的共享仍然存在一些共性,本文从资源共享方案、共享支持、系统设计成本等方面总结了这些相似性,如图1所示。在后面的部分中,本文将根据分类法详细讨论FPGA共享。

图1 FPGA共享的分类

03 FPGA资源共享

本节介绍基于资源组织的两个互补部分,讨论基于资源组织的FPGA共享策略。面向资源的FPGA共享现有技术分为独立资源共享和有组织资源共享两种类型,独立的资源共享和有组织的资源共享有不同的问题。没有组织的初始FPGA资源称为独立资源,有组织的资源是分组到分区中的FPGA资源的子集。

独立资源共享

FPGA基于独立资源共享的工作关系到FPGA的体系结构特点,FPGA板上的硬件资源可以根据可编程性进行分类。一些FPGA资源是可配置的,其他是静态资源。可编程资源通常即作为动态区域或角色聚集组成,副本构成静态区域或外壳,本文讨论了资源类型和具体的共享对象以分析独立资源共享,FPGA资源通过特定的共享对象实现共享。

1.资源分解

基于独立资源的FPGA现有技术密切关注制造,这些工作增强了FPGA在硬件功能方面的可编程配置,包括容量、连接性和存储。本文根据功能划分FPGA的资源,这些资源包括逻辑资源、连通性资源和内存资源。逻辑资源FPGA的逻辑资源用于功能定制;连通性资源FPGA包含多个网络和连接资源,用于特定目的;存储器资源FPGA所配备的存储器资源按位置可分为片内存储器和片外存储器两类,片内存储器用作临时存储器,片外存储器用作数据存储器。

2.资源共享对象

共享对象是为FPGA共享管理提供抽象的虚拟资源,前文提到独立资源分为三类:逻辑资源、连接资源和内存资源。如表1所示,这些资源的共享在类别和配置上都很复杂。FPGA资源共享依赖于特定的共享对象,FPGA共享对象与具体资源如下:

(1)配置共享

(2)带宽共享

(3)能力共享

表1 FPGA资源和共享对象

有组织的资源共享

有组织的资源共享是一种基于分组FPGA资源集合的资源共享,模叠技术用于现有的云端FPGAs,这种架构为FPGA资源的管理增加了一层复杂性。FPGA器件可以看作是子器件的集合,这些子器件由独立的模具组成,这种FPGAs组织包含独立的逻辑资源、内存资源和单片芯片的连接性。

FPGA供应商发布的高端设备就带有这种在容量和经济之间的权衡,图2展示了赛灵思Alveo系列的平面布置图,这些器件基于多芯片,每个单片芯片被称为超级逻辑区域(SLR),模具的堆叠引入了自然的硬件边界,每个内核都是一个独立的资源管理单元。此外,一些工作提供了更细粒度的FPGA单元,它们引入了一种称为部分可重构区域(PRR)的新资源集合。

本文认为FPGA共享是一种独特的硬件共享灵活的分层组织。换句话说,它具有多个粒度(板子、模具和PRR)。

图2 赛灵思Alveo系列板的平面布置图

04 FPGA共享支持

灵活的FPGA共享需要特定的系统和技术支持,支持技术分为硬件支持、软件支持和安全保障三类,如表2所示。

表2 FPGA共享的技术支持

1.硬件支持

FPGA共享在方式和粒度上趋于多样化,灵活的FPGA共享是基于硬件复用的。FPGA设备多路复用需要几个基本的硬件支持:

(1)重新配置:FPGA可以与租户的不同配置共享,重构主要基于FPGA的可编程性。高效的可编程性使FPGA具有自定义功能,重构是设计更新的重要支撑保障,部分重构技术支持FPGA在空间上与硬件更新共享。支持部分重构是提高FPGA在云多租户场景下共享灵活性的关键,部分重新配置可以实现细粒度共享。

(2)连通性:多租户中的FPGA共享表现为功能在单板上的共同定位,连接性对于支持功能共存的硬件设计非常重要。FPGA具有丰富的连接资源,包括接线源、PCIe和网卡,方便的连接使得FPGA空间共享的硬件设计可以在同一位置。

(3)分区:有效的基于云的FPGA系统通常针对特定的器件,这些设备支持各种资源分区,可以将资源组织为分层集合。这些独立的集合提高了FPGA的多粒度共享灵活性。板级共享、模级共享和PRR级共享都基于FPGA资源的分区方式。对于细粒度的FPGA共享,芯片级共享依赖于堆叠芯片的分区,而PRR共享则基于更精细的芯片内部资源组织。

2.软件支持

学术界和工业界都有大量的论文研究了多租户场景下FPGA共享的软件支持,为了支持FPGA共享,研究人员设计了基于云的FPGA系统,以实现高效的资源管理和硬件抽象。如表3所示,现有技术在性能隔离、任务迁移、软件抽象、资源虚拟化、资源管理、任务调度和开发工具方面贡献了软件支持的智慧。

表3 软件支持FPGA共享,按设备的目标分区分类

3.安全保障

安全是多租户场景下FPGA共享的优先级问题。由于潜在的威胁,CSPs和用户将遭受损失。FPGA的共享不仅涉及传统的硬件和软件问题,而且安全保障也十分重要。常见的威胁包括网络攻击、硬件攻击、软件攻击和资产泄露。如表2所示,处理这些威胁的相应方法包括但不限于工作负载隔离、位流保护、电源控制和配置刷新。此外,安全问题因共享粒度而异。

单板级共享主要涉及配置保护,FPGA板是共用的,占用了轮换的硬件,应清空FPGA的配置内存,以避免鬼影电路。对于细粒度共享,需要认真处理FPGA的管理,共同执行任务面临着严重的威胁。作为对策,需要有效的功率控制和功能隔离。

05 FPGA共享成本

对成本相关工作进行分类,总结成本问题的参数。如表4所示,将加工分为几个阶段,并总结了相关成本。过程分为准备、执行和释放三个处理阶段,每个阶段都有自己的成本。成本问题是云计算研究的一个开放领域,FPGA共享从上述几个方面影响成本。

FPGA共享成本可以根据处理阶段进行分类,包括准备成本、执行成本和后期成本(如发布成本)。量化的差异可以在这些FPGA共享相关的收费中看到,货币成本可以量化为以支出资本形式存在的某些成本。另一种表现为间接费用和消耗,它们的计量与时间和职业的长短有关。FPGA空闲时间、能源消耗、安全维护和性能开销都包含在这些费用中,这些成本虽然不是直接的商业费用,但根据持续时间和消耗情况,可以转化为统一的货币成本形式。

表4 FPGA共享的成本,按执行阶段、成本类型和量化分类

06 主要贡献

1.本文研究了面向资源的FPGA共享的相关工作。讨论了共享资源的相关概念,并给出了基于层次组织的分类方法。

2.本文根据FPGA共享支持情况对研究工作进行分类,包括硬件支持、软件支持和安全保障,并描述了主要的系统优化解决方案。

3.本文提出了一种基于共享的FPGA系统的初步成本研究,根据归因和加工阶段,对这些相关费用进行分类。

07 与其他相关研究对比

现有的关于提高云FPGA效率的研究虽然很多,但缺乏对FPGA共享这一重要主题的充分讨论。多租户场景中的FPGA共享对于FPGA在云环境中的广泛应用至关重要,这些工作主要集中在云FPGA的特定优化角度。

而本文对FPGA共享工作进行了全面的综述,并从不同的方面研究现有技术,并就几个关键主题概括相关建议。首先,讨论了FPGA资源共享方面的代表性论文,根据FPGA资源的组织对相关工作进行分类。然后,总结了支持FPGA共享的重要软件和硬件技术。重要的是,本文进一步分析了FPGA共享的系统设计成本,总结了相关的设计成本,并根据来源和加工阶段进行了分类。

解读:戴西件 南昌大学第二附属医院

审核:张 琨 合肥工业大学


Frontiers of Computer Science


Frontiers of Computer Science (FCS)是由教育部主管、高等教育出版社和北京航空航天大学共同主办、SpringerNature 公司海外发行的英文学术期刊。本刊于 2007 年创刊,双月刊,全球发行。主要刊登计算机科学领域具有创新性的综述论文、研究论文等。本刊主编为周志华教授,共同主编为熊璋教授。编委会及青年 AE 团队由国内外知名学者及优秀青年学者组成。本刊被 SCI、Ei、DBLP、INSPEC、SCOPUS 和中国科学引文数据库(CSCD)核心库等收录,为 CCF 推荐期刊;两次入选“中国科技期刊国际影响力提升计划”;入选“第4届中国国际化精品科技期刊”;入选“中国科技期刊卓越行动计划项目”。


《前沿》系列英文学术期刊

由教育部主管、高等教育出版社主办的《前沿》(Frontiers)系列英文学术期刊,于2006年正式创刊,以网络版和印刷版向全球发行。系列期刊包括基础科学、生命科学、工程技术和人文社会科学四个主题,是我国覆盖学科最广泛的英文学术期刊群,其中12种被SCI收录,其他也被A&HCI、Ei、MEDLINE或相应学科国际权威检索系统收录,具有一定的国际学术影响力。系列期刊采用在线优先出版方式,保证文章以最快速度发表。

中国学术前沿期刊网

http://journal.hep.com.cn

 
 
 
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
大规模基因研究重绘开花植物的生命之树 彭慧胜院士团队把“充电宝”做成衣服
缓解肠易激综合征  饮食比服药更有效 银河系发现巨大黑洞
>>更多
 
一周新闻排行
 
编辑部推荐博文