随着计算系统的发展进入多样化算力时代,单个系统上集成的计算设备(e.g. CPU、GPU、FPGA、NPU、DPU)越来越多,同时数据中心内计算节点间的异构(不同节点的主计算设备由不同厂家提供,ISA也可能不同)趋势也在逐步上升。 快速打造异构系统的软件生态及充分挖掘异构系统的算力潜能已经成为计算机系统方向的重要研究课题。6月9日下午,华东师范大学数据科学与工程学院举办“系统优化之异构系统初探”专场,带领同学们对各类异构系统及相关的编程、优化、应用迁移等研究挑战进行了探索。

 

本次报告现场座无虚席,黄波老师在进行了简单的开场介绍后,来自Intel的研发经理汪洋先生、学院系统优化实验室的郭健美老师和博士研究生张义磊同学分别针对单节点异构系统的统一编程模型、异构数据中心的性能优化以及应用程序的跨体系结构迁移三个方面进行了精彩的分享。

1623836389932098909.png


一、《oneAPI: 面向异构计算的统一编程模型》

汪洋先生从单节点异构系统的编程挑战入手,引出了oneAPI这个可用于多种架构和厂商的编程模型。oneAPI包括统一的语言和库,能够在包括 CPU、GPU、FPGA 和 AI 加速器在内的各种硬件上提供本机代码性能。接着汪洋先生对包含Intel® oneAPI DPC++/C++ 编译器、oneAPI 高性能库、英特尔® DPC++ 兼容性工具、分析和调试工具等的英特尔® oneAPI 工具套件进行了详细的介绍。最后,汪洋先生介绍了Intel围绕oneAPI的生态系统建设,包括各类免费资源及相关开源社区,鼓励同学们去Intel® DevCloud上免费试用相关工具,并享受Intel® DevCloud上免费的各类硬件加速资源,体验异构系统带来的性能提升。

1623836498777009942.png 

 


二、《异构数据中心的性能优化》

郭健美老师从一个实际的数据中心建设谈起,让同学们直观地理解了数据中心的建设成本及数据中心性能优化的重要性。更致命的是:互联网各大厂的数据中心利用率普遍偏低(<40%),如何在应用混部的复杂场景下提升数据中心的利用率便成了大厂们都必须应对的一个挑战。郭老师还分享了数据中心内系统性能预测和评估的相关技术,这个对数据中心的未来规划起着至关重要的作用。最后,郭老师通过几个实际案例阐述了资源利用率有效性的计算方法、跟系统架构及微体系架构结合深入理解数据的重要性、以及对数据进行综合全面合理分析的重要性。这些实际案例更进一步说明了异构数据中心性能优化的挑战及重要性。

1623836525793002550.png 

 

 

三、《嵌入式环境下面向ARM架构的可重定向静态二进制翻译器》

张义磊同学从跨体系架构的应用迁移入手,说明了在缺少应用源代码情况下二进制翻译的必要性。张义磊同学接着对动态二进制翻译和静态二进制翻译的特点及优缺点进行了详细的比较,并简单介绍了LLVM以及一个基于LLVM的retargetable静态二进制翻译器框架。以嵌入式环境下从ARM架构到X86架构的静态二进制翻译为例,张义磊同学详细介绍了二进制代码翻译的方法以及如何处理代码发现挑战和代码定位挑战的方法,实验结果也证明了嵌入式环境下静态二进制翻译的可取之处。为结合动态二进制翻译和静态二进制翻译的优点,张义磊同学最后提出先进行静态分析优化并在此基础上再进行动态二进制翻译的建议。

1623836550992000817.png 

 

 

本次沙龙气氛活跃,参与人数众多。同学们在认真聆听报告汲取知识之外,还现场提出了不少高质量的问题,比如在从设备的计算能力和主从设备之间的数据传输开销之间如何权衡、如何在实际生产环境下提升对未来算力预测的准确性等。沙龙结束后同学们还和郭健美老师针对分布式数据库评测的相关挑战及优化技术进行了深入的讨论。从本次沙龙现场的参与度及讨论来看,围绕异构系统相关的软硬件协同优化是多应用学科交叉及跨科研领域融合的重要聚焦点,类似本次沙龙的分享交流有助于促进更多的合作共赢机会。

image.png image.png

 

在整场报告中,同学们了解了广义的异构系统的内涵和外延以及oneAPI这个面向异构计算的统一编程模型,并通过实际的案例深入理解异构数据中心优化的关注点及挑战,同时也初步理解了嵌入式环境下从ARM架构到X86架构的静态二进制代码翻译技术。这些技术及挑战只是异构系统相关众多科研方向的一个缩影,期待同学们更多地关注异构系统的发展,并在不同的应用领域通过系统优化充分发掘异构系统的算力。




来源:华东师范大学数据学院