个人信息:Personal Information
副教授 博士生导师 研究生导师
主要任职:CCF高性能计算专委会委员
性别:男
毕业院校:西安电子科技大学
学历:博士研究生毕业
学位:博士学位
在职信息:在岗
所在单位:人工智能学院
学科:计算机科学与技术
办公地点:西安电子科技大学网安大楼CII 1008
联系方式:陕西省西安市西沣路兴隆段266号
电子邮箱:
基于ARM架构的高性能计算
发布时间:2022-01-27 点击次数:
随着全球芯片设计能力的提升和软件生态的日益完善,原先聚焦于嵌入式系统的ARM架构,逐渐在高性能计算领域展露身手,比如日本富士通基于定制的ARM A64FX处理器研发的“富岳”超算系统,其计算能力高居世界500强计算机第一名。国内外知名公司也纷纷推出了基于ARM架构的处理器:比如Amazon的 Graviton系列、Ampere公司的 Altra、Marvell公司的ThunderX系列、阿里倚天710和华为鲲鹏系列等,其中华为鲲鹏系列处理器目前在国内的应用最广。
各公司推出的最高性能ARM处理器,均配置了较多的核数,比如 “富岳”超算系统采用 48 核芯片 A64FX和华为鲲鹏920系列配置的64核。要使基于ARM架构的服务器发挥出全部的计算能力,需要充分利用所有的计算核心,这对算法的并行化能力提出了很高的要求。为此,基于ARM架构研发高性能计算课程体系,必将对ARM架构的普及、推广和应用产生大的影响。
Ⅰ理论部分
第1章 概述 (2学时)
高性能计算的意义,国内外研究进展;能够解决的科学和工程问题。
第2章 高性能计算平台 (2学时)
ARM并行计算体系结构介绍。
第3章 并行程序设计模型与性能评价(2学时)
并行程序设计方法PCAM,Amdahl定律,Gustafson定律,加速比等。
第4章 基于消息传递编程(MPI)的并行程序开发 (2学时)
MPI并行程序设计开发,点对点通信,阻塞和非阻塞通信,聚合通信。
第5章 循环并行化(2学时)
Parfor,并行化开销,嵌套训练的并行化。
第6章 GPU 计算 (2学时)
GPU软硬件架构
第7章 ARM与AI计算 (2学时)
AI框架;ARM平台上深度学习算法与高性能计算。
Ⅱ实验部分
实验 |
教学内容及要求 |
课时 |
1 |
熟悉ARM高性能计算机运行环境 |
2 |
2 |
OpenMP并行性能测试练习 |
2 |
3 |
消息传递编程的通信方式 |
2 |
4 |
ARM与AI计算 |
3 |
5 |
GPU |
2 |
6 |
Project | 5 |
ARM高性能计算资料
1、ARM服务器介绍,https://e.huawei.com/cn/products/servers/taishan-server
2、鲲鹏技术开发,https://support.huaweicloud.com/kunpengdevps/kunpengdevps.html
3、HPC,https://www.hikunpeng.com/developer/boostkit/hpc
4、ARM HPC,https://www.arm.com/solutions/infrastructure/high-performance-computing
5、昇腾AI芯片,https://e.huawei.com/cn/products/servers/ascend
6、D. Yokoyama, B. Schulze, F. Borges, and G. Mc Evoy.The survey on arm processors for hpc, The Journal of Supercomputing,2019,75:1–34
7、数据结构与算法(西安电子科技大学出版社 2019,ISBN:978-7-5606-5487-4),第10章 并行数据结构及应用