朱虎明

个人信息:Personal Information

副教授 博士生导师 研究生导师

主要任职:CCF高性能计算专委会委员

性别:男

毕业院校:西安电子科技大学

学历:博士研究生毕业

学位:博士学位

在职信息:在岗

所在单位:人工智能学院

学科:计算机科学与技术

办公地点:西安电子科技大学网安大楼CII  1008

联系方式:陕西省西安市西沣路兴隆段266号

电子邮箱:

扫描关注

教师博客

当前位置: 中文主页 >> 教师博客

基于ARM架构的高性能计算

发布时间:2022-01-27   点击次数:

       

       随着全球芯片设计能力的提升和软件生态的日益完善,原先聚焦于嵌入式系统的ARM架构,逐渐在高性能计算领域展露身手,比如日本富士通基于定制的ARM A64FX处理器研发的“富岳”超算系统,其计算能力高居世界500强计算机第一名。国内外知名公司也纷纷推出了基于ARM架构的处理器:比如Amazon的 Graviton系列、Ampere公司的 Altra、Marvell公司的ThunderX系列、阿里倚天710和华为鲲鹏系列等,其中华为鲲鹏系列处理器目前在国内的应用最广。

  各公司推出的最高性能ARM处理器,均配置了较多的核数,比如 “富岳”超算系统采用 48 核芯片 A64FX和华为鲲鹏920系列配置的64核。要使基于ARM架构的服务器发挥出全部的计算能力,需要充分利用所有的计算核心,这对算法的并行化能力提出了很高的要求。为此,基于ARM架构研发高性能计算课程体系,必将对ARM架构的普及、推广和应用产生大的影响。

Ⅰ理论部分


    第1章  概述 (2学时)

          高性能计算的意义,国内外研究进展;能够解决的科学和工程问题。

    第2章  高性能计算平台 (2学时)

          ARM并行计算体系结构介绍。

    第3章  并行程序设计模型与性能评价(2学时)

          并行程序设计方法PCAM,Amdahl定律,Gustafson定律,加速比等。

    第4章  基于消息传递编程(MPI)的并行程序开发 (2学时)

          MPI并行程序设计开发,点对点通信,阻塞和非阻塞通信,聚合通信。

    第5章  循环并行化(2学时)

              Parfor,并行化开销,嵌套训练的并行化。

    第6章  GPU 计算 (2学时)

             GPU软硬件架构

    第7章  ARM与AI计算  (2学时)

               AI框架ARM平台上深度学习算法与高性能计算。

Ⅱ实验部分

实验

教学内容及要求

课时

1

熟悉ARM高性能计算机运行环境

2

2

OpenMP并行性能测试练习

2

3

消息传递编程的通信方式

2

4

ARM与AI计算

3

5

GPU

2

6

Project

5


ARM高性能计算资料

1ARM服务器介绍,https://e.huawei.com/cn/products/servers/taishan-server

2、鲲鹏技术开发,https://support.huaweicloud.com/kunpengdevps/kunpengdevps.html

3HPChttps://www.hikunpeng.com/developer/boostkit/hpc

4ARM HPChttps://www.arm.com/solutions/infrastructure/high-performance-computing

5昇腾AI芯片,https://e.huawei.com/cn/products/servers/ascend

6D. Yokoyama, B. Schulze, F. Borges, and G. Mc Evoy.The survey on arm processors for hpc, The Journal of Supercomputing,2019,75:1–34

7数据结构与算法(西安电子科技大学出版社 2019ISBN978-7-5606-5487-4),第10 并行数据结构及应用


Baidu
map