超算招新题目文档

参赛者：姜澜提交时间：2025年10月14日邮箱：jianglan23@nudt.gfkd.cn Gitlink 仓库地址：Huster/超算招新题目 | GitLink

第一题：Linux环境搭建

高性能计算依赖于稳定可控的运行环境。本任务旨在搭建一个可用于后续HPC实验的Rocky Linux平台。

通过运行HPCG基准测试，评估平台性能，理解HPC软件栈运行机制。

HPCG性能：2.18796 GFLOPS（考虑收敛和优化阶段开销后）
理论峰值性能：166.4GFLOPS
- 计算过程如下，其中N代表核心数，f代表核心时钟频率，n代表每个周期进行的浮点运算数量。我使用的机器CPU为13th Gen Intel(R) Core(TM) i7-13650HX，基础的CPU频率为2.60GHz。 $P_{peak}=N×f×n\\ =2×2.6G×512bit/64bit×2FMA×2M/A\\ =166.4 GFLOPS$
效率：1.32%(为上面两种性能相除)

首先Linpack是国际上流行的用于测试高性能计算机系统浮点性能的benchmark，具体内容是用高斯消元法求解N元一次稠密线性代数方程组的测试，其中包含三种测试：inpack100、Linpack1000和HPL；接着HPCG，即高度共轭梯度基准测试，使用的是更复杂的微分方程计算方式，Linpack更考验超算的处理器理论性能，而HPCG更看重实际性能，对内存系统、网络延迟要求也更高，所以超算测出来的HPCG性能要比Linpack性能低得多。
效率较低可能源于内存带宽，如上图所示Raw Read,Write,Total的数值较低，其次在笔记本能耗模式不同情况下，给CPU供电的电源计划不同，会导致效率出现变化。

DAOS是一种面向HPC和AI训练的高性能分布式对象存储系统。

首先下载DAOS仓库配置

sudo wget -O /etc/yum.repos.d/daos-packages.repo https://packages.daos.io/v2.0/EL8/packages/x86_64/daos_packages.repo

然后安装客户端

sudo dnf install -y daos-server

使用文件模拟NVMe设备；

加载NVMe模拟模块：

sudo modprobe nvme-loop

创建虚拟 NVMe 设备：

sudo dd if=/dev/zero of=/nvme1.img bs=1G count=5 #创建一个5GB的虚拟NVMe设备文件

挂载并使用虚拟磁盘

sudo mkdir -p /mnt/nvme1
sudo mount /dev/loop0 /mnt/nvme1

大语言模型推理对计算和内存要求极高，需通过优化提升效率。

结果非常缓慢

使用 OpenMP 进行多线程并行；

需要在编译阶段通过编译器选项开启 OpenMP 支持，即修改makefile，但在检查makefile后发现已经开启了OpenMP
采用最高指令集（实际发现可以使用avx512f）用来加速，不同指令集支持的单次浮点运算数量不同，直接决定峰值 FLOPS 的计算。
```
CFLAGS += -march=native - # 自动识别并使用当前CPU支持的最高SIMD指令集
```
通过阅读官方的模型卡片发现无需使用所给的model.cpp及相关推理引擎的代码，可以使用huggingface支持的模版推理引擎，并且同时开启cuda进行推理。

我是姜澜，计算机学院大三学员，目前是AIBD专业。我对高性能计算与系统软件有浓厚兴趣，曾在陈娟老师的项目组完成一项省级大创，获得一项编译选项组合优化的专利，有论文撰写的经历（虽然后来没有发表），曾获得美国数学建模国际一等奖。

期待能在超算团队中深入学习，为我国高性能计算事业贡献力量。