Ubuntu20.04下的HPL集群3节点搭建
nanshan 2025-01-06 14:38 11 浏览 0 评论
1.首先安装Ubuntu20.04 amd64,安装过程比较简单,在此不做叙述了。下面出场的就是硬件们了~~~龙芯3C5000来了我也搭!目前只能用下E5 2682 V4了,主频也是2.5G,不过集成了16个核心,支持HT~
2.链接网络,更新系统:
①执行更新
# apt-get update
②安装ssh工具和net工具,方便远程操作及熟悉的ifconfig指令
#apt-get install ssh
# apt-get install net-tools
③安装samba,建立同Windows之间的文件传递
#apt-get install samba samba-common
安装完成后配置samba,步骤如下:
a.新建Ubuntu端共享文件夹
# mkdir –p /home/share
b.修改samba配置文件
# vi /etc/samba/smb.conf
c.在配置文件最后添加:
[node01]
comment = node01 share
path = /home/share #此处为Ubuntu端需要共享的文件夹绝对路径
browseable = yes
writable = yes
available = yes
valid users = node01 #此处为登陆samba的用户,必须在Ubuntu中存在
d.修改共享文件夹权限使得Windows访问后可以读写,#chmod 777 /home/share
e.设置samba访问用户密码,为了方便可以直接设置用户登陆密码:
# smbpasswd -a node01
需要输入2次,输完按一次回车。
root@node01:/home/node01# smbpasswd -a node01
New SMB password:
Retype new SMB password:
Added user node01.
f.重新启动samba服务,# service smbd restart
g.回到Windows端,运行输入:\\192.168.199.200,可以看到文件夹node01,双击输入用户名密码(即之前e步骤所指)
h.然后就可以方便的交互文件了,这是笔者最喜欢的方式,当然是同一网络网段内方便,比ftp好玩。
接下来就是给系统减负,不启动桌面直接进命令行模式。
a.# vi /etc/default/grub
将:GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"
改为:GRUB_CMDLINE_LINUX_DEFAULT="text"
b.# update-grub
c.# systemctl set-default multi-user.target
d.# reboot
至此可以安心开始HPL测试环境的搭建了:
Ⅰ.安装gcc、gfortran、make等必要工具
# apt-get install gcc
# apt-get install g++
# apt-get install gfortran
# apt-get install make
Ⅱ.将hpl-2.3.tar.gz、mpich-3.3.2.tar.gz和OpenBLAS-0.3.17.tar.gz拷贝到samba共享文件夹(本文为/home/share/HPL文件夹下):
a.解压mpich-3.3.2.tar.gz并进入源码文件夹
# tar zxvf mpich-3.3.2.tar.gz
# cd mpich-3.3.2
配置mpich和安装:
# ./configure --prefix=/usr/local/mpich3.3.2
# make
# make install
设置环境变量脚本
# cd /home/share/HPL
# touch env.sh
# vi env.sh
添加如下内容:
export PATH=$PATH:/usr/local/mpich3.3.2/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/mpich3.3.2/lib
# chmod 777 env.sh
b.解压OpenBLAS-0.3.17.tar.gz并进入源码文件夹
# tar zxvf OpenBLAS-0.3.17.tar.gz
# cd OpenBLAS-0.3.17
# make
# make PREFIX=/usr/local/openblas install
c. 解压hpl-2.3.tar.gz并进入源码文件夹
# tar zxvf hpl-2.3.tar.gz
# cd hpl-2.3
接下来配置Makefile文件,在setup文件夹下有很多模板,此处使用Make.Linux_PII_FBLAS
# cp setup/Make.Linux_PII_FBLAS .
# mv Make.Linux_PII_FBLAS Make.E5x2
上门的E5x2就是这个Make的体系结构名称,后续需要用到,因为我的主板是双路E5,名称随意取即可
修改:
ARCH = E5x2
TOPdir = /home/share/HPL/hpl-2.3
MPdir = /usr/local/mpich3.3.2
MPlib = $(MPdir)/lib/libmpi.so
LAlib = $(LAdir)/lib/libopenblas.a
CC = /usr/local/mpich3.3.2/bin/mpicc
CCFLAGS = $(HPL_DEFS) -pthread -fomit-frame-pointer -fomit-frame-pointer -O3 -funroll-loops -W -Wall
LINKER = /usr/local/mpich3.3.2/bin/mpif77
保存后关闭,开始编译
# make arch=E5x2
完成后会在顶层目录下生成bin文件夹
# cd /home/share/HPL/hpl-2.3/bin/E5x2
里面有2个文件,分别是:HPL.dat和xhpl,前一个是配置测试用的参数,通常调参数就是指的改它内容。接下来测试运行:
# mpirun -np 4 ./xhpl
其中4表示使用4个进程运行,建议和cpu的物理核心数量一致(注意区分是否开启了HT,满载测试HT会减低效率)
另外推荐一个HPL建议网站:http://hpl-calculator.sourceforge.net/
多节点MPICH-HPL测试
上面讲述了单节点的配置和运行测试,一般使用环境都是多节点并行集群计算形式,因此多节点测试十分必要,也很有意思。
a.首先需要配置ssh无密码互访,建立节点间的网络传递
# ssh-keygen -t rsa
Generating public/private rsa key pair.
Enter file in which to save the key (/root/.ssh/id_rsa): Created directory '/root/.ssh'.
Enter passphrase (empty for no passphrase):
Enter same passphrase again:
Your identification has been saved in /root/.ssh/id_rsa
Your public key has been saved in /root/.ssh/id_rsa.pub
The key fingerprint is:
SHA256:nszzwk6rQGp6How2xkbK8mYwZUpoM6eYqNVNg8tWA9w root@node01
The key's randomart image is:
+---[RSA 3072]----+
| . . |
| o E |
|. o |
|.=o.. = |
|=*=o.= oS |
|%+.o= .+ . |
|=@=.. .B |
|*+=. . .o+ |
|.=o .oo.. |
+----[SHA256]-----+
然后分别在3台机器上运行该命令生产公钥
# cd ~/.ssh
# touch authorized_keys
在三台机器上分别添加另外2台机器信息
# vi /etc/hosts
笔者设置的内容如下:
root@node01:~/.ssh# cat /etc/hosts
127.0.0.1 localhost
#127.0.1.1 node01 #需要注释掉
192.168.199.204 node03
192.168.199.203 node02
192.168.199.205 node01
# The following lines are desirable for IPv6 capable hosts
::1 ip6-localhost ip6-loopback
fe00::0 ip6-localnet
ff00::0 ip6-mcastprefix
ff02::1 ip6-allnodes
ff02::2 ip6-allrouters
测试node01同node02、node03连通性(其余同理),正常机器会把名称替换为IP,ping通即可
# ping node02
# ping node03
在node01-node03上运行
# cat id_rsa.pub >> authorized_keys
最偷懒的方法就是通过putty复制各自的公钥到所有节点:
node02→node01
node03→node01
最后将node01的公钥(包含node01 node02 node03的公钥)完整复制到其他2台节点上。
然后第一次ssh nodeXX需要输入yes,往后就不用密码直接、互相ssh登录任意node了。
b.然后开始通过ssh复制需要运行的hpl测试程序到所有node
首先在node02和node03上面建立相同的文件夹(本文是在node01上面编译安装mpich、openblas和hpl的)
# mkdir -p /home/share/HPL
# chmod 777 /home/share/HPL (权限设置,否则scp拷贝容易失败)
拷贝hpl到node02(node03同理,IP、文件夹路径根据实际情况修改)
# scp -r hpl-2.3 node02:/home/share/HPL
同理,mpich和openblas编译好的拷贝至/usr/local
# scp -r /usr/local/openblas node02:/usr/local
# scp -r /usr/local/mpich3.3.2 node02:/usr/local
c.建立mpich环境脚本
export PATH=$PATH:/usr/local/mpich3.3.2/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/mpich3.3.2/lib
保存为:env.sh,同样拷贝到每个节点,然后在个节点# source env.sh一下即可,各节点就可以使用mpirun、mpicc等工具了。
d.建立并行主机核心分配文件
node01:32
node02:32
node03:32
保存为:servers,下一步给mpirun –f使用,表示每个节点node提供32个计算核心,当然可以每个4核心,看实际情况,本文用了2路E5 2682 V4因此每个节点共计32个核心,每个节点共计32GB DDR4 ECC内存,3节点一共96核心。共计128GB内存!够用了够用了。[憨笑]
接下来就可以正式运行测试!
# mpirun -np 96 -f /home/share/HPL/servers ./xhpl
然后就进入漫长的计算了~~~通过修改HPL.dat文件参数提升成绩。3个节点96个核心都在100%负荷运行了~~~
相关推荐
- Let’s Encrypt免费搭建HTTPS网站
-
HTTPS(全称:HyperTextTransferProtocoloverSecureSocketLayer),是以安全为目标的HTTP通道,简单讲是HTTP的安全版。即HTTP下加入...
- 使用Nginx配置TCP负载均衡(nginx tcp负载)
-
假设Kubernetes集群已经配置好,我们将基于CentOS为Nginx创建一个虚拟机。以下是实验种设置的详细信息:Nginx(CenOS8Minimal)-192.168.1.50Kube...
- Nginx负载均衡及支持HTTPS与申请免费SSL证书
-
背景有两台minio文件服务器已做好集群配置,一台是192.168.56.41:9000;另一台是192.168.56.42:9000。应用程序通过Nginx负载均衡调用这两台minio服务,减轻单点...
- HTTPS配置实战(https配置文件)
-
原因现在网站使用HTTPS是规范操作之一,前些日子买了腾讯云服务,同时申请了域名http://www.asap2me.top/,目前该域名只支持HTTP,想升级为HTTPS。关于HTTPS的链接过程大...
- 只有IP地址没有域名实现HTTPS访问方法
-
一般来说,要实现HTTPS,得有个注册好的域名才行。但有时候呢,咱只有服务器的IP地址,没注册域名,这种特殊情况下,也能照样实现HTTPS安全访问,按下面这些步骤来就行:第一步,先确认公网...
- 超详解:HTTPS及配置Django+HTTPS开发环境
-
众所周知HTTP协议是以TCP协议为基石诞生的一个用于传输Web内容的一个网络协议,在“网络分层模型”中属于“应用层协议”的一种。在这里我们并不研究该协议标准本身,而是从安全角度去探究使用该协议传输数...
- Godaddy购买SSL之后Nginx配置流程以及各种错误的解决
-
完整流程:参考地址:https://sg.godaddy.com/zh/help/nginx-generate-csrs-certificate-signing-requests-3601生成NGI...
- Nginx从安装到高可用,一篇搞定(nginx安装与配置详解)
-
一、Nginx安装1、去官网http://nginx.org/下载对应的nginx包,推荐使用稳定版本2、上传nginx到linux系统3、安装依赖环境(1)安装gcc环境yuminstallgc...
- 阿里云免费证书申请,配置安装,使用tomcat,支持http/https访问
-
参数说明商品类型默认已选择云盾证书服务(无需修改)。云盾证书服务类型SSL证书服务的类型。默认已选择云盾SSL证书(无需修改),表示付费版SSL证书。如果您需要免费领取或付费扩容DV单域名证书【免费试...
- 你试过两步实现Nginx的规范配置吗?极速生成Nginx配置小工具
-
NGINX是一款轻量级的Web服务器,最强大的功能之一是能够有效地提供HTML和媒体文件等静态内容。NGINX使用异步事件驱动模型,在负载下提供可预测的性能。是当下最受欢迎的高性能的Web...
- 从零开始搭建HTTPS服务(搭建https网站)
-
搭建HTTPS服务的最初目的是为了开发微信小程序,因为wx.request只允许发起HTTPS请求,并且还必须和指定的域名进行网络通信。要从零开始搭建一个HTTPS的服务需要下面4...
- 群晖NAS使用官网域名和自己的域名配置SSL实现HTTPS访问
-
安全第一步,群晖NAS使用官网域名和自己的域名配置SSL实现HTTPS访问【新手导向】NAS本质还是一个可以随时随地访问的个人数据存储中心,我们在外网访问的时候,特别是在公网IP下,其实会面临着很多安...
- 让网站快速升级HTTPS协议提高安全性
-
为什么用HTTPS网络安全越来越受到重视,很多互联网服务网站,都已经升级改造为https协议。https协议下数据包是ssl/tcl加密的,而http包是明文传输。如果请求一旦被拦截,数据就会泄露产生...
- 用Https方式访问Harbor-1.9版本(https访问流程)
-
我上周在头条号写过一篇原创文章《Docker-Harbor&Docker-kitematic史上最详细双系统配置手册》,这篇算是它的姊妹篇吧。这篇文章也将用到我在头条写的另一篇原创文章的...
- 如何启用 HTTPS 并配置免费的 SSL 证书
-
在Linux服务器上启用HTTPS并配置免费的SSL证书(以Let'sEncrypt为例)可以通过以下步骤完成:---###**一、准备工作**1.**确保域名已解析**...
你 发表评论:
欢迎- 一周热门
-
-
极空间如何无损移机,新Z4 Pro又有哪些升级?极空间Z4 Pro深度体验
-
如何在安装前及安装后修改黑群晖的Mac地址和Sn系列号
-
爱折腾的特斯拉车主必看!手把手教你TESLAMATE的备份和恢复
-
10个免费文件中转服务站,分享文件简单方便,你知道几个?
-
[常用工具] OpenCV_contrib库在windows下编译使用指南
-
日本海上自卫队的军衔制度(日本海上自卫队的军衔制度是什么)
-
【系统配置】信创终端挂载NAS共享全攻略:一步到位!
-
Ubuntu系统Daphne + Nginx + supervisor部署Django项目
-
WindowsServer2022|配置NTP服务器的命令
-
UOS服务器操作系统防火墙设置(uos20关闭防火墙)
-
- 最近发表
- 标签列表
-
- linux 查询端口号 (58)
- docker映射容器目录到宿主机 (66)
- 杀端口 (60)
- yum更换阿里源 (62)
- internet explorer 增强的安全配置已启用 (65)
- linux自动挂载 (56)
- 禁用selinux (55)
- sysv-rc-conf (69)
- ubuntu防火墙状态查看 (64)
- windows server 2022激活密钥 (56)
- 无法与服务器建立安全连接是什么意思 (74)
- 443/80端口被占用怎么解决 (56)
- ping无法访问目标主机怎么解决 (58)
- fdatasync (59)
- 405 not allowed (56)
- 免备案虚拟主机zxhost (55)
- linux根据pid查看进程 (60)
- dhcp工具 (62)
- mysql 1045 (57)
- 宝塔远程工具 (56)
- ssh服务器拒绝了密码 请再试一次 (56)
- ubuntu卸载docker (56)
- linux查看nginx状态 (63)
- tomcat 乱码 (76)
- 2008r2激活序列号 (65)