1、 P4 3.2 , 内存: 2 G, 硬盘: 80G , 网卡:千兆网卡 (5 千多每台)华为 24 口千兆交换机( 4 千多) 集群软件环境:建一个简单的集群,其实并不难,主要配置 nis , nfs , rsh , mpi 就好了。推荐大家看一本书微机集群组建、优化和管理车静光著,机械工业 出版社。我的集群,采用 suse9.3 ,操作系统其实也很重要,这次试了很多操作 系统, redhat9 , rhas4 无法识别网卡, rocks 无法安装, 如果硬件没有什么问题, 建议大家可以试下 rocks cluster 这个集群系统, rocks 集操作系统和集群于一 体,安装完成并行环境就
2、已经建立,而且还配备了 pbs 管理软件,非常简单,容 易上手,只是我的硬件不太兼容, 本来是想装 rocks 的,无奈,只有自己动手了。Suse配置nis , nfs非常简单,因为suse强大的yast,就像window 一样方便, 只要鼠标轻点几下就 ok。1Linux 系统的安装, suse 安装也非常简单,在此不想详细讲太多,主要是在 分区的时候要注意, 最要自己手动分区, 对于服务器来说, 最好能分一个独立的 分区/home,因为节点机器要通过nfs共享服务器的/home。注意的是一下几个软 件包一定要安装 nfs ( nfs utils ), nis ( ypbind ), rsh
3、 ( rsh server )。 2基本的网络配置(通过 yast 的网卡配置)服务器的: 192.168.1.253 hostname : node0 域名: node0.cluster 节点机器: 192.168.1 192.168.1.10 hostname : node1node10 域名: node*.cluser掩码: 255.255.255.03.服务器的配置3.1Nfs 设置NFS(NetWork File System)是一种使用比较多的网络文件系统,它以它的安装 容易,使用方便得到很多Linux爱好者的使用。在使用NFS时,我们把需要共享 的分区或者文件按照一定的规范共享出
4、去,想使用这个资源的机器使用 mount 命令把共享的资源加载到自己的系统上, 然后就可以像使用自己的本地文件系统 一样方便。进入图形 yast network nfs server ,之后开始配置, 点击 add directory : 之后设置两个共享目录, /home,/usr/local/ ,然后加入共享这两个目录的主机 通配符 192.168.1.0/255.255.255.0 rw,root_squash, sync 。其实配置 nfs 就 是修改 /etc/exports 文件,你也可以直接修改成/home/ 192.168.1.1/255.255.255.0(rw,root_s
5、quash,sync)/usr/local 192.168.1.1/255.255.255.0(rw,root_squash,sync)Ok, NFS就这样配置好了。3.2NIS的配置NIS(Network In formation Service) 是实现网络上各Linux机器之间的重要数据分享。这些数据包括用户帐号,密码,组文件,主机文件,等等。在集群 中我们要做到单一的镜象就需要 NIS的一些服务。比如我们不需要在每个节点上建立各自的用户,而是在 master上建立一个用户以后,就同时在其它的节点上 能够访问到这个用户。下面是我的配置过程:Yast network nis server
6、create nis master server 之后填入 nis domainname就是域名,我们填nodeO.CIuster,之后一些信息一般选默认就可以了, 之后要配置hosts :netmask: 255.255.255.255 network : 127.0.0.1 255.255.0.0 network : 192.168.0.0ok,之后完成,进入/var/yp目录,执行make就最后完成nis的配置。注意的是 如果你新建用户了,要注意执行 make命令更新nis信息。最后启动网络服务 yast network-start service 进入设置,开启shell ,login
7、 两项服务。3.3rsh 的配置注意修改这两个文件/etc/hosts /etc/hosts.equiv 所建立用户的.rhosts,这个文件和/hosts.equiv 文件内容设置相同。Hosts的文件信息,最后修改成:127.0.0.1 localhost192.168.1.253 node0.cluster node0192.168.1.1 node1.cluster node1192.168.1.10 n ode10.cluster node10Hosts.equiv:Node0Node1Node10把所有节点的信息输入到这两个文件, 等节点机器的配置好后,你就可以用命令rlog in
8、 node*,登陆节点机器,这样就可以对节点机器进行操作了。节点机器的配置配置nis,nfs的情况基本和服务器类似,只是进入 yast的时候选择的是nis 客户端,和nfs客户端即可,这里不再详细说明。之后启动rsh服务,启动过程, 编辑 /etc/xi netd.d/rsh 将其中内容“ disable = yes” 改成“ disable = no”,重新 restart xinetd ,激活 rsh #chkconfig level 345 rsh on#/etc/rc.d/xinetd restart, 这样就配置好 rsh 了,Lam- mpi的编译安装使用。(1) 到lam mpi
9、官方网站www.lam-mpi.org下载最新的源代码,注意不要下载 rpm格式的,要自己编译tar.gz格式的(2)用“ tar zxvf lam - 7.1.1.tar.gz ”解压(3)进入该目录配置编译信息(后面编译vasp中的makefile有)./con figure prefix =/usr/local/lam-7.1 .1 with CFLAGS= O withfc=ifort with f77flags= O without romio几点说明,前面是配置 lammpi 的安装路径 /usr/local/lam-7.1.1, 指定的编译 器是 intel 的 fortran
10、编译器 ifort(4)然后执行make进行编译,最后执行 make in stall安装,ok成功安装lam mpi之后最好把 /usr/local/lam-7.1.1/bin 加入到搜索路径中,具体做法 vi 编辑 /etc/profile 找到#make path more comfortableif test ,then PATH=/usr/local/bin:/usr/bin:/usr/X11R6/bin:/usr/local/lam-7.1.1/binOk, 这样就设置好路径了, 注意的是服务器和节点机器都要设置, 因为我们是通 过nfs共享lam。之后新建一个文件,lamhost
11、s,输入nodeO,执行lamboot lamhosts如果显示有 lam 的相关信息,那说明安装成功。之后顺便说一下 lam 的使用的几个命令,注意执行 lam 不能在 root 下操作1 )新建一个文件,说明要使用并行计算的几个机器, vi lamhosts 加入你要计算的机器,比如 nodeO node1 node2 , 每个机器一行2)lamboot v lamhosts 启动 lam mpi3)mpirun np * program * 为你运行机器的台数, progran 为并行程序, 在 vasp 中我就直接运行 mpirun np 1O vasp4)运行结束,记得 wipe v
12、 lamhosts 释放机器,否则节点机器无法关机,我 经常忘记执行这个命令,导致关机的时候无法正常关机 . 。lfc8.0 并行vasp的编译(参考了本论坛的转帖VASP程序的编译(valenhou) 感觉 vasp 安装不同操作系统不同的版本情况有很大不一样,在 suse 中并行 vasp4.6 我编译不成功,并行 vasp4.5 成功,串行 4.6 也成功,在 rhas4.0 中串 行 vasp4.6 无法成功编译, vasp4.5 则没有问题,大家如果编译不成功的话,可 以试试不同版本。下面讲讲我的并行编译。首先要安装好 fortran 的编译器 ifc 这个不详细讲了,重要是要配置好
13、路径,节点机器也是同样问题, ifc 可以通过 nfs 共享,节点机器只要设置好路径就好了。1下载数学库 libgoto ,我的是 intel 平台我下 libgoto_prescott32p-r1.00.so , 之后我把他放在 vasp 上一级目录 /usr/local/lib 中2解压 vasp.4.5.tar.gz 和 vasp.4.lib.tar.gz ,注意把 vasp 安装在 usr/local的共享目录中Tar zxvf vasp.4.5.tar.gz tar zxvf vasp.4.lib.tar.gz3.cd vasp.4.libcp makefile.linux_ifc_
14、P4 makefilevi makefile 把当中的编译命令 ifc 改为 ifort ,在 8.0 中的命令是 ifort 不是 ifc之后执行make命令得到libdmy.a 。4.cd vasp.4.5vi makefile 把前面第50行的FC=IFC部分用#注释掉,第80 82的cpp部分也注释掉之后就是 136 行 bias = /usr/local/lib/libgoto_prescott32p-r1.00.so-IsvmlLAPAC用 139行 vasp 自带的 lapack ,把第166行和167行有关FFT3D的行前加上注释号,如下面的#FFT3D = fft3dfurth.o fft3dlib.o#FFT3D = fftw3d.o fft3dlib.o /opt/libs/fftw-3.0.1/lib/libfftw3.a之后把202, 203行mpi部分fc = mpif77的#去掉把212行有关CPP的行前的注释号去掉把226和227行有关SCAB行,加上注释号把239和243行有关FFT3D的行,改成如下的内容:#FFT: fftmpi.o with fft3dlib of Juerge n FurthmuellerFFT3D = fftmpi.o fft
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1