HPC

HPC

什么是高性能计算?

微星的高性能计算(HPC)系统设计有高速网络,高性能存储,GPU和大量的内存,以支持一些最计算和内存密集型程序发达的今天的。

微星目前有两个主要的高性能计算系统,梅萨比和mangi。梅萨比是分布式集群设有大量与被通过一个非常高速通信网络紧密集成的前缘Intel处理器的节点的马力Linux操作系统。 mangi是一种异质HPE簇设有带前缘AMD是经由高速网络infininband紧密集成的处理器节点。

我可以做什么用HPC?

微星的HPC系统具有高性能存储和许多的易胜博娱乐S软件资源,包括流行的编程语言如Python,R,MATLAB和C编译器直接访问。这种集成创建一个灵活而强大到足以容纳任何需要的计算环境。来自全国各地的大学使用微星的HPC资源管理部门的研究人员每天加速他们的研究。

如何访问的HPC系统?

第一步访问易胜博娱乐的HPC系统是 成为易胜博娱乐的用户从那里微星的HPC系统主要通过终端接口访问我们的许多用户必须运行复杂分析的能力,编写定制的程序。微星还提供了对HPC系统虽然不错,IPython的笔记本电脑和互动MATLAB选项的交互式访问。

 

HPC fairshare调度:PBS /扭矩

注:此fairshare模式适用目前微星调度,PBS /扭矩下。请参阅 ”HPC fairshare调度:SLURM“此页为新的调度下的fairshare调度信息,SLURM,微星是在4季度期间推出,2020年微星系统将逐步迁移到SLURM调度,以及对PBS /转矩调度将完全停产1月6日,2021年见 微星SLURM 有关SLURM过渡页面了解更多信息。

HPC fairshare调度

微星采用了fairshare作业调度,以尽量保证作业的组合从所有用户都可以有效和公平地利用任何给定的HPC资源。 fairshare的目标是增加优先级时,谁是低于其fairshare目标,减少属于这些团体,其使用量超过其fairshare目标作业的优先级组的调度作业。在一般情况下,这意味着,当一个小组最近使用了大量的资源,他们的等待作业的优先级将受到负面影响,直至他们的使用减少到其fairshare目标的一次。

 

每个组的目标fairshare是基于该组已接收到用于当前分配周期总服务单元(SUS)的百分比。例如,如果一个组的fairshare目标为5,则该组可使用的资源的5%。如果经常发生,数天期间,本集团利用给定资源的5%以上,则该组已经超出了他们的fairshare目标上的资源,他们的等待作业的优先级,对资源,将降低。
 
此外,如果一组使用他们的SUS比均匀速率快 - 该组的拨款总额除以分配周期,这是一个日历年的天数 - 该集团的目标fairshare将减少。更新fairshare目标是基于SUS的剩余组和SUS分配给各组的总和的数量。 fairshare目标更新为这样每天的基础上。
 
以帮助小组确定其使用率,命令“acctinfo”指出剩余的分配比例和时间的量,以百分比,剩余的分配周期。该“acctinfo”命令还示出了组的当前fairshare目标以及该组的电流在其上“acctinfo”正在运行的资源的使用情况。该fairshare目标可能会发生变化,从每天,反映了具有在当前分配周期分配组的数量的变化,变更,以从各种基团附加ス请求得到的分配。
 
计算影响一组的作业的优先级的fairshare因素时,调度使用的最后7天集团的具体资源使用的加权平均值。重量的特定日期衰变那天偷偷把过去的用法。当前权重分别是:

加权因子fairshare调度

几天前

0

1

2

3

4

5

6

重量

1.0000

0.8000

0.6400

0.5120

0.4096

0.3277

0.2621

 

 
微星允许将作业150小时(6.25天)运行,因此是很有意义考虑使用过去7天。然而,从7天前使用影响fairshare因素相对较少。
 
调度工作和计算的等待作业的优先级时,有许多因素要考虑,并且fairshare仅仅是其中的一个因素。微星还使用排队时间 - 影响任何给定作业的fairshare - 一个作业已经等待运行的时间。作业等待的时间越长,越觉得排队时间因素将增加作业的优先级。同时,作业的要求walltime,相对于在哪里作业正在等待资源的最大walltime,会影响作业的优先级。这就是所谓的扩展因子(或xfactor)。工作越短,它的膨胀系数越高。
 
此外,调度被配置为首先尝试安排工作,要求大量的资源,然后安排围绕着较大的作业的小作业。职位要求大量资源的需要保留这些资源才能运行,而不能运行,直到有足够的可用资源,以适应这样的工作。这是不希望的,未使用的资源,所以调度器使用较小的作业来填补由大作业的保留意见产生的间隙。这个调度行为被称为“回填”。这是更为有效的回填周围较大的作业的小作业。的挂钟时间对你的工作,尤其是小的工作,准确的估计将有助于调度安排您的工作及时。
 
微星明白,没有人愿意等待。这也是事实,没有调度策略可以保证没有人会等待 - 只不可能大型机器可以保证 - 所以我们使用fairshare尽量保证作业的组合从所有用户都可以高效,公平地利用资源。我们监测队列和经常调整参数,以获得更好的就业机会的周转时间。欢迎你提出任何建议。

 

HPC fairshare调度:SLURM

使用SLURM HPC fairshare调度

易胜博娱乐是易胜博娱乐系统迁移到我们的新fairshare调度,SLURM的过程。微星采用了fairshare作业调度,以尽量保证作业的组合从所有用户都可以有效和公平地利用任何给定的HPC资源。幕后SLURM调度轨道系统的使用情况,并使用这些信息来修改 fairshare优先。 fairshare的目标是增加时,优先调度作业属于那些谁是低于其fairshare目标群体,并减少属于这些团体,其使用量超过其fairshare目标作业的优先级。在一般情况下,这意味着,当一个小组最近使用了大量的资源,他们的等待作业的优先级将受到负面影响,直至他们的使用减少到其fairshare目标的一次。
 
调度工作和计算的等待作业的优先级时,有许多因素要考虑,并且fairshare仅仅是其中的一个因素。微星还使用 排队时间 - 一个作业已经等待运行时间 - 影响任何给定作业的fairshare。作业等待的时间越长,越觉得排队时间因素将增加作业的优先级。同时,作业的 请walltime相对于在哪里作业正在等待资源的最大walltime,会影响作业的优先级。 

fairshare优先击穿

以帮助小组确定哪些是影响他们工作的优先级,命令 sprio -u $ USER 给人的决定优先级的三个主要因素的细目。使用sprio -u $ user命令将显示 年龄, jobsizefairshare组件 被用来计算作业优先级。这三个部件的说明中可以被分解如下:
  • 年龄组分 - 优先的这一部分将增加在队列中的作业等待。每组的,将在给定时间获得年龄优先级作业的数量有限。较长的工作等待队列,高优先级的将被赋予由于这个年龄段的组成部分。
  • jobsize组件 - 优先的这个组件是基于请求的资源的数量。一个更大的工作将获得更高的优先级。 
  • fairshare组件  - 在fairshare组件是基于最近的小组成员的使用进行调整。 fairshare用法是正比于由该组使用的资源。 CPU,存储器和GPU资源被单独跟踪,并具有用于fairshare不同的权重。例如;上的V100 GPU单个小时计数相同88的CPU·小时或602 GB·小时的存储器。为每个作业资源由作业的时间相加,并成倍增加。随着时间的推移优先衰减的影响,所以最近完成的工作比上周完成的作业优先级的影响更大。
 
附加地,调度器SLURM是 配置为首先尝试调度作业请求大量资源,然后安排围绕着较大的作业的小作业。职位要求大量资源的需要保留这些资源才能运行,而不能运行,直到有足够的可用资源,以适应这样的工作。这是不希望的,未使用的资源,所以调度器使用较小的作业来填补由大作业的保留意见产生的间隙。这个调度行为被称为“回填”。这是更为有效的回填周围较大的作业的小作业。的挂钟时间对你的工作,尤其是小的工作,准确的估计将有助于调度安排您的工作及时。
 
微星明白,没有人愿意等待。这也是事实,没有调度策略可以保证没有人会等待 - 只不可能大型机器可以保证 - 所以我们使用fairshare尽量保证作业的组合从所有用户都可以高效,公平地利用资源。我们监测队列和经常调整参数,以获得更好的就业机会的周转时间。欢迎你提出任何建议。
 

在梅萨比计算集群提供的硬件资源运行各种各样的就业机会

photo of mangi hardware
新mangi计算集群扩张微星的硬件资源来运行一个更广泛的就业机会