Tags:
create new tag
view all tags
-- KanBowen - 2011-08-05

测试报告

测试人:石京燕,阚博文

测试时间:2011-7-17----2011-7-24

测试一

测试目的:作业是否跑到其他资源

测试用例:

Torque版本

Maui版本

Mom版本

作业是否跑到其他资源

备注

测试一

2.5.2_v+

3.3

2.5.2_v+

V+:黄秋兰提供AFS支持版本

测试二

2.5.2_v+

3.2.6-patch21

2.5.2_v+

测试三

2.3.13

3.2.6-patch21

2.3.13

测试四

2.4.1

3.2.6-patch21

2.4.1

测试五

2.5.2

3.2.6-patch21

2.5.2_v+

测试六

2.5.2_v+

3.2.6-patch21

2.5.2

测试七

2.5.2

3.2.6-patch21

2.5.2

测试八

2.5.5

3.2.6-patch21

2.5.5

测试结果:

最终版本:torque_2.5.5+mom_2.5.5+maui_3.2.6-patch21

测试二

测试目的:两个pbs版本性能方面的对比

测试环境:

服务器(老)Torqsrv:版本:2.4.1;maui:2.3.6

服务器(新)Pbssrv:版本:2.5.5;maui:2.3.6

共提交作业:9515

队列数目:31

提交作业类型:BOSS模拟作业,根据机器硬件不同每个作业运行时间为半小时至一小时之间不等

测试结果:

作业总数

失败

失败率

调度时间

失败节点

错误状态

备注

Torqsrv

9515

81

0.85%

94min2s

(shortq)Bws0296-bws0299,(gpuq1)gpu104,gpu105,(argolq)yws041

143,265,134

最多运行4749个作业

Pbssrv

9515

2

0.21%

113min45s

(Cmsq)cws029,(dp64q)bws0328

143,107

最多运行4758个作业

调度时间:从第一个作业开始排队(Q)的时间至最后一个排队作业变为运行状态的时间长度

测试三

同测试二,使用test sleep作业。作业出现很多hold的现象, (这句话很可耐!)

由于maui的配置文件对部分队列限制了最大作业数目,导致测试数字不准确,另外,现存jobid,在torqsrv中有15000个作业,但是在pbssrv中,只存了5001个jobid(因为由于作业调度太慢,没有时间全部完成,提前将作业删除)。所以无法比较。

测试四

关于计算节点的设置:

1、经过测试,在计算节点设置ulimit以及limit,每个用户所提交的作业所用内存不得超过3G,登录节点2G

2、设置prologue,限制计算节点pbs作业内存

具体设置方法可参见: http://twiki.ihep.ac.cn/twiki/view/PBS/Ulimit

测试五

待测试:

1、作业requeue问题

2、双机热备

Topic attachments
I Attachment History Action Size Date Who CommentSorted ascending
Microsoft Word filedocx PBS测试报告_v1.0.docx r1 manage 16.6 K 2011-08-05 - 00:40 KanBowen  
Topic revision: r1 - 2011-08-05 - KanBowen
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2019 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback