Tags:
create new tag
view all tags
-- ShiJingyan - 2016-05-26

1. 计算中心总体资源使用率有待提高。以CMS为例,去年资源总利用率为12.69%。计算中心将各实验(含CMS)所有资源并入一个大资源池中统一调度,目标是提高整个集群的资源利用率

2. 为每个实验设定一个专用节点最低下限值,保证各个实验在任何时间都可以使用这些资源,不被其它实验作业占用

3. 为每个实验设定一个最高可用资源上限,保证各个实验的总运行作业量不超过此上限值。一般情况下,上限值大于实验拥有资源量

4. 为每个实验设定一个可共享资源比例。本实验资源空闲时,这部分资源可供其它实验作业运行。本实验作业过多时,也可使用其它实验的共享资源。

5. 所有可共享资源的使用,由HTCondor根据用户作业运行情况自动调节。大致方式为:根据前一时间段内该用户作业量计算当前作业的调度优先级,前段时间运行作业越少的用户当前作业优先级越高。

6. 各个实验的可运行的长作业总数将被限制到一个固定值。

6. 将设定一个专用短作业资源池,只接收所有用户的短作业。

7. 为保证各个实验资源使用的公平性,所有资源的计算能力以标准benchmark "HEPSPEC06"为准。

8 每月(暂定)对各个实验使用的资源情况进行统计,如果超出自己资源使用量,将付费。如果实验资源提供了其它作业运行,可将这部分资源折合成电费或服务费。。具体细则按高能所科研处规定执行。

9. 为用户提供包装过的HTCondor命令,一来可以简化用户提交作业的工作 二来便于以后开发增加新的用户服务功能。 对于特殊用户要求,可以提供condor原始命令使用一段时间,但不宜推广且按原始命令在规定日期后被禁用。

Topic revision: r1 - 2016-05-26 - ShiJingyan
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2019 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback