Tags:
create new tag
view all tags

2016年高温假维护流程

高温假配合机房断电,重启所有服务器并检查业务系统是否正常,然后升级DIRAC并迁移相关子系统。具体时间安排如下:

2016.7.12 在HyperNews 给用户和站点发高温假维护通知

2016.7.29 下午2点开始,按照下面的流程,备份重要数据,并关闭服务,最后关闭服务器电源。

2016.7.30 上午机房停电,下午网络组恢复网络。测试网络环境是否恢复,如恢复可以进入下一步。

2016.7.31 开机并按下面的流程检查服务是否启动,测试系统运作是否正常。如有异常,调试、查找原因并恢复系统运作。

2016.8.1 升级DIRAC服务器至v6r15px版,并测试。

2016.8.2 迁移传输系统、监控系统等自开发的子系统,并做单元测试。

2016.8.3 测试整个系统工作是否正常。如有异常,调试、查找原因并恢复系统运作。

2016.8.4~5 OpenStack, OpenNebula 系统升级

参与人员:张晓梅,赵祥虎,颜田

更多细节请参见附件。

2017年高温假维护流程

高温假配合机房断电,重启所有服务器并检查业务系统是否正常,然后升级DIRAC并迁移相关子系统。具体时间安排如下:

2017.7.21给用户和站点发高温假维护通知

2017.7.28 下午2点开始,按照下面的流程,备份重要数据,并关闭服务,最后关闭服务器电源。

2017.7.29 当日9:00-20:00供电系统维护,网络系统迁移。20:00之后如果供电和网络恢复正常,启动存储系统之外的服务器;等系统组启动Lustre之后,启动存储相关服务器。

2017.7.30 开机并按下面的流程检查服务是否启动,测试系统运作是否正常。如有异常,调试、查找原因并恢复系统运作。

2017.7.31 升级DIRAC服务器至v6r18版,并测试。

2017.8.1 迁移传输系统、监控系统等自开发的子系统,并做单元测试。

2017.8.2 测试整个系统工作是否正常。如有异常,调试、查找原因并恢复系统运作。

2017.8.3~7 OpenStack, OpenNebula 系统升级

参与人员:张晓梅,赵祥虎,颜田

更多细节请参见附件。

-- zhang xiaomei - 2016-07-28

Comments

Edit | Attach | Watch | Print version | History: r3 < r2 < r1 | Backlinks | Raw View | Raw edit | More topic actions
Topic revision: r3 - 2017-07-25 - ZhangXiaomei
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2019 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback