2016年高温假维护流程
高温假配合机房断电,重启所有服务器并检查业务系统是否正常,然后升级DIRAC并迁移相关子系统。具体时间安排如下:
2016.7.12 在HyperNews 给用户和站点发高温假维护通知
2016.7.29 下午2点开始,按照下面的流程,备份重要数据,并关闭服务,最后关闭服务器电源。
2016.7.30 上午机房停电,下午网络组恢复网络。测试网络环境是否恢复,如恢复可以进入下一步。
2016.7.31 开机并按下面的流程检查服务是否启动,测试系统运作是否正常。如有异常,调试、查找原因并恢复系统运作。
2016.8.1 升级DIRAC服务器至v6r15px版,并测试。
2016.8.2 迁移传输系统、监控系统等自开发的子系统,并做单元测试。
2016.8.3 测试整个系统工作是否正常。如有异常,调试、查找原因并恢复系统运作。
2016.8.4~5
OpenStack,
OpenNebula 系统升级
参与人员:张晓梅,赵祥虎,颜田
更多细节请参见附件。
2017年高温假维护流程
高温假配合机房断电,重启所有服务器并检查业务系统是否正常,然后升级DIRAC并迁移相关子系统。具体时间安排如下:
2017.7.21给用户和站点发高温假维护通知
2017.7.28 下午2点开始,按照下面的流程,备份重要数据,并关闭服务,最后关闭服务器电源。
2017.7.29 当日9:00-20:00供电系统维护,网络系统迁移。20:00之后如果供电和网络恢复正常,启动存储系统之外的服务器;等系统组启动Lustre之后,启动存储相关服务器。
2017.7.30 开机并按下面的流程检查服务是否启动,测试系统运作是否正常。如有异常,调试、查找原因并恢复系统运作。
2017.7.31 升级DIRAC服务器至v6r18版,并测试。
2017.8.1 迁移传输系统、监控系统等自开发的子系统,并做单元测试。
2017.8.2 测试整个系统工作是否正常。如有异常,调试、查找原因并恢复系统运作。
2017.8.3~7
OpenStack,
OpenNebula 系统升级
参与人员:张晓梅,赵祥虎,颜田
更多细节请参见附件。
--
zhang xiaomei - 2016-07-28
Comments