TSM的节点node和namespace是一一对应的,在分布式环境下,多台参与计算的主机如果用传统的node备份方式,将会出现每个节点一个namespace的现象,备份、管理起来很繁琐。
一台设备型号为P510的IBM小型机,系统中有提示CPU及内存错误。工程师赴现场检查,主机正常运行,初步诊断为临时报错,建议继续观察。两天后,该小型机宕机,无法启动,问题再次出现并更加严重。
目前数据中心的容灾系统,多采用存储级数据复制技术。这种容灾方式,是存储端对端的实时备份,对于应对硬件故障可以发挥重要作用。但如果主生产端发生逻辑层面的错误或损坏,底层复制方式将导致主备中心均出现数据错误或损坏,使灾备中心失去作用。
由于机房电力施工,导致P570单电工作,这期间,此单路电源故障,导致主机宕机。进行检查之后,对故障电源进行了更换后机器可以正常启动到操作系统。
某烟草专卖局为提升网络质量,决定进行网络改造。由之前仅电信提供的单专线接入服务,改造为电信、移动、联通三家ISP同时提供的专线接入服务。改造后电信、移动专线承载一般性业务,联通专线承载视频会议业务。
合法买球平台接到客户报修AIX主机应用访问缓慢,工程师随即到达现场进行处理,经排查后得到初步结果,存储、交换机、主机以及链路并无明显故障。后进行深入排查,发现主机端powerpath多路径软件进程CPU占用率非常高,导致CPU 100% busy,从而造成应用访问缓慢。
某银行客户提出的优化需求,希望进行一次数据库性能优化。该数据库每晚都要进行跑批操作,每次执行需花上整晚时间。客户希望可以对整个跑批操作进行分解,并分析出可以优化的部分,进行改进缩短跑批时间。
数据库业务出现异常。该数据库每天都要进行跑批操作,今天进行操作时数据库却hang住没有反应。
合法买球平台接到客户报修,一台PC服务器在运行过程中因误操作将一块硬盘拔下,导致机器的一个raid5阵列数据出现损坏。接到报修后立即派工程师赶赴现场并尝试系统下进行恢复数据,但以失败告终。在数据恢复失败后工程师对故障问题进行了分析,并最终决定重建该阵列。
AIX系统在逻辑卷级提供了磁盘镜像功能,以增加数据的可用性和可靠性,镜像一旦出现异常,如当其中一块硬盘损坏时,就可能造成数据丢失从而引发严重后果,所以在日常维护中都会经常对镜像状态进行检查。