专业的信息化与通信融合产品选型平台及垂直门户
注册 登陆 设为首页 加入收藏
首页 企业新闻 招标信息 行业应用 厂商专区 活动 商城 中标信息

资讯
中心

新闻中心 人物观点
厂商专区 市场分析
行业
应用
政府机构 能源产业 金融机构
教育科研 医疗卫生 交通运输
应用
分类
统一协作 呼叫客服 IP语音 视频会议 智能管理 数据库
数字监控 信息安全 IP储存 移动应用 云计算 物联网

TOP

数据中心存储系统出现故障应该从这几个方面入手
2018-11-06 16:40:30 来源:电子发烧友网 作者:【
关键词:存储系统
 
存储系统作为如今大数据云计算时代的根基,它的稳定才是支撑起如此海量数据的根本。所以各大相关行业对于这部分非常重视,所以在此针对存储系统的故障处置简单提出自己学习总结的一些思路。

  存储系统作为如今大数据云计算时代的根基,它的稳定才是支撑起如此海量数据的根本。所以各大相关行业对于这部分非常重视,所以在此针对存储系统的故障处置简单提出自己学习总结的一些思路。

  首先在处理存储系统发生的可能故障前必须对于整个存储系统的架构以及原理有一个清楚的了解。普遍来说存储系统由主机、交换机及存储设备组成。它们之间可以是直连或者是IP网络或FC网络的方式进行连接。整个系统的稳定性跟每个组成部分都息息相关。

  其次了解故障的分类,故障分类大致分为硬件故障、配置故障或者license类问题,先外部后内部,先处理高级警告后处理低级警告,先共性后个性。

  面对故障的发生,第一步永远都是先进行必要的信息收集,对于整个存储系统的基本信息,故障信息、存储设备信息以及组网、主机服务器信息要有了解。这些部分可以直接管理到主机、交换机或存储设备中进行收集,如今厂商也都有专门研发维护工具来帮助管理者做这些事情。收集清楚这些信息之后,才能对整个存储系统有一个普遍清晰的认知。至少对如今的故障可能发生原因有一个了解,然后再细化到每个组成部分上排查可能问题。

  一、主机层

  在主机层面大多需要检查的是操作系统版本,相应的HBA卡是否达到合适的标准,如速率、IOPS及带宽等。其次是在主机上安装的多路径软件,查看一下与存储设备连接的物理路径的状态以及存储LUN等信息。

  二、网络层

  网络层次可能发生的问题大多是连通性问题,由于链路故障导致的丢包或者误码率上升等现象,此现象可以在交换机上观察端口的信息,观察误码率是否在持续增长,如有,则可能存在链路部件异常或接触不良的现象。其次可能是端口速率或带宽未达到标准,查看端口配置及协商状况,这些都有可能导致故障或者性能问题。

  三、存储层

  存储设备可以在导出相关告警,事件或者运行数据、系统日志和硬盘日志来进一步分析可能发生故障的原因,到底是存储控制器问题还是底层的硬盘问题都需要一一排查。在底层存储方面主要考虑存储模块的配置,指示灯状态等信息,从指示灯状态我们可以分析出是否存在硬件故障等,其次在配置方面:RAID级别、分条深度、LUN读写策略、cache策略,LUN归属、硬盘类型等是否符合业务的特点以及不符合时可能导致的问题。都是需要我们在故障排查处理时需要考虑的。

  总之面对存储系统的故障,一定要具备一个清晰的思路,不要盲目的去做。盲目的去做可能会恶化故障,从而使得排查难度进一步加大。

      

责任编辑:admin
免责声明:以上内容转载互联网平台或企业单位自行提供,对内容的真实性、准确性和合法性不负责,Voipchina网对此不承担任何法律责任。

】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部

上一篇美国第二大银行获加密货币私钥存..
下一篇福建晋华回应美国被禁:美光把晋..

热门文章

图片主题

最新文章

相关文章

广告位

Copyright@2003-2009 网络通信中国(原VoIP中国) 版权所有
联系方式:503927495@qq.com
  京ICP备05067673号-1 京公网安1101111101259

《合作通告》

本站因快速发展需要,有共赢合作、战略创投意向的个人或机构,请联系咨询:
(电话)010-69397252、13911442656(v)
(邮箱)503927495@qq.com
我知道了