分享好友 最新动态首页 最新动态分类 切换频道
Megacli详解
2024-12-26 10:20

通常,我们使用的DELL/HP/IBM三家的机架式PC级服务器阵列卡是从LSI的卡OEM出来的,DELL和IBM两家的阵列卡原生程度较高, 没有做太多封装,可以用原厂提供的阵列卡管理工具进行监控;而HP的阵列卡一般都做过封装了,因此需要使用自身特有的管理工具来监控。本文以几种常用的阵列卡为例,展示其阵列卡及硬盘监控的方法。

DELL SAS 6/iR卡,全称LSI Logic SAS1068E,只支持RAID 0, RAID 1, RAID 1+0, 不支持RAID 5等高级RAID特性,不支持阵列卡电池。
DELL PERC PERC H700卡,全称LSI Logic MegaRAID SAS 2108,支持各种RAID级别及高级特性,可选配阵列卡电池。
DELL PERC H310 Mini卡 ,全称LSI Logic / Symbios Logic MegaRAID SAS 2008,支持常见RAID级别,不支持高级RAID特性,不支持阵列卡电池。
IBM ServeRAID M5014 SAS/SATA Controller卡,全称LSI Logic / Symbios Logic MegaRAID SAS 2108,支持各种RAID级别及高级特性,可选配阵列卡电池。
IBM ServeRAID-MR10i SAS/SATA Controller卡,全称LSI Logic / Symbios Logic MegaRAID SAS 1078,支持常见RAID级别,不支持高级RAID特性,可选配阵列卡电池,这个卡其实和DELL的PERC 6/i卡是一样的,都是基于LSI MegaRAID SAS 1078基础上OEM出来的。

上面是几种常见的阵列卡型号,更多的可以自行查看官方的技术手册。下面我们要继续的是,这些阵列卡以及硬盘如何监控,阵列卡的管理也请查看官方技术手册,不在本文讨论范畴。一般地,支持RAID 5的卡,我们称其为阵列卡,都可以使用LSI官方提供的MegaCli工具来管理,而不支持RAID 5的卡,我们称其为SAS卡,使用lsiutil工具来管理。HP的服务器使用其特有的hpacucli工具来管理。

MegaCli -adpallinfo -aall — 查看阵列卡信息

-a 参数指定阵列卡的编号,一般服务器上只会配一个阵列卡,因此我们通常指定为 -a0(阵列卡适配器编号,从0开始) 即可,主要关注下面几个信息

状态值对应含义Product Name : PERC H710 Mini阵列卡名称FW Package Build: 21.2.0-0007阵列卡firmware版本号,版本如果太低,建议升级以提高稳定性及性能BBU : Present是否有配BBU电池

MegaCli -cfgdsply -aall — 查看阵列配置

状态值对应含义Memory: 512MB阵列卡cache大小,2的N次方,如果不是,说明阵列卡有异常Number of dedicated Hotspares: 0阵列是否有专用/独享热备盘(如果有多个逻辑磁盘组/disk group,则可以指定一个硬盘用于全局热备,那么该disk group上的专用热备盘数量为0也不用担心,除了RAID 1/RAID 1+0一般不指定热备盘以外,其他几个阵列级别建议都要指定热备盘State : Optimal阵列状态,如果不是 Optimal 就要关注了Current Cache Policy: WriteBack, ReadAheadNone, Direct, Write Cache OK if Bad BBU阵列读写cache策略,建议写策略设置为FORCE WB,最起码是WB,预读策略可以关掉,意义不大,几乎没影响Disk Cache Policy : Disabled硬盘cache策略,建议关闭,防止意外时数据丢失Current Power Savings Policy: None节电策略,建议关闭Media Error Count: 0三个错误计数器,任何一个值大于100就要立刻引起关注,尤其要关注起增长速度。1T以上SATA盘,计数值不够精确,可能所有盘上该值都会大于0,一般重启就会重新清0,如果重启后还是大于0的话,赶紧报修吧。SAS盘的计数值则比较准确。Other Error Count: 0Predictive Failure Count: 0Firmware state: Online, Spun Up查看硬盘状态,如果是unconfigured表示该硬盘未分配加入到阵列中;如果是 unconfigured(bad)表示该盘不但是未分配,而且还坏了,正是“出师未捷身先死”;如果是failed,表示该盘故障无法识别;如果是 rebuilding,表示该盘正在重建数据

MegaCli -adpbbucmd -aall — 查看阵列卡电池信息

状态值对应含义Temperature: 39 C查看电池温度,如果相比上一次查看高出不少,就需要关注了,或者可以根据经验设置一个基线值Battery State: Optimal电池状态,如果不是为Optimal,就需要关注了Charger Status: Complete电池充放电状态isSOHGood: Yes电池状态,如果不是为Yes,需要关注Relative State of Charge: 93 %当前电量,当电量低于15%,或者电池坏掉时,默认都会将写策略从WB改成WT,除非设定为FORCE WB策略Max Error = 0 %电池是否有错误信息Next Learn time: Tue Oct 14 22:06:50 2014电池充放电时间,注意这是美国时间。另外,新的阵列卡电池很多改成电容式的了,也就不需要重复充放电了

lsiutil有交互和非交互两种方式,作为监控,我们肯定选择非交互模式。想要使用交互模式的,可以根据非交互模式自行练习。

lsiutil -p 1 -a 20,12,0,0 — 查看硬盘计数器

Invalid DWord Count 2,563 — 任何一个值大于0,都需要引起关注

Running Disparity Error Count 2,366

Loss of DWord Synch Count 0

Phy Reset Problem Count 0

lsiutil -p 1 -a 21,1,0,0,0 — 查看逻辑卷状态

状态值对应含义Volume State: optimal, enabled逻辑卷健康状况Volume draws from Hot Spare Pools: 0是否有热备Volume Size 139392 MB, 2 Members由几块硬盘组成Primary is PhysDisk 1 (Bus 0 Target 9)物理硬盘1Secondary is PhysDisk 0 (Bus 0 Target 3)物理硬盘0

lsiutil -p 1 -a 21,2,0,0,0 — 查看物理硬盘状态

状态值对应含义PhysDisk 0 is Bus 0 Target 3编号PhysDisk State: online状态Error Count 13, Last Error: Command = 28h, Key = 3, ASC/ASCQ = 11h/00h错误计数器,大于0的话,就需要引起关注

hpacucli工具查看阵列、硬盘、电池信息,其实就只要一条指令

hpacucli ctrl all show config detail — 查看阵列详细信息、配置

状态值对应含义Controller Status: OK阵列卡状态Firmware Version: 1.18firmware版本,太低了建议升级,以提高稳定性及性能Cache Board Present: True是否配备了cache模块Cache Status: OKcache模块状态Cache Ratio: 100% Read / 0% Writecache策略,此处只有读cache,不用于写cache,因为没有bbu电池,见下方结果Drive Write Cache: Disabled关闭磁盘cacheTotal Cache Size: 256 MBcache大小Total Cache Memory Available: 208 MB实际可用cache大小,和理论cache大小不一样,说明cache模块可能有问题No-Battery Write Cache: Disabled关闭FORCEWB策略Battery/Capacitor Count: 0阵列卡BBU电池数量为0,也就是没有BBU模块Battery/Capacitor Status: Failed (Replace Batteries)阵列卡BBU电池状态,这里显示是错误状态,需要及时更换Array: A第一个乌列阵列,编号从A开始,依次是A、B、CStatus: OK物理阵列状态Logical Drive: 1第一个逻辑卷,编号从1开始Fault Tolerance: RAID 5第一个逻辑卷的阵列级别Status: OK第一个逻辑卷状态Caching: Enabled第一个逻辑卷是否启用了cache策略physicaldrive 1I:1:1第一块物理硬盘,编号从1开始Status: OK第一块物理硬盘状态Firmware Revision: HPDA第一块物理硬盘firmware,如果太低,也需要及时升级,HP的硬盘每个批次都有不同的firmware

如果磁盘在RAID卡上

(1)先获取磁盘的device id

这里的输出,会有ES信息,同时还会有device id

(2)根据device id,查询smart信息

这里的11就是磁盘的device id,哪怕后面的/dev/sdc不存在,获取是这颗磁盘不属于sdc,也能输出正确的信息,只要device id是正确的就行。

如果不在RAID卡上,直接

shell

 
 

shell

 
 

如果有热备,则 Firmware State会显示为hotspace

RAID Level对应关系

shell

 
 

shell

 
 

shell

 
 

shell

 
 

一般在没有BBU情况下, 要执行如下命令进行修改

shell

 
 

Device : Normal --> Damage --> Rebuild --> Normal

Virtual Drive : Optimal --> Degraded --> Degraded --> Optimal

Physical Drive : Online --> Failed Unconfigured --> Rebuild --> Online

Rebuild 中的物理磁盘状态中会显示:“Firmware state: Rebuild”

屏幕显示类似下面的内容

shell

 
 

返回结果类似下面这样

shell

 
 

or

 ,关注里面的error/fail/warn等多个关键字

最新文章
A股中枢上行趋势仍在 跨年行情有望延续
原标题:十大券商看后市|A股中枢上行趋势仍在,跨年行情有望延续政策积极定调后,2024年最后一个交易月的后半月A股将作何表现呢?澎湃新闻搜集了10家券商的观点,大部分券商认为,经济政策定调仍然积极,对于呵护当下市场情绪与维持股市流
360搜狗SEO,介绍搜索引擎优化之路
随着互联网的快速发展,搜索引擎(SEO)已经成为企业提升排名、增加流量的重要手段。在我国,360和搜狗作为两大主流搜索引擎,其SEO策略更是备受关注。本文将为您揭秘360搜狗SEO之道,帮助您更好地优化网站,提升排名。一、了解360搜狗SEO
Acrobat PRO DC v2023.008.20533,32位&64位 破解版(不再被PDF困扰)
Adobe Acrobat DC 2023,这是Adobe公司最新推出的一款PDF文件编辑和转换软件。这款软件拥有全新的界面设计,采用直观的触控式操作,使得用户在使用过程中更加便捷。同时,它还具备强大的功能,能够满足用户在PDF文件处理方面的各种需求。Ac
Apache Gravitino 在B站的最佳实践
01 元数据管理痛点剖析上图是我们在引入 Gravitino 之前的数据系统架构图。我们的元数据最大的使用方为数据平台,也包括了其它一些数据服务,如 SQL Scan,用于对 SQL 进行预检查,以及 SDM 数据智能编排服务等。除此之外,其它一些引擎也
Kafka【付诸实践 03】Offset Explorer Kafka 的终极 UI 工具安装+简单上手+关键特性测试(一篇学会使用 Offset Explorer)
官方自称 Offset Explorer 是 Kafka 的终极 UI 工具 😄 我们看一下 官网 的介绍: Offset Explorer (formerly Kafka Tool) is a GUI application for managing and using Apache Kafka ® clusters. It provides an intuitive
Docker Maven插件
Docker Maven插件是一个用于构建和推送Docker镜像的Maven插件。它是Spotify最初使用的Maven插件,用于从Java服务中构建Docker镜像。该插件的未来状态是无效的,建议您改为使用其他替代方案。Docker容器是Docker的核心组成部分,它是轻量级
2016年手机大排行:iPhone 7兄弟轻松碾压安卓党
现如今人们对手机跑分的关注度越来越低了,不过跑分成绩仍然是一款手机性能高低的基准。安兔兔今天公布了2016年度手机性能排行榜TOP10,根据安兔兔跑分成绩排了个座次。由于跑分测试存在很多意外因素,本次汇总的成绩去除了疑似作弊的拉高
360借条逾期几天会给紧急联系人打电话
小编导语在现代社会中,借贷已经成为人们生活中不可或缺的一部分。随着互联网金融的发展,像360借条这样的线上借贷平台应运而生,为用户提供了便捷的借款服务。随着借款的普及,逾期还款的问也日益突出。许多借款人可能会因为各种原因导致
AI绘画-【StableDiffusion】从入门到放弃--Lora模型
大家好,我是AIGC安琪! Stable DiffusionLora模型,作为AI绘画领域的新宠,正引领着一场视觉艺术革命。它不仅继承了StableDiffusion的强大图像生成能力,还通过LoRA技术实现了更精细、更具个性化的图像风格
EhViewer1.9.9.9版本:有哪些新增功能和改进,是否值得升级?
EhViewer作为一款备受欢迎的漫画阅读软件,在每一次更新后都会引起广泛关注。近期发布的EhViewer1.9.9.9版本,带来了哪些新的功能和优化?是否值得我们升级?本文将详细探讨这个问题,帮助用户更好地了解新版本的亮点和使用体验。EhViewer1
相关文章
推荐文章
发表评论
0评