AIX 운영업무/HW errpt trouble shooting
path has failed /recovered / disk operation error
aix
2022. 1. 4. 02:16
Path Has failed 후, 동시에 바로 Recovery가 된 경우.
1) errpt 확인 (에러메세지 확인)
1
2
3
4
5
|
[root@aix_jbw:/] errpt -a
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
DCB47997 1122091816 T H hdisk29 DISK OPERATION ERROR
F31FFAC3 1122091816 I H hdisk29 PATH HAS RECOVERED
DE3B8540 1122091816 P H hdisk29 PATH HAS FAILED
|
2) 원인
▪ SCSI Command TIME-OUT 으로 인한, 일시적인 에러.
✓ FC Frame을 서버의 HBA카드에서는 Target 장비에 전송을 하였으나, 이에 대한 수신을 받지 못한 상태.
✓ 이로 인해, 일시적으로 SCSI 장치의 재설정 명령이 수행되며, Path has failed와 Disk Operation 에러가 발생.
▪주로 발생하는 시점.
✓ FC 통신의 일시적인 Failure이 있을 때. ( Server <-> SAN <-> Storage 구간)
✓ 특정 디스크 영역에 Data Traffic의 High I/O Load가 발생하는 경우.
3) 조치방법
▪ 지속적인 "DISK OPERATION ERROR 및 PATH HASH FAILED"가 발생한다면, 하기와 같은 조치 필요.
✓ Server HBA 카드, SAN GBIC, Storage Port의 에러 카운트 확인 및 교체.
✓ 구간별 케이블 점검.
출처: https://bluelogger.tistory.com/entry/Path-fail-케이스 [AIX for System Engineer]