진단 및 조치(FAQ)
- 서버
- 디스크어레이
문제 | 증상 | 조치 방법 |
Power on 이상 | 서버의 전원 스위치를 눌러도 서버가 켜지지 않음 | - AC 전원 코드의 연결 상태 확인. - AC 전원 코드를 분리하였다가 다시 연결 후 Power on. - BMC가 장착된 서버의 경우 AC 전원 코드 연결 후 BMC Boot up이 완료되어야 서버의 Power on이 가능하므로 AC 전원 인가 후 약 1분후 Power on. - 모니터와 서버의 연결 케이블 상태 확인 - 다른 모니터에 연결하여 VGA 출력 확인 - 서버 뒷면 Power Supply LED 상태 확인(점멸/점등) 확인 |
소음 발생 | 이상 소음 발생 | - 서버가 설치된 장소의 외기 온도 확인. 서버의 외기 온도가 높을 경우 CPU 냉각을 위해 냉각 팬이 고속으로 동작. - 냉각 팬이 모두 정상적으로 구동하고 있는지 확인. 다수 냉각 팬 중 단일 팬의 장애 발생 시 타 정상 팬이 고속으로 동작. - 서버 전면 경고등(FAN module 장애 경고등)확인 - 서버 관리 포트를 통한 확인 |
알람 발생 | 알람 발생 | - RAID 컨트롤러가 장착되어 있는 경우 RAID 볼륨을 구성하는 디스크 장애 발생 시 RAID 컨트롤러에서 알람 발생. RAID 컨트롤러의 관리 SW를 통해 알람 중지. 장애 디스크의 교체 필요. - 전원공급기가 이중화 되어 있는 제품의 경우 단일 전원공급기의 이상 발생 시 알람 발생. 전원공급기에 연결된 AC 코드와 전원에 이상이 없는지 확인. 입력 AC 전원에 이상이 없는 경우 장애 전원공급기의 교체 필요. - 서버 보다는 컴퓨터(PC)에서 Beep 발생이 발생하는경우가 많음 - HDD 디스크장애시 디스크 캐피어 경고 LED확인 |
키보드, 마우스 이상 | 키보드, 마우스의 미 동작 | - 키보드, 마우스가 서버에 정상적으로 연결되어 있는지 확인. - 타 키보드, 마우스를 연결하여 동작 확인. - 서버를 Reboot하여 Main Bios에 들어가 키보드 동작 상태 확인. Main Bios에서도 동작 불능 시 서버 장애 점검 필요. - 시스템 Hang이 여부 확인 |
USB 장치 문제 | USB 장치 인식 문제 | - 타 서버나 PC에서 USB 장치의 정상 동작 확인. - 서버의 USB OS 드라이버가 정상적으로 설치되어 있는지 확인. - USB Locking Tool 확인 |
OS Boot 이상 | POST 과정 후 OS Boot가 정상적으로 진행되지 못함 | - 'Boot device order' 문제일 수 있으므로 Main bios에서 Boot device가 1번으로 설정되어 있는지 확인. - USB 메모리 등 추가 저장 장치가 서버에 부착되어 있는 경우 제거. - RAID CARD의 OS영역 디스크 장애 확인 - RAID CARD의 불량 확인 - Local HDD Disk(SATA) 장애 확인 |
랙 마운트 | 랙 마운트를 위한 슬라이드 레일 설치 방법 | - 각 제조사가 제공하는 랙 마운트용 슬라이드 레일 설치 매뉴얼 참조 |
네트워크 통신 | 네트워크 통신 이상 | -LAN 케이블이 서버에 정상적으로 연결되어 있고 해당 포트의 Activity LED와 Link LED가 동작하는지 확인. - 문제가 발생한 서버에 연결된 LAN 케이블이 타 서버에서도 정상 동작하는지 확인. - LAN 케이블이 연결된 네트워크 스위치의 이상 유무 확인. - Link Speed에 따른 LED 상태 확인 - 서버의 OS단에서 Command,아이콘(x)상태확인 |
ODD 이상 | SW 설치 시 DVD 이상 | - 설치를 위해 장착한 DVD 미디어에 이상이 없는지 타 컴퓨터에서 이상 유무 확인 => 이상 있을 시 ODD drive 불량 |
디스크 IO 성능 | 디스크 IO 성능 저하 | - 디스크 IO 성능이 크게 저하된 경우 OS의 성능 모니터링 툴을 이용하여 디스크 IO에 비 정상적인 IO 부하를 주는 것이 없는지 확인. - RAID 컨트롤러 관리 SW를 구동하여 이벤트 로그 등을 확인, 이상이 없는지 확인. |
CPU 성능 | CPU 성능 저하 | - CPU에 비정상적인 부하를 주는 프로세스가 없는지 확인. - 외부 온도의 높은 상승, 냉각 팬 이상 유무 확인. |
원격 관리 | 원격 모니터링, 전원 관리 등 | - 서버에 설치된 OS 별 ipmitool을 이용하여 서버 상태 관리 가능. - 원격 관리 (Remote KVM 등) 접속을 위해서는 서버 후면의 IPMI (Management) 전용 RJ45 포트에 접속하여 모니터링 및 관리 가능. - 원격 관리 포트의 IP 설정 등 자세한 내용은 서버 제조사의 사용자 매뉴얼 참조. |
서버 사양 확인 | 서버 사양 확인 방법 | [각 서버 제조사마다 상이함] - 서버 후면 Specificaiton Label에 주요 파트의 사양이 표기되어 있음. |
AS 신청 관련 | AS 신청 방법 | 협회 방안을 정리해 주시기 바랍니다. |
시리얼 넘버 | AS 신청을 위한 시리얼 넘버 확인 방법 | [각 서버 제조사마다 상이함] - 서버 후면 Specificaiton Label에 부착된 시리얼 넘버로 AS 신청 수행. |
문제 | 증상 | 조치 |
FRU 상태 이상 | 1. 전면 또는 뒷면에 Fault/Service Required LED 엠버에 불이 켜져 있음 -> 조치 1. 2. 컨트롤러 모듈 상태등이 꺼져 있음 -> 조치 2. 3. 컨트롤러 뒷면에 FRU OK LED가 꺼져 있음 -> 조치 2. |
조치1. 컨트롤러 뒷면에 FRU, 연결상태 LED 등을 확인 조치 2. 컨트롤러 모듈이 올바르게 장착되어 있는지 확인 후 전원이 인가 되어 있는지 확인 이벤트 로그 확인 |
power-up 에러 | 전면 또는 뒷면 패널에 Fault/Service Required LED 엠버에 불이 켜져 있음 | 1. 다른 컨트롤러를 이용하여 컨트롤러 재시작 후 동일 문제가 발생하는지 확인 2. 컨트롤러 재 장착 후 동일 문제가 발생하는지 확인 3. 컨트롤러 교체 |
Cache flush 에러 | 전면 또는 뒷면 패널에 Fault/Service Required LED 엠버에 불이 켜져 있음 | 1. 다른 컨트롤러를 이용하여 컨트롤러 재시작 후 동일 문제가 발생하는지 확인 2. 컨트롤러 재 장착 후 동일 문제가 발생하는지 확인 3. 컨트롤러 교체 |
Cache self-refresh 에러 | 전면 또는 뒷면 패널에 Fault/Service Required LED 엠버에 불이 켜져 있음 | 1. 다른 컨트롤러를 이용하여 컨트롤러 재시작 후 동일 문제가 발생하는지 확인 2. 컨트롤러 재 장착 후 동일 문제가 발생하는지 확인 3. 컨트롤러 교체 |
드라이브 오프라인 됨 | 디스크 드라이브 모듈 LED가 모두 꺼져 있음 | 디스크 드라이브를 재장착 후 확인 |
드라이가 구성 안됨 | 디스크 드라이브 모듈 LED가 모두 꺼져 있음 | 디스크 드라이브를 재장착 후 확인 |
Online/Activity LED가 꺼져 있고 드라이브가 오프라인 됨 |
Power/Activity/Fault LED 엠버등이 깜박 거림 | 이벤트 로그 확인 |
HBA port link가 다운 | HBA port 링크 상태 LED가 꺼져 있음 | 1. FC 케이블 연결 확인 2. 케이블 상태 점검 3. 케이블 교체 4 .SAN switch 확인 5. 다른 port를 사용하여 동일한 문제가 발생하는지 확인 6. PCI 슬롯에 문제가 없는지 확인 |
확장 Port link가 다운 | 확장 Port 상태 LED 가 꺼져 있음 | 1. 확장 케이블 연결 확인 2. 케이블 상태 점검 3. 케이블 교체 4. SAN switch 확인 5. 다른 port를 사용하여 동일한 문제가 발생하는지 확인 6. PCI 슬롯에 문제가 없는지 확인 |
Network link가 다운 | Network Lan port 링크 상태 LED가 꺼져 있음 | 네트워크 케이블 상태 점검 네트워크 케이블 교체 Network 스위치 에서 설정 값 및 구성 확인 |
PDU 이상 | PDU LED 가 꺼져 있음 | 파워 케이블이 올바르게 연결되었는지 확인 로그 확인 |
드라이브 인클로저 rear panel 이상 | 드라이브 인클로저 rear panel OK LED 등이 꺼져 있음 | PDU 또는 팬이 허용치 초과 |
컨트롤러 문제 | cache 상태 LED는 꺼져 있고 컨트롤로가 시작되지 않음 | 컨트롤러 교체 |
컨트롤러 시작 안함 | cache 상태 LED는 깜박 거리고 컨트롤로는 시작 됨 | 시스템은 데이터를 flushing 하고 있다 문제가 지속되면 컨트롤러를 교체 |
인클로저가 초기화 되지 않음 | 인클로저가 초기화 되지 않음 | 전원 코드가 올바르게 연결되어 있는지 확인 한다 이벤트 로그를 확인한다 |
디스크어레이 인클로저 추가 후 인클로저가 초기화 되지 않음 |
디스크어레이 인클로저 추가 후 인클로저 ID 값이 올바르지 않음 | 컨트롤러 2개 모두 동작 하는지 확인하고 perform rescan 을 실행한다 |
오류 메시지 표시 됨 | 오류 메시지 표시 | 오류 상태를 파악하여 권장 조치 사항을 수행 |
※ 권장 조치를 수행 후 오류 상태를 해결 할 수 없는 경우 제조사에 문의 |