오늘은 linux상의 시스템 모니터링하는 도구들을 몇 개 소개해볼까 한다.
htop은 상호작용 시스템 모니터 프로세스 뷰어이자 프로세스 관리자이다. 유닉스 프로그램 top의 대안으로 설계되었다.
F1(Help) - f1을 누르면 htop에 대한 사용 설명 법이 나와있다.
F2(setup) - 설정단축키
F3(search) - process 검색
F4(filter) - 단어 입력하여 필터링
F5(Sorted) - 프로세스를 트리 형태로 보여줌
다 작성하려니.. 너무 많다.
나머지는 한 번씩 사용해보면서 숙지해보면 좋을 것 같다.
glances는 Python으로 작성된 크로스 플랫폼 커서 기반 모니터링 툴이다.
# apt-get install glances
이상한 glance라는 것도 있으니 오타 없이 잘하자!
자세한 설명은 h를 누르면 짠!
이렇답니다.. ㅎㅎ
다음으로는 기본적인 sensor모니터링을 하는 ipmitool 이 있다.
apt-get install openipmi ipmitool
yum install OpenIPMI ipmitool
root@ubuntu:~# ipmitool sdr
CPU1 Temp | 41 degrees C | ok
CPU2 Temp | 60 degrees C | ok
PCH Temp | 33 degrees C | ok
System Temp | 26 degrees C | ok
Peripheral Temp | 45 degrees C | ok
MB_10G Temp | no reading | ns
VRMCpu1 Temp | 36 degrees C | ok
VRMCpu2 Temp | 36 degrees C | ok
VRMP1ABC Temp | 32 degrees C | ok
VRMP1DEF Temp | 32 degrees C | ok
VRMP2ABC Temp | 35 degrees C | ok
VRMP2DEF Temp | 35 degrees C | ok
P1-DIMMA1 Temp | 33 degrees C | ok
P1-DIMMA2 Temp | no reading | ns
P1-DIMMB1 Temp | no reading | ns
P1-DIMMC1 Temp | no reading | ns
P1-DIMMD1 Temp | no reading | ns
P1-DIMMD2 Temp | no reading | ns
P1-DIMME1 Temp | no reading | ns
P1-DIMMF1 Temp | no reading | ns
P2-DIMMA1 Temp | 42 degrees C | ok
P2-DIMMA2 Temp | no reading | ns
P2-DIMMB1 Temp | no reading | ns
P2-DIMMC1 Temp | no reading | ns
P2-DIMMD1 Temp | no reading | ns
P2-DIMMD2 Temp | no reading | ns
P2-DIMME1 Temp | no reading | ns
P2-DIMMF1 Temp | no reading | ns
M2NVMeSSD Temp | no reading | ns
MBNVMeSSD Temp | no reading | ns
FAN1 | 3300 RPM | ok
FAN2 | no reading | ns
FAN3 | 2300 RPM | ok
FAN4 | 4600 RPM | ok
FAN5 | no reading | ns
FAN6 | no reading | ns
FANA | no reading | ns
FANB | no reading | ns
12V | 11.82 Volts | ok
5VCC | 5.04 Volts | ok
3.3VCC | 3.37 Volts | ok
VBAT | 0x04 | ok
Vcpu1 | 1.86 Volts | ok
Vcpu2 | 1.87 Volts | ok
VDimmP1ABC | 1.21 Volts | ok
VDimmP1DEF | 1.21 Volts | ok
VDimmP2ABC | 1.22 Volts | ok
VDimmP2DEF | 1.21 Volts | ok
5VSB | 5.07 Volts | ok
3.3VSB | 3.38 Volts | ok
1.8V PCH | 1.84 Volts | ok
PVNN PCH | 1.04 Volts | ok
1.05V PCH | 1.08 Volts | ok
Chassis Intru | 0x00 | ok
기본적으로 cpu, memory 등 temp와 fan speed 등 확인할 수 있다.
그리고 하드웨어 fail log를 기록하는 sel list가 있다.
root@ubuntu:~# ipmitool sel list
SEL has no entries
내 서버는 지극히 정상이어서 아무것도 표시가 없는 것뿐이다.
보통 이상이 있다면,
p1 dimmA1 ecc
p1 mce error
등 여러 가지가 쌓일 것이다.
이상으로 시간이 없는 관계로 마치며, 다음 포스팅은 GPU 모니터링할 수 있는 도구를 좀 올릴까 한다.
그때 일반적인 서버의 모니터링 할 수 있는 좋은 것들이 있음 같이 첨부하겠다.
Anaconda(conda) 가상환경 설치 (3) | 2020.06.29 |
---|---|
linux (centos, ubuntu) 모니터링 도구 - gpu 편 (2) | 2020.06.25 |
ubuntu 18.04 nvidia-docker 설치 (0) | 2020.06.23 |
하드웨어 정보 확인 dmidecode 활용법 (0) | 2020.06.22 |
ubuntu 18.04.1 server 설치 (0) | 2020.06.17 |