오늘은 ubuntu18.04 desktop에서 login시 나타나는 문제점에 대해 트러블슈팅 관련 글을
올려보겠다.
나도 ubuntu계열은 참 많이 설치해봤다고 생각한다. 수백번은 되지 않을까..
근데 그때그때마다 상황이 바뀌고 nvidia driver와 충돌이 생기고 GPU 카드 개수가 늘어남에
따라 출력 port도 바뀌고 하다 보니 그 순간순간 기록해 두고 저장해 두었다.
ubuntu16.04까지는 모든 문제를 해결했다고 생각이 들었는데 ubuntu18.04에서는 또 다른
문제점이 생기기 시작했다.
ubuntu18.04.3 desktop을 설치하고 이전과 같이 driver를 설치 하기 시작했다.
이때까지는 onboard vga출력 상황이다.
Tip - GUI OS 설치 후 ssh 접속 환경을 먼저 설정해두자.
# add-apt-repository ppa:graphics-drivers/ppa
# apt-get update
# apt-get install nvidia-driver-440
# reboot
# nvidia-smi
Thu Aug 20 13:57:22 2020
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 440.100 Driver Version: 440.100 CUDA Version: 10.2 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 GeForce RTX 208... Off | 00000000:02:00.0 Off | N/A |
| 28% 42C P0 69W / 250W | 1MiB / 11016MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
다시 rebooting 후
onboard vga -> offboard로 bios 변경 후 2080Ti HDMI로 출력 하기 시작하였다.
그 후 위와 같은 화면으로 출력 후 ctrl + alt + f2 ~ f6까지 모든 화면에 접속에 제대로 되지 않는 상황 발생
위에 Tip에 말해 두었지만 이런 상황에 OS 재설치하기 싫다면 ssh 설정을 해둬야 한다.
이제부터 어떤 문제점인지 찾아야 한다.
root@ckkim:~# systemctl status gdm
● gdm.service - GNOME Display Manager
Loaded: loaded (/lib/systemd/system/gdm.service; static; vendor preset: enabled)
Active: active (running) since Thu 2020-08-20 13:55:45 KST; 1min 51s ago
Process: 1052 ExecStartPre=/usr/share/gdm/generate-config (code=exited, status=0/SUCCESS)
Main PID: 1062 (gdm3)
Tasks: 4 (limit: 4915)
CGroup: /system.slice/gdm.service
└─1062 /usr/sbin/gdm3
8월 20 13:57:34 ckkim gdm3[1062]: Child process -8874 was already dead.
8월 20 13:57:34 ckkim gdm3[1062]: Child process 8822 was already dead.
8월 20 13:57:34 ckkim gdm3[1062]: Unable to kill session worker process
8월 20 13:57:35 ckkim gdm-launch-environment][8915]: pam_unix(gdm-launch-environment:session): session opened for user gdm by (uid=0)
8월 20 13:57:35 ckkim gdm-launch-environment][8915]: pam_unix(gdm-launch-environment:session): session closed for user gdm
8월 20 13:57:35 ckkim gdm3[1062]: GdmDisplay: display lasted 0.357784 seconds
8월 20 13:57:35 ckkim gdm3[1062]: Child process -8967 was already dead.
8월 20 13:57:35 ckkim gdm3[1062]: Child process 8915 was already dead.
8월 20 13:57:35 ckkim gdm3[1062]: Unable to kill session worker process
8월 20 13:57:35 ckkim gdm-launch-environment][8984]: pam_unix(gdm-launch-environment:session): session opened for user gdm by (uid=0)
gdm 역시 정상으로 load 돼있다.
ubuntu 16.04 까지는 gdm이 아닌 lightdm을 사용하였다.
root@ckkim:~# lsmod |grep -i nouveau
nouveau 역시 off 되어 있었다.
이상할 것 없는 상황이지만 이상했다.
# apt-get purge nvidia*
# reboot
# apt-get install nvidia-driver-440
혹시나 하는 마음으로 nvidia driver를 변경하기로 하였다.
역시 동일한 상황의 반복이었다.
# vim /etc/gdm3/custum.conf
# GDM configuration storage
#
# See /usr/share/gdm/gdm.schemas for a list of available options.
[daemon]
# Uncoment the line below to force the login screen to use Xorg
#WaylandEnable=false
# Enabling automatic login
# AutomaticLoginEnable = true
# AutomaticLogin = user1
# Enabling timed login
# TimedLoginEnable = true
# TimedLogin = user1
# TimedLoginDelay = 10
[security]
[xdmcp]
[chooser]
[debug]
# Uncomment the line below to turn on debugging
# More verbose logs
# Additionally lets the X server dump core if it crashes
#Enable=true
#WaylandEnable=false
WaylandEnable=false
위에 gdm3 custum.conf에 wayland 부분을 주석 해제해 준다.
멀티 GPU를 사용하였을 때는 작업해줘야 했던 부분이었다.
역시 결과는 같아서 다시 파일을 원복 시켜주었다.
마지막으로 ubuntu18.04 처음 버전부터 문제가 생겼을 경우 wayland와 함께 문제를 해결해주는 하나의 경우의 수가
남아있었다.
root@ckkim:~# apt-get upgrade
Reading package lists... Done
Building dependency tree
Reading state information... Done
Calculating upgrade... Done
The following packages were automatically installed and are no longer required:
gir1.2-geocodeglib-1.0 libegl1-mesa libllvm8 libwayland-egl1-mesa ubuntu-web-launchers
Use 'apt autoremove' to remove them.
The following packages have been kept back:
fwupd fwupdate fwupdate-signed netplan.io
The following packages will be upgraded:
...
...
...
apt-get upgrade 후 os 버전이 변경되었다.
root@ckkim:~# cat /etc/*release
DISTRIB_ID=Ubuntu
DISTRIB_RELEASE=18.04
DISTRIB_CODENAME=bionic
DISTRIB_DESCRIPTION="Ubuntu 18.04.3 LTS"
NAME="Ubuntu"
VERSION="18.04.3 LTS (Bionic Beaver)"
ID=ubuntu
ID_LIKE=debian
PRETTY_NAME="Ubuntu 18.04.3 LTS"
VERSION_ID="18.04"
HOME_URL="https://www.ubuntu.com/"
SUPPORT_URL="https://help.ubuntu.com/"
BUG_REPORT_URL="https://bugs.launchpad.net/ubuntu/"
PRIVACY_POLICY_URL="https://www.ubuntu.com/legal/terms-and-policies/privacy-policy"
VERSION_CODENAME=bionic
UBUNTU_CODENAME=bionic
=======================================================================================
root@ckkim:~# cat /etc/*release
DISTRIB_ID=Ubuntu
DISTRIB_RELEASE=18.04
DISTRIB_CODENAME=bionic
DISTRIB_DESCRIPTION="Ubuntu 18.04.5 LTS"
NAME="Ubuntu"
VERSION="18.04.5 LTS (Bionic Beaver)"
ID=ubuntu
ID_LIKE=debian
PRETTY_NAME="Ubuntu 18.04.5 LTS"
VERSION_ID="18.04"
HOME_URL="https://www.ubuntu.com/"
SUPPORT_URL="https://help.ubuntu.com/"
BUG_REPORT_URL="https://bugs.launchpad.net/ubuntu/"
PRIVACY_POLICY_URL="https://www.ubuntu.com/legal/terms-and-policies/privacy-policy"
VERSION_CODENAME=bionic
UBUNTU_CODENAME=bionic
version은 바뀌었지만 출력이 정상적으로 바뀌었다.
ubuntu18.04.1 version부터 GUI에 여러 문제가 생긴 것 같다.
onboard로 os설치 후 card 출력을 하느냐, card 출력 후 os설치를 바로 하느냐에 따라도 상황은 다르고
GPU 개수에 따라서도 달랐다.
결국에 해결했던 부분은 wayland와 apt-get upgrade이다.
# nvidia-smi
Thu Aug 20 13:57:22 2020
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 440.100 Driver Version: 440.100 CUDA Version: 10.2 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 GeForce RTX 208... Off | 00000000:02:00.0 Off | N/A |
| 28% 42C P0 69W / 250W | 1MiB / 11016MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
root@ckkim:~# nvidia-smi
Thu Aug 20 16:11:32 2020
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 440.100 Driver Version: 440.100 CUDA Version: 10.2 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce RTX 208... Off | 00000000:02:00.0 On | N/A |
| 30% 29C P8 23W / 250W | 311MiB / 11016MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 1228 G /usr/lib/xorg/Xorg 18MiB |
| 0 1307 G /usr/bin/gnome-shell 57MiB |
| 0 1812 G /usr/lib/xorg/Xorg 110MiB |
| 0 1976 G /usr/bin/gnome-shell 122MiB |
+-----------------------------------------------------------------------------+
위 두 개의 nvidia-smi를 비교해 보면 알겠지만 Disp.A가 비활성화에서 활성화되어 있는 것을 볼 수 있을 것이다.
이번 troubleshooting에 답은 apt-get upgrade였지만, 사용자와 충분한 상의 후 진행해야 할 것이다.
또한 예전 test 중 apt-get upgrade 전과 후의 설치된 archive폴더의 deb 파일을 비교해 가면서
어떤 부분 때문에 GUI가 표기가 안되는지 test를 진행하였지만 결국 dependency를 물고 설치가 들어가면서 정답은
찾지 못하였다.
ubuntu18.04의 desktop version을 사용하게 된다면 최신 upgrade 후 사용하길 권장한다.
Nvidia RTX 30 시리즈 상세 스펙 (3090, 3080, 3070) (9) | 2020.09.03 |
---|---|
Nvidia RTX 30 시리즈 정보 (3090, 3080, 3070) (1) | 2020.09.02 |
nvidia-smi topo matrix 살펴보기 (2) | 2020.08.20 |
NVIDIA GPU 적정 온도는 어떻게 될까?? (0) | 2020.08.19 |
Nvidia gpu 장치 확인하는 방법 (4) | 2020.08.18 |