드레스룸 시스템행거 인테리어

반응형

ubuntu18.04 desktop nvidia driver troubleshooting

 

 

 

 

오늘은 ubuntu18.04 desktop에서 login시 나타나는 문제점에 대해 트러블슈팅 관련 글을 

 

올려보겠다.

 

나도 ubuntu계열은 참 많이 설치해봤다고 생각한다. 수백번은 되지 않을까..

 

근데 그때그때마다 상황이 바뀌고 nvidia driver와 충돌이 생기고 GPU 카드 개수가 늘어남에

 

따라 출력 port도 바뀌고 하다 보니 그 순간순간 기록해 두고 저장해 두었다.

 

ubuntu16.04까지는 모든 문제를 해결했다고 생각이 들었는데 ubuntu18.04에서는 또 다른

 

문제점이 생기기 시작했다.

 

ubuntu18.04.3 desktop을 설치하고 이전과 같이 driver를 설치 하기 시작했다.

 

이때까지는 onboard vga출력 상황이다.

 

Tip - GUI OS 설치 후 ssh 접속 환경을 먼저 설정해두자.

 

 

 

 

nvidia driver install

 

# add-apt-repository ppa:graphics-drivers/ppa
# apt-get update
# apt-get install nvidia-driver-440
# reboot
# nvidia-smi
Thu Aug 20 13:57:22 2020
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 440.100      Driver Version: 440.100      CUDA Version: 10.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  GeForce RTX 208...  Off  | 00000000:02:00.0 Off |                  N/A |
| 28%   42C    P0    69W / 250W |      1MiB / 11016MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

 

다시 rebooting 후

 

onboard vga -> offboard로 bios 변경 후 2080Ti HDMI로 출력 하기 시작하였다.

 

그 후 위와 같은 화면으로 출력 후 ctrl + alt + f2 ~ f6까지 모든 화면에 접속에 제대로 되지 않는 상황 발생

 

위에 Tip에 말해 두었지만 이런 상황에 OS 재설치하기 싫다면 ssh 설정을 해둬야 한다.

 

이제부터 어떤 문제점인지 찾아야 한다.

 

 

 

 

gdm status

 

root@ckkim:~# systemctl status gdm
● gdm.service - GNOME Display Manager
   Loaded: loaded (/lib/systemd/system/gdm.service; static; vendor preset: enabled)
   Active: active (running) since Thu 2020-08-20 13:55:45 KST; 1min 51s ago
  Process: 1052 ExecStartPre=/usr/share/gdm/generate-config (code=exited, status=0/SUCCESS)
 Main PID: 1062 (gdm3)
    Tasks: 4 (limit: 4915)
   CGroup: /system.slice/gdm.service
           └─1062 /usr/sbin/gdm3

 8월 20 13:57:34 ckkim gdm3[1062]: Child process -8874 was already dead.
 8월 20 13:57:34 ckkim gdm3[1062]: Child process 8822 was already dead.
 8월 20 13:57:34 ckkim gdm3[1062]: Unable to kill session worker process
 8월 20 13:57:35 ckkim gdm-launch-environment][8915]: pam_unix(gdm-launch-environment:session): session opened for user gdm by (uid=0)
 8월 20 13:57:35 ckkim gdm-launch-environment][8915]: pam_unix(gdm-launch-environment:session): session closed for user gdm
 8월 20 13:57:35 ckkim gdm3[1062]: GdmDisplay: display lasted 0.357784 seconds
 8월 20 13:57:35 ckkim gdm3[1062]: Child process -8967 was already dead.
 8월 20 13:57:35 ckkim gdm3[1062]: Child process 8915 was already dead.
 8월 20 13:57:35 ckkim gdm3[1062]: Unable to kill session worker process
 8월 20 13:57:35 ckkim gdm-launch-environment][8984]: pam_unix(gdm-launch-environment:session): session opened for user gdm by (uid=0)

 

gdm 역시 정상으로 load 돼있다. 

 

ubuntu 16.04 까지는 gdm이 아닌 lightdm을 사용하였다.

 

 

 

 

nouveau check

 

root@ckkim:~# lsmod |grep -i nouveau

 

nouveau 역시 off 되어 있었다.

 

이상할 것 없는 상황이지만 이상했다.

 

 

 

 

nvidia driver reinstall

 

# apt-get purge nvidia*
# reboot                 
# apt-get install nvidia-driver-440

 

혹시나 하는 마음으로 nvidia driver를 변경하기로 하였다.

 

역시 동일한 상황의 반복이었다.

 

 

 

 

gdm -> wayland

 

# vim /etc/gdm3/custum.conf

# GDM configuration storage
#
# See /usr/share/gdm/gdm.schemas for a list of available options.

[daemon]
# Uncoment the line below to force the login screen to use Xorg
#WaylandEnable=false

# Enabling automatic login
#  AutomaticLoginEnable = true
#  AutomaticLogin = user1

# Enabling timed login
#  TimedLoginEnable = true
#  TimedLogin = user1
#  TimedLoginDelay = 10

[security]

[xdmcp]

[chooser]

[debug]
# Uncomment the line below to turn on debugging
# More verbose logs
# Additionally lets the X server dump core if it crashes
#Enable=true
#WaylandEnable=false
WaylandEnable=false

 

위에 gdm3 custum.conf에 wayland 부분을 주석 해제해 준다.

 

멀티 GPU를 사용하였을 때는 작업해줘야 했던 부분이었다.

 

역시 결과는 같아서 다시 파일을 원복 시켜주었다.

 

마지막으로 ubuntu18.04 처음 버전부터 문제가 생겼을 경우 wayland와 함께 문제를 해결해주는 하나의 경우의 수가

 

남아있었다.

 

 

 

 

apt-get upgrade

 

root@ckkim:~# apt-get upgrade
Reading package lists... Done
Building dependency tree
Reading state information... Done
Calculating upgrade... Done
The following packages were automatically installed and are no longer required:
  gir1.2-geocodeglib-1.0 libegl1-mesa libllvm8 libwayland-egl1-mesa ubuntu-web-launchers
Use 'apt autoremove' to remove them.
The following packages have been kept back:
  fwupd fwupdate fwupdate-signed netplan.io
The following packages will be upgraded:
...
...
...

 

apt-get upgrade 후 os 버전이 변경되었다.

 

root@ckkim:~# cat /etc/*release
DISTRIB_ID=Ubuntu
DISTRIB_RELEASE=18.04
DISTRIB_CODENAME=bionic
DISTRIB_DESCRIPTION="Ubuntu 18.04.3 LTS"
NAME="Ubuntu"
VERSION="18.04.3 LTS (Bionic Beaver)"
ID=ubuntu
ID_LIKE=debian
PRETTY_NAME="Ubuntu 18.04.3 LTS"
VERSION_ID="18.04"
HOME_URL="https://www.ubuntu.com/"
SUPPORT_URL="https://help.ubuntu.com/"
BUG_REPORT_URL="https://bugs.launchpad.net/ubuntu/"
PRIVACY_POLICY_URL="https://www.ubuntu.com/legal/terms-and-policies/privacy-policy"
VERSION_CODENAME=bionic
UBUNTU_CODENAME=bionic

=======================================================================================

root@ckkim:~# cat /etc/*release
DISTRIB_ID=Ubuntu
DISTRIB_RELEASE=18.04
DISTRIB_CODENAME=bionic
DISTRIB_DESCRIPTION="Ubuntu 18.04.5 LTS"
NAME="Ubuntu"
VERSION="18.04.5 LTS (Bionic Beaver)"
ID=ubuntu
ID_LIKE=debian
PRETTY_NAME="Ubuntu 18.04.5 LTS"
VERSION_ID="18.04"
HOME_URL="https://www.ubuntu.com/"
SUPPORT_URL="https://help.ubuntu.com/"
BUG_REPORT_URL="https://bugs.launchpad.net/ubuntu/"
PRIVACY_POLICY_URL="https://www.ubuntu.com/legal/terms-and-policies/privacy-policy"
VERSION_CODENAME=bionic
UBUNTU_CODENAME=bionic

 

version은 바뀌었지만 출력이 정상적으로 바뀌었다.

 

 

ubuntu18.04.1 version부터 GUI에 여러 문제가 생긴 것 같다.

 

onboard로 os설치 후 card 출력을 하느냐, card 출력 후 os설치를 바로 하느냐에 따라도 상황은 다르고

 

GPU 개수에 따라서도 달랐다. 

 

결국에 해결했던 부분은 wayland와 apt-get upgrade이다.

 

 

 

 

nvidia-smi disp.a

 

before

# nvidia-smi
Thu Aug 20 13:57:22 2020
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 440.100      Driver Version: 440.100      CUDA Version: 10.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  GeForce RTX 208...  Off  | 00000000:02:00.0 Off |                  N/A |
| 28%   42C    P0    69W / 250W |      1MiB / 11016MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

 

 

after

root@ckkim:~# nvidia-smi
Thu Aug 20 16:11:32 2020
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 440.100      Driver Version: 440.100      CUDA Version: 10.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce RTX 208...  Off  | 00000000:02:00.0  On |                  N/A |
| 30%   29C    P8    23W / 250W |    311MiB / 11016MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0      1228      G   /usr/lib/xorg/Xorg                            18MiB |
|    0      1307      G   /usr/bin/gnome-shell                          57MiB |
|    0      1812      G   /usr/lib/xorg/Xorg                           110MiB |
|    0      1976      G   /usr/bin/gnome-shell                         122MiB |
+-----------------------------------------------------------------------------+

 

위 두 개의 nvidia-smi를 비교해 보면 알겠지만 Disp.A가 비활성화에서 활성화되어 있는 것을 볼 수 있을 것이다.

 

이번 troubleshooting에 답은 apt-get upgrade였지만, 사용자와 충분한 상의 후 진행해야 할 것이다.

 

또한 예전 test 중 apt-get upgrade 전과 후의 설치된 archive폴더의 deb 파일을 비교해 가면서 

 

어떤 부분 때문에 GUI가 표기가 안되는지 test를 진행하였지만 결국 dependency를 물고 설치가 들어가면서 정답은

 

찾지 못하였다.

 

ubuntu18.04의 desktop version을 사용하게 된다면 최신 upgrade 후 사용하길 권장한다.

반응형

이 글을 공유합시다

facebook twitter kakaoTalk kakaostory naver band