状況

amdgpuドライバに関して永遠とエラーメッセージが出ます。GNOMEの通知も出っぱなしでAbrtを開くと数日で1000以上この通知が出ます。PCを新調してから9ヶ月ずっと出てて… ようやく解決出来たので報告します。ただし、カーネルアップデートにより修正された可能性も否定できませんので、もうfixされているかもしれません。

システム構成

CPUとメモリはCPU: Ryzen 5 2400G、マザボ: ASRock B450M Steel Legendで組んでおります。タイトルの通りにぐぐるとAPUな環境だと出るエラーメッセージのようでRyzen 3 2200GとかAthlon XXXGEシリーズでも出ているようです。

エラーメッセージ

エラーメッセージは以下のように表示されます。gnome-abrtの結果です。 kernel-abrt-amdgpu

journalctlからの抜粋を載せると、以下のように出てます。

------------[ cut here ]------------
 4月 17 23:26:14 .jp kernel: WARNING: CPU: 7 PID: 482 at drivers/gpu/drm/amd/amdgpu/../display/dc/core/dc_link.c:1775 write_i2c_retimer_setting+0xc5/0x3e0 [amdgpu]
 4月 17 23:26:14 .jp kernel: Modules linked in: hid_logitech_hidpp(+) amdgpu(+) amd_iommu_v2 gpu_sched i2c_algo_bit ttm drm_kms_helper crc32c_intel nvme uas drm usb_storage nvme_core r8169 hid_logitech_dj wmi video pinctrl_amd i2c_dev fuse
 4月 17 23:26:14 .jp kernel: CPU: 7 PID: 482 Comm: systemd-udevd Not tainted 5.5.16-200.fc31.x86_64 #1
 4月 17 23:26:14 .jp kernel: Hardware name: To Be Filled By O.E.M. To Be Filled By O.E.M./B450M Steel Legend, BIOS P2.90 11/27/2019
 4月 17 23:26:14 .jp kernel: RIP: 0010:write_i2c_retimer_setting+0xc5/0x3e0 [amdgpu]
 4月 17 23:26:14 .jp kernel: Code: b6 4c 24 16 44 89 e2 44 0f b6 44 24 17 44 0f b6 c8 48 c7 c6 78 c6 93 c0 bf 04 00 00 00 45 89 cd e8 a0 21 c7 ff 45 84 ed 75 02 <0f> 0b 0f b6 44 5d 02 8d 50 f6 80 fa 02 77 88 3c 0a 0f 85 c5 00 00
 4月 17 23:26:14 .jp kernel: RSP: 0018:ffffab4f80f831b8 EFLAGS: 00010246
 4月 17 23:26:14 .jp kernel: RAX: 0000000000000000 RBX: 0000000000000000 RCX: 000000000000000a
 4月 17 23:26:14 .jp kernel: RDX: 000000000000005d RSI: ffffffffc093c678 RDI: 0000000000000004
 4月 17 23:26:14 .jp kernel: RBP: ffffab4f80f83215 R08: 0000000000000013 R0
4月 17 23:26:14 .jp kernel: R10: 0000000000000001 R11: 0000000000000300 R12: 000000000000005d
 4月 17 23:26:14 .jp kernel: R13: 0000000000000000 R14: ffff9d9a3ee10658 R15: ffffab4f80f831ce
 4月 17 23:26:14 .jp kernel: FS:  00007faaf94fe940(0000) GS:ffff9d9a507c0000(0000) knlGS:0000000000000000
 4月 17 23:26:14 .jp kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
 4月 17 23:26:14 .jp kernel: CR2: 00007f7ac47b8000 CR3: 000000038326e000 CR4: 00000000003406e0
 4月 17 23:26:14 .jp kernel: Call Trace:
 4月 17 23:26:14 .jp kernel:  core_link_enable_stream+0x6c6/0x700 [amdgpu]
 4月 17 23:26:14 .jp kernel:  dce110_apply_ctx_to_hw+0x55a/0x5a0 [amdgpu]
 4月 17 23:26:14 .jp kernel:  dc_commit_state+0x2b9/0x5e0 [amdgpu]
 4月 17 23:26:14 .jp kernel:  amdgpu_dm_atomic_commit_tail+0x34a/0x2090 [amdgpu]
 4月 17 23:26:14 .jp kernel:  ? ktime_get_raw+0x2e/0x80
 4月 17 23:26:14 .jp kernel:  ? fill_dc_plane_info_and_addr+0x340/0x340 [amdgpu]
 4月 17 23:26:14 .jp kernel:  ? dm_plane_helper_prepare_fb+0x21a/0x2a0 [amdgpu]
 4月 17 23:26:14 .jp kernel:  commit_tail+0x94/0x130 [drm_kms_helper]
4月 17 23:26:14 .jp kernel:  drm_atomic_helper_commit+0x113/0x140 [drm_kms_helper]
 4月 17 23:26:14 .jp kernel:  drm_client_modeset_commit_atomic+0x1c9/0x200 [drm]
 4月 17 23:26:14 .jp kernel:  drm_client_modeset_commit_force+0x50/0x150 [drm]
 4月 17 23:26:14 .jp kernel:  drm_fb_helper_restore_fbdev_mode_unlocked+0x49/0xa0 [drm_kms_helper]
 4月 17 23:26:14 .jp kernel:  drm_fb_helper_set_par+0x2c/0x50 [drm_kms_helper]
 4月 17 23:26:14 .jp kernel:  fbcon_init+0x2a9/0x5e0
 4月 17 23:26:14 .jp kernel:  visual_init+0xce/0x130
 4月 17 23:26:14 .jp kernel:  do_bind_con_driver+0x1b9/0x2a0
 4月 17 23:26:14 .jp kernel:  do_take_over_console+0x115/0x180
 4月 17 23:26:14 .jp kernel:  do_fbcon_takeover+0x58/0xb0
 4月 17 23:26:14 .jp kernel:  register_framebuffer+0x1e4/0x300
 4月 17 23:26:14 .jp kernel:  __drm_fb_helper_initial_config_and_unlock+0x2fa/0x440 [drm_kms_helper]
 4月 17 23:26:14 .jp kernel:  amdgpu_fbdev_init+0xbc/0xf0 [amdgpu]
 4月 17 23:26:14 .jp kernel:  amdgpu_device_init.cold+0x1554/0x19b7 [amdgpu]
 4月 17 23:26:14 .jp kernel:  amdgpu_driver_load_kms+0x53/0x1a0 [amdgpu]
 4月 17 23:26:14 .jp kernel:  drm_dev_register+0x111/0x150 [drm]
4月 17 23:26:14 .jp kernel:  amdgpu_pci_probe+0xec/0x150 [amdgpu]
 4月 17 23:26:14 .jp kernel:  ? __pm_runtime_resume+0x58/0x80
 4月 17 23:26:14 .jp kernel:  local_pci_probe+0x42/0x80
 4月 17 23:26:14 .jp kernel:  pci_device_probe+0x107/0x1a0
 4月 17 23:26:14 .jp kernel:  really_probe+0x147/0x3c0
 4月 17 23:26:14 .jp kernel:  driver_probe_device+0xb6/0x100
 4月 17 23:26:14 .jp kernel:  device_driver_attach+0x53/0x60
 4月 17 23:26:14 .jp kernel:  __driver_attach+0x8a/0x150
 4月 17 23:26:14 .jp kernel:  ? device_driver_attach+0x60/0x60
 4月 17 23:26:14 .jp kernel:  ? device_driver_attach+0x60/0x60
 4月 17 23:26:14 .jp kernel:  bus_for_each_dev+0x78/0xc0
 4月 17 23:26:14 .jp kernel:  bus_add_driver+0x14d/0x1f0
 4月 17 23:26:14 .jp kernel:  driver_register+0x6c/0xc0
 4月 17 23:26:14 .jp kernel:  ? 0xffffffffc0ae5000
 4月 17 23:26:14 .jp kernel:  do_one_initcall+0x46/0x200
 4月 17 23:26:14 .jp kernel:  ? _cond_resched+0x15/0x30
 4月 17 23:26:14 .jp kernel:  ? kmem_cache_alloc_trace+0x162/0x220
 4月 17 23:26:14 .jp kernel:  ? do_init_module+0x23/0x230
 4月 17 23:26:14 .jp kernel:  do_init_module+0x5c/0x230
 4月 17 23:26:14 .jp kernel:  load_module+0x28c2/0x2b20
 4月 17 23:26:14 .jp kernel:  ? __do_sys_init_module+0x16e/0x1a0
 4月 17 23:26:14 .jp kernel:  __do_sys_init_module+0x16e/0x1a0
 4月 17 23:26:14 .jp kernel:  do_syscall_64+0x5b/0x1c0
4月 17 23:26:14 .jp kernel:  entry_SYSCALL_64_after_hwframe+0x44/0xa9
 4月 17 23:26:14 .jp kernel: RIP: 0033:0x7faafa4b50fe
 4月 17 23:26:14 .jp kernel: Code: 48 8b 0d 8d fd 0b 00 f7 d8 64 89 01 48 83 c8 ff c3 66 2e 0f 1f 84 00 00 00 00 00 90 f3 0f 1e fa 49 89 ca b8 af 00 00 00 0f 05 <48> 3d 01 f0 ff ff 73 01 c3 48 8b 0d 5a fd 0b 00 f7 d8 64 89 01 48
 4月 17 23:26:14 .jp kernel: RSP: 002b:00007fff1d669f68 EFLAGS: 00000246 ORIG_RAX: 00000000000000af
 4月 17 23:26:14 .jp kernel: RAX: ffffffffffffffda RBX: 00005641038a5ea0 RCX: 00007faafa4b50fe
 4月 17 23:26:14 .jp kernel: RDX: 00007faafa0d684d RSI: 00000000009205ae RDI: 0000564104163b10
 4月 17 23:26:14 .jp kernel: RBP: 0000564104163b10 R08: 0000000000000006 R09: 00007fff1d6683be
 4月 17 23:26:14 .jp kernel: R10: 0000000000000007 R11: 0000000000000246 R12: 00007faafa0d684d
 4月 17 23:26:14 .jp kernel: R13: 0000000000000001 R14: 0000564103867650 R15: 00005641038a5ea0
 4月 17 23:26:14 .jp kernel: ---[ end trace 54e5b8e056f80ea9 ]---

これはほんの一部で5,6秒に1回出ていてもっと色々な症状が表示されてますね…

解決方法

解決方法はカーネルオプションを追加します。ただし、この追加でGNOMEなどのDEなどの画面描画についてトラブルが出る可能性もあるかもしれません。

/etc/default/grub

sudo vim /etc/default/grubなど管理者権限でgrubファイルを開いて

GRUB_CMDLINE_LINUX_DEFAULT=”amdgpu.noretry=0"

と1行を追加して下さい。もうすでに指定しているものがあるなら半角スペースで空けて""の中にamdからの項目を書いてくださいね。

grub2-mkconfig

/etc/default/grubファイルを編集したら、grub.cfgファイルを生成するために以下を実行して下さい。

BIOSなPCをお使いな方は

sudo grub2-mkconfig -o /etc/grub2.cfg

UFEIなPCをお使いな方は

sudo grub2-mkconfig -o /boot/efi/EFI/fedora/grub.cfg

grub.cfgが生成されれば再起動してください。

まとめ

今回解決したamdgpuドライバのエラーを黙らせることが出来たお陰でGNOMEの通知が平和です… ただし、起動時にGNOMEの通知が3個は出てます。abrtでは1回で同時に5,6個出るのですがそれ以降は使っていても今の所出ていない様子。journalctlを見ると起動時にいーーーーぱい出てますがその後しばらくは出てないっぽいです。まだ様子見が必要かも…