일단 고객사에 있는 VM을 생성하면서 PCIe를 Passthough를 하면서 발생한 오류였다.
정확한 오류는
internal error: qemu unexpectedly closed the monitor: XXXXX qemu-system-x86_64: -device vfio-pci,host=XXXX:XX:XX.X,id=hostdev0,bus=pci.0,addr=0x3: vfio XXXX:XX:XX.X: group 0 is not viable Please ensure all devices within the iommu_group are bound to their vfio bus driver.
대충 이런 오류였고, 해당 서버는 AMD CPU EPYC * 2 가 장착된 서버였고, M/B는 Gigabyte사의 ㄱR282-Z91보드를 사용한 커스텀 서버였다.
Ubuntu 18.04 LTS에서 작업을 하며, 발생한 부분이여서, 해외 포럼 등 을 찾아본 결과, BIOS단에서
값을 하나 바꿔주면 해결 되는 거 였다.
간단하게 해결 할 문제를 Ref Doc 없이 작업을 하니까 삽질만 계속했다 (서버실만 4번 들락날락 한 것 같다.)
해결법은 다음과 같다.
BIOS -> AMD CBS -> NBIO Common Options -> ACS Enable 를 Disable -> Enable
로 바꾸면 되는 문제였다.
다만 이상태에서, 저 항목이 보이지 않는다면, Enable AER Cap 이였나? 하는 항목을 Auto 로 돌리면, 바로 ACS Enable항목이 나타날 것이다.