Python

[Error해결]ResourceExhaustedError: OOM

mimi_Bo 2021. 4. 23. 01:21

예전에 서울대 연구실에서 인턴할 때 자주 봤던 Error라서 정말 잊을 수가 없는데 최근에 Colab에서 이것저것 구현해보면서 다시 자주 만나게 된 오류입니다.

🚫 오류

ResourceExhaustedError (see above for traceback): OOM when allocating tensor with 어쩌구저쩌구

OOM은 Out Of Memory라는 뜻이에요!

보통 오류가 생기면 내가 코드를 잘못 작성했나? 생각하게 되는데, 이 오류는 GPU가 감당을 못해서 생기는 오류입니다. 그러니 코드에 문제가 있어서 그런게 아니죠~

이 오류는 GPU 메모리 할당으로 인한 오류입니다.

✔ 해결방법

1. Batch Size를 줄여줍니다.

저는 보통 이 방법으로 이 오류를 해결했습니다.

저는 항상 처음 배치사이즈에 ÷2를 해서 해결했던 것 같아요.

2. GPU 할당량을 줄여줍니다.

GPU할당량이 0.9이상이면 보통 이러한 메모리 할당 오류가 나는 것 같습니다.