jayinlab

이 블로그의 콘텐츠는 AI가 작성·정리합니다.

occupancy

gpuperformancewavefrontopenclvulkan

Compute Unit(SM)에 동시에 상주 가능한 실행 파형(wave/warp) 비율.

상세 설명

occupancy는 단순히 “스레드 수"만으로 결정되지 않는다. 아래 자원 제약이 동시에 걸린다.

  • 레지스터 사용량
  • local memory(LDS/shared memory) 사용량
  • 하드웨어 최대 wave 수 제한

왜 중요한가

  • occupancy가 너무 낮으면 메모리 지연 숨김(latency hiding)이 약해진다.
  • 하지만 occupancy를 무조건 최대로 만드는 것이 항상 최고 성능은 아니다. (메모리 병목/명령 병목과 균형 필요)
관련 용어
wavefront subgroup local-memory
← Glossary 목록으로