OpenCL Wrong Note — In-Order Queue에서도 커널이 겹쳐 실행된다고 착각했던 이유

2026-05-05

처음엔 in-order command queue에 kernel A, B를 연속 enqueue하면 드라이버가 알아서 일부를 겹쳐 실행할 수 있다고 생각했다. 하지만 기본 in-order queue에서는 enqueue 순서가 실행 순서가 된다.

핵심 정정:

같은 in-order queue에 들어간 커널은 앞선 커맨드가 완료되어야 다음 커맨드가 실행된다.
host가 non-blocking enqueue를 했더라도, 그것은 host thread가 즉시 돌아온다는 뜻이지 GPU 실행 중첩을 뜻하지 않는다.
실행 중첩을 원하면 보통
- out-of-order queue를 쓰거나,
- 여러 queue로 분리하고 이벤트 의존을 최소화해야 한다.

짧은 체크 포인트:

이 오해를 풀고 나면, “enqueue를 많이 하면 빨라진다”가 아니라 “의존 그래프를 어떻게 짜야 겹칠 수 있는가”가 핵심이라는 걸 바로 체감하게 된다.

jayinlab