OpenCL barrier는 왜 work-group 내부에서만 동작할까

2026-04-27

질문 핵심: barrier는 work-group 간 동기화가 아닌가? 정답: 아니다. barrier는 같은 work-group 내부에서만 유효하다.

OpenCL barrier 범위 + API 연결 시뮬레이터

Step 0 / 6

시작 다음 단계를 눌러 barrier의 실제 범위와 clFinish/event wait의 역할을 구분해서 보세요.

Work-group A

idle

↕

Work-group B

idle

↕

Kernel 내부
barrier

아직 없음

↕

Host API

enqueue

왜 group 간 barrier가 없을까

즉 OpenCL은 커널 내부 barrier 범위를 group 내부로 제한한다.

헷갈리기 쉬운 포인트를 API 기준으로 분리하면:

barrier()
- 커널 코드 내부에서 사용
- 같은 work-group 내부 work-item 동기화
clFinish(queue)
- 호스트 API
- 해당 queue에 이미 들어간 작업이 전부 끝날 때까지 CPU가 기다림
- 즉 “group 간 barrier"가 아니라 “커널 경계에서 전체 완료를 기다리는 방식”
event wait (clWaitForEvents, enqueue wait list)
- clFinish보다 더 정밀하게 특정 작업 의존성만 걸 수 있음
- 실무에서는 전체 stall을 줄이기 위해 event 기반 동기화를 선호하는 경우가 많다

즉 커널 경계 + 이벤트 의존성으로 단계 동기화를 만든다.