포스트 인덱스 — 모든 글 한눈에
이 페이지는 블로그의 모든 포스트가 무엇을 다루는지 한눈에 볼 수 있는 색인이다. 학습 로드맵은 → 학습 로드맵 참고.
OpenCL · Vulkan · PM4 · GPU 학습 시리즈
기초 — beginner
| 글 | 핵심 한 줄 | 시각화 |
|---|---|---|
| 실습 키트 운용법 | ~/opencl_study 폴더와 실습 흐름 | — |
| 객체 라이프사이클 | API 호출 순서와 실제 내부 작업 시점 분리 | mermaid |
| Build/캐시 경계 | clCreateProgram vs clBuildProgram, 캐시 전략 | mermaid |
| SPIR-V 최소 읽기법 | compile chain vs submit chain, spirv-dis 5 포인트 | mermaid |
| clspv 실전 | vector_add → SPIR-V 대응표 실습 | — |
| SPIR-V↔Vulkan 매핑 | OpDecorate → descriptor set 1:1 연결 | mermaid |
| Vulkan 용어 직관 | descriptor/pipeline/layout — 주방 비유 | animation |
| 왜 이 이름인가 | 용어의 역사적 배경과 설계 철학 | — |
중급 — intermediate
| 글 | 핵심 한 줄 | 시각화 |
|---|---|---|
| ANGLE 분리 지도 | compile chain vs submit chain 개념 분리 | animation |
| ANGLE 추적 1차 | Entry → Build/Enqueue 코드 경로 분리 | — |
| ANGLE 추적 2차 | SPIR-V → Vulkan Pipeline/Layout 연결점 | mermaid |
| first-run 지연 줄이기 | pipeline cache, warm-up, 측정 체크리스트 | — |
| AMD PM4 개요 | Type-3 패킷 구조, Dispatch 패밀리 opcode | — |
| 심화 로드맵 | 학습 단계별 산출물과 순서 | mermaid |
| 종합 다이어그램 | 전체 경로 한 장 정리 + 체크리스트 | mermaid |
심화 — intermediate~advanced
| 글 | 핵심 한 줄 | 시각화 |
|---|---|---|
| ANGLE 심화 킥오프 | compile/submit 체인 표 산출물 정의 | — |
| Layout 호환성 | 호환/비호환 제약의 성능 이점 | animation |
| ANGLE 체인 표 초안 | compile/submit 함수 체인 표 | animation |
| local memory/barrier 실습 | __local + barrier 패턴 → SPIR-V 관찰 | mermaid |
| Vulkan 객체 근거 표 | 4개 Vulkan API의 파일/라인 근거 수집 | — |
개념 강화 — intermediate
| 글 | 핵심 한 줄 | 시각화 |
|---|---|---|
| Vulkan 10줄 타임라인 | 10단계 실행 시퀀스 한눈에 | mermaid |
| 고정 슬롯이 빠른 이유 | 슬롯 기반 계약의 성능 원리 | — |
| Arg0→슬롯 미니 예제 | saxpy 커널 인자 → 슬롯 매핑 구체화 | — |
| 물류센터 비유 치트시트 | OpenCL→clspv→Vulkan→PM4 전체 비유 | — |
| 초등학생 큰 그림 | GPU를 배송센터로 보는 9단계 비유 | — |
| Memory Coalescing | global memory 접근 패턴 — coalesced vs strided | — |
| Pipeline Stage 정리 | barrier srcStage/dstStage/accessMask 의미 | — |
GPU 하드웨어 심층
| 글 | 핵심 한 줄 | 시각화 |
|---|---|---|
| PM4 제출 흐름 | vkQueueSubmit → PM4 → ring → GPU 7단계 | animation |
| GPU 메모리 계층 | Register~System RAM 6계층, latency/bandwidth | animation |
| Wavefront 스케줄링 | latency hiding, 1WF vs 4WF 비교 | animation |
| vkCmdPipelineBarrier | hazard vs 올바른 순서 2 시나리오 | animation |
| Occupancy | register/LDS 제한 → WF 슬롯 수 | animation |
| PM4 Indirect Buffer | Main Ring → IB 점프 → 실행 → 복귀 | animation |
| clFinish 내부 | Fence/Semaphore/Event, IT_EVENT_WRITE | mermaid |
오답 노트
| 글 | 정정 내용 |
|---|---|
| 오답노트 #01 | OpDecorate/Binding 매핑 오류, PM4 계층 오류 |
| 오답노트 #02 | 8개 항목 부분/완전 오답 정정 |
복습 노트
| 글 | 내용 |
|---|---|
| 퀴즈 문제 창고 #01 | 10개 핵심 개념 문제 + 펼치기 정답 |
용어 사전
→ Glossary — work-item, wavefront, pm4-packet, descriptor-set 등 15개 용어