Posts
총 108개 포스트
- OpenCL Sync Semantics — event COMPLETE와 memory visibility를 같은 것으로 보면 왜 깨지나 CL ADV
- OpenCL Queue/Event Model — 선형 큐가 아니라 dependency graph로 읽기 CL MID
- Descriptor/Pipeline Layout 호환 계약: 왜 드라이버는 '같아 보이는 바인딩'도 거절할까 CL MID
- PM4 packet ordering과 cache visibility를 분리해서 보기 CL ADV
- OpenCL 드라이버에서 UMD/KMD 동기화 계약: fence 신호와 cache visibility를 어디서 보장하나 CL ADV
- Roofline 모델 첫 실전 체크 — 지금 커널은 Compute-bound인가, Memory-bound인가 CL MID
- OpenCL Wrong Note: SPIR-V를 GPU 기계코드로 오해했던 문제 CL BEG
- Specialization Constant vs Push Constant vs UBO — 한눈에 정리 VK BEG
- clFinish는 디바이스 전체 대기가 아니다: queue 단위 완료를 정확히 보기 CL BEG
- ANGLE 소스로 보는 VkPipeline 증식 문제 — Specialization Constants와 ComputePipelineCache COMP MID
- OpenCL Wrong Note — In-Order Queue에서도 커널이 겹쳐 실행된다고 착각했던 이유 CL BEG
- OpenCL Wrong Note: event wait list를 많이 걸면 더 안전하고 빠르다? CL MID
- OpenCL에서 clWaitForEvents와 clFinish를 어떻게 나눠 써야 할까 CL MID
- OpenCL에서 clFlush와 clFinish를 언제 나눠 써야 하는가 CL BEG
- OpenCL Wrong Note: clFinish는 디바이스 전체 idle 보장이 아니다 CL BEG
- OpenCL barrier는 왜 work-group 내부에서만 동작할까 CL BEG
- SPIR-V에서 ISA까지: 드라이버 백엔드가 실제로 하는 일 CL MID
- Render Pass에서 Subpass Dependency를 왜 따로 쓰는가 VK MID
- PM4 EVENT_WRITE는 신호탄이고, 가시성은 FLUSH/INVALIDATE가 만든다 CL MID
- 오답노트 — Pipeline Layout(정적 계약)과 Descriptor Set(동적 값) 혼동 정리 CL MID
- 같은 SPIR-V인데 결과가 다른 이유 — Driver Lowering 관점 CL MID
- LDS bank conflict 기초 — 왜 같은 __local 접근인데 속도가 갈릴까 CL MID
- Tiny Dispatch에서 PM4가 얼마나 늘어나는지 직관적으로 보기 ▶ CL BEG
- work-group → wavefront: dispatch 한 번으로 GPU 안에서 무슨 일이 벌어지나 ▶ CL BEG
- OpenCL GWS/LWS가 Vulkan Dispatch로 내려갈 때 (택배 비유 포함) ▶ CL BEG
- Dispatch Granularity: tiny dispatch가 느린 이유 CL MID
- GPU 프로파일링 입문: kernel time 말고 무엇을 봐야 하나 CL MID
- Tiny Dispatch에서 진짜 병목: GPU 연산보다 Submit 경로 CL MID
- GPU Profiling 첫 실전 분해: RGP와 ROCm에서 어디를 먼저 볼까 CL MID
- OpenCL LDS bank conflict — __local 메모리가 느려지는 숨은 이유 CL MID
- OpenCL → Vulkan 변환 — clspv가 arg를 binding으로 바꾸는 전 과정 ▶ COMP MID
- OpenCL 큰 그림 — Platform에서 clFinish까지 한 번에 보기 ▶ CL BEG
- GPU 배송센터 심화편 — 박스가 트럭에 실리고 출발하는 전 과정 ▶ VK BEG
- 초등학생 큰 그림 — GPU를 배송센터로 보는 9단계 비유 ▶ CL BEG
- 객체 라이프사이클 — API 호출 순서와 실제 내부 작업 시점은 다르다 ▶ CL BEG
- clFinish의 내부 구현 — Fence, Semaphore, Event 완전 분해 ▶ VK MID
- Arg0→슬롯 미니 예제 — saxpy 커널 인자를 슬롯 매핑으로 구체화 ▶ COMP MID
- Vulkan Pipeline Stage 빠른 정리 — barrier에서 stage 마스크가 뜻하는 것 ▶ VK MID
- Memory Coalescing — global memory를 빠르게 쓰는 접근 패턴 ▶ CL MID
- Roofline 모델로 OpenCL 커널 병목 빠르게 판별하기 ▶ CL MID
- OpenCL Note #12 — AMD PM4 개요: Type3와 Dispatch 패킷 패밀리 PM4 MID
- PM4 제출 흐름 — vkQueueSubmit에서 GPU 실행까지 (Animation) ▶ PM4 MID
- PM4 Indirect Buffer — 커맨드 스트림 안의 커맨드 스트림 ▶ PM4 ADV
- AMD PM4 개요 — Type-3 패킷 구조와 Dispatch 패밀리 opcode PM4 MID
- OpenCL Note #02 — Build/Compile 경계, Binary Path, 캐시, clspv 관여 시점 COMP BEG
- OpenCL Note #03 — SPIR-V 최소 읽기법 (clspv 산출물 해석 시작) COMP BEG
- OpenCL Note #04 — clspv 실전: OpenCL C 하나를 SPIR-V로 읽어보기 COMP BEG
- OpenCL Note #05 — SPIR-V와 Vulkan Descriptor/Pipeline Layout 매핑 COMP MID
- OpenCL Note #11 — ANGLE+clspv+Vulkan first-run 지연 줄이기 실전 체크리스트 COMP MID
- OpenCL Note #24 — Arg0가 슬롯으로 떨어지는 미니 예제 COMP MID
- SPIR-V↔Vulkan 매핑 — OpDecorate에서 descriptor set까지 1:1 연결 COMP BEG
- SPIR-V 최소 읽기법 — compile chain vs submit chain, spirv-dis 5 포인트 COMP BEG
- first-run 지연 줄이기 — pipeline cache, warm-up, 측정 체크리스트 COMP MID
- clspv 실전 — vector_add 커널을 SPIR-V로 변환하고 대응표 만들기 COMP BEG
- Build/캐시 경계 — clCreateProgram vs clBuildProgram, 캐시 전략 COMP BEG
- OpenCL Note #10 — ANGLE 코드 추적 2차: SPIR-V에서 Vulkan Pipeline/Layout으로 ANGLE MID
- OpenCL Note #08 — ANGLE 코드 추적 1차: Entry → Build/Enqueue 경로 분리 ANGLE MID
- OpenCL Note #15 — 심화 시작: ANGLE 함수 체인 추적 킥오프 ANGLE ADV
- OpenCL Note #19 — 애니메이션 실험 #2 (JS v3): Compile Chain vs Submit Chain ▶ ANGLE MID
- OpenCL Note #17 — D1 초안: ANGLE 함수 체인 표(compile vs submit) ANGLE ADV
- ANGLE 추적 2차 — SPIR-V에서 Vulkan Pipeline/Layout 연결점 찾기 ANGLE MID
- ANGLE 추적 1차 — Entry에서 Build/Enqueue 경로 분리 지도 만들기 ANGLE MID
- ANGLE 체인 표 초안 — compile/submit 함수 체인 1차 맵 ▶ ANGLE ADV
- ANGLE 심화 킥오프 — compile/submit 체인 표 산출물 정의 ANGLE ADV
- ANGLE 분리 지도 — compile chain vs submit chain 개념적 분리 ▶ ANGLE MID
- OpenCL Note #01 — 객체 라이프사이클과 컴파일/디스패치 시점 CL BEG
- OpenCL Note #07 — 왜 이름이 pipeline이고 descriptor set일까? (역사/설계 관점) VK BEG
- OpenCL Note #06 — Vulkan 용어 직관: Descriptor Set/Layout, Pipeline Layout (비유로 이해) VK BEG
- OpenCL Note #14 — 심화 로드맵 Overview (다음 라운드) CL MID
- OpenCL Note #13 — 종합 다이어그램 + 최종 체크리스트 (S9) CL MID
- OpenCL Note #00 — 실습 키트 운용법 (노트 번호 연동) CL BEG
- OpenCL Note #16 — Pipeline/Layout/Descriptor 호환성 그림으로 이해하기 VK MID
- OpenCL 오답노트 #01 — DescriptorSet/Binding 매핑과 PM4 계층 CL MID
- OpenCL Note #18 — 애니메이션 실험 #1 (JS v3): Pipeline-Descriptor 호환/비호환 ▶ VK MID
- OpenCL Note #20 — D2 실습: local memory / barrier 커널에서 SPIR-V 읽기 CL MID
- OpenCL Note #21 — D3 시작: Vulkan 객체 생성 근거 표(채우는 법) VK ADV
- OpenCL Quiz Problem Bank #01 — ANGLE→clspv→SPIR-V→Vulkan→PM4 CL MID
- OpenCL 오답노트 #02 — 부분정답/부분오답 포함 복습 CL MID
- OpenCL Note #26 — 초등학생 버전 큰 그림: 박스 배송 시스템으로 보는 GPU CL BEG
- OpenCL Note #25 — 물류센터 비유로 외우는 전체 매핑 치트시트 CL MID
- OpenCL Note #23 — 왜 고정 슬롯/디스크립터 규칙이 빠른가 (장황 비유) VK MID
- OpenCL Note #22 — Vulkan 관점 10줄 타임라인 VK MID
- 퀴즈 문제 창고 #01 — 10개 핵심 개념 문제 + 펼치기 정답 CL MID
- 종합 다이어그램 — 전체 경로 한 장 정리 + 완료 체크리스트 CL MID
- 왜 이 이름인가 — pipeline, descriptor set, layout의 역사적 배경과 설계 철학 VK BEG
- 오답노트 #02 — 8개 항목 부분/완전 오답 정정 CL MID
- 오답노트 #01 — OpDecorate/Binding 매핑 오류, PM4 계층 오류 CL MID
- 심화 로드맵 — 학습 단계별 산출물과 순서 CL MID
- 실습 키트 운용법 — ~/opencl_study 폴더와 읽기-실행-비교 루프 CL BEG
- 물류센터 비유 치트시트 — OpenCL→clspv→Vulkan→PM4 전체 비유 매핑표 CL MID
- 고정 슬롯이 빠른 이유 — 슬롯 기반 계약의 성능 원리 VK MID
- Wavefront 스케줄링 & Latency Hiding — GPU가 메모리를 기다리지 않는 이유 ▶ HW MID
- Vulkan 용어 직관 — descriptor/pipeline/layout을 주방 비유로 이해 ▶ VK BEG
- Vulkan 객체 근거 표 — 4개 API의 파일/라인 근거 수집 VK ADV
- Vulkan 10줄 타임라인 — 생성(계약)과 실행(실물 바인딩) 10단계 VK MID
- vkCmdPipelineBarrier 깊이 파기 — GPU 동기화의 실제 동작 ▶ VK MID
- Occupancy — CU 슬롯을 얼마나 채웠나 ▶ HW MID
- local memory/barrier 실습 — __local + barrier 패턴 → SPIR-V 관찰 CL MID
- Layout 호환성 — 호환/비호환 제약의 성능 이점 ▶ VK MID
- GPU 메모리 계층 전체 지도 — Register에서 System RAM까지 ▶ HW MID
- zoxide 입문 가이드 - cd를 더 똑똑하게 BEG
- Ubuntu에서 자주 쓰는 CLI 유틸 설치 가이드 (fd, ripgrep 등) BEG
- ripgrep( rg ) 입문 가이드 - 코드/문서 안에서 텍스트 찾기 BEG
- fzf 입문 가이드 - 터미널에서 빠르게 선택하기 BEG
- fd 입문 가이드 - find보다 빠르게 파일 찾기 BEG
- eza 입문 가이드 - ls를 더 보기 좋게 BEG
- bat 입문 가이드 - cat보다 읽기 좋은 파일 출력 BEG
- OpenCL Note #09 — ANGLE 분리 지도(컴파일 체인 vs 커맨드 제출 체인) CL MID