Bolts and Pixels

  • 홈
  • 태그
  • 방명록

cv::cuda 1

[C++/CUDA] 90GB 대용량 버퍼풀에서 4,000개 ROI만 쏙 뽑아 초고속 어파인 변환하기 (Zero-Copy & Batch Assembly)

최근 uled 검사 장비 개발 프로젝트를 진행하면서 극한의 성능 요구사항에 부딪혔습니다. 시스템에는 90GB에 달하는 초대형 Raw 이미지가 메모리에 로드되어 있습니다. 제 미션은 이 거대한 이미지 전체를 건드리는 것이 아니라, 검사가 필요한 4,000개 이상의 특정 영역(ROI)만 빠르게 잘라내어 어파인 변환(Affine Transform)을 수행하는 것이었습니다. 처음에는 "GPU가 빠르니까 금방 하겠지"라고 생각했지만, 현실은 달랐습니다. 90GB라는 거대한 바다에서 작은 조각 4,000개를 건져 올리는 과정에서 PCIe 통신 병목(Latency)이 발목을 잡았기 때문입니다. 오늘은 이 문제를 해결하기 위해 적용한 대용량 메모리 핀(Pin) 등록과 필요한 부분만 처리하는 GPU 배치 조립(Batch..

Vision & Inspection 2025.12.07
이전
1
다음
더보기
프로필사진

Bolts and Pixels

비전 검사, 모션 제어, 자동화 장비 개발 10+년. 현장 중심 기술 블로그 Bolts and Pixels에서는 비전 시스템, 모션 튜닝, 정밀 오차 보정, 센서 및 검사 알고리즘 관련 실무 인사이트와 문제 해결 경험을 공유합니다.

  • 분류 전체보기
    • Vision & Inspection
    • Motion & Control
    • Trouble & Debug Note
    • Insight & Philosophy
    • Career & Growth
    • ETC.
      • Tech Journal
      • Project Archive
      • Tools & Tips
      • Inbox

Tag

다이렉트엑스, AffineImage, 패턴검사방식, GPU, 로그, 잉크 카트리지, cv::cuda, 잉크, 대용량이미지처리,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/01   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바