이미지 크기 및 모델종류에 따른 npu 성능 차이

안녕하십니까, NIPA 국산 AI반도체 활용사업을 통해 furiosa의 warboy NPU를 사용중 입니다.

현재 NPU_2qn_Warboy_tutorial pdf교육자료와 강의 영상을 통해서 실제 저희 모델을 테스트 중입니다. furiosa_runtime_queue.py를 참고하여 저희 모델에 맞게 간단하게 수정하여 비동기로 진행하였습니다. result.jpg를 보시면 실행결과를 확인하실 수 있는데, 총 2344초(약 40분) 정도 소요되었습니다. 교육 자료에서는 약 9초 정도 소요되어 성능이 원래 이정도로 차이나는지 궁금합니다.

교육자료와 제가 실행한것의 차이를 설명드리겠습니다.

교육자료에서는 기본모델을 공식 yolov8n.pt모델로 사용하였고 저는 배포된 yolo12n.pt 모델을 커스텀하여 두 가지 객체를 탐지하는 모델을 사용하였습니다. 이때 교육자료와 다르게 커스텀 학습할 당시 입력이미지 크기를 1280 * 1280으로 하였습니다. 그 이후의 후처리 코드와 양자화 코드에서도 1280의 이미지크기를 사용하였습니다. 추론에 사용되는 입력이미지는 교육자료에 나와있지는 않지만 zip파일을 통해 확인해보면 640 * 427의 크기였고 제가 사용한 이미지는 3040 * 1368 이미지 사이즈입니다.

안녕하세요, 퓨리오사에이아이 김종욱입니다.

우선 Warboy에서는 YOLOv12 모델은 가속이 어려운 구조를 가지고있어, 사용하신 프로젝트에서도 지원 모델에서 제외한 상태입니다.

1 Like