Yolo 추론 타일링 활용을 위한 이미지 크기

이미지 내에서의 작은 객체 탐지를 위해 불가피 하게 일반적인 학습 크기인 640이 아닌 1280으로 했습니다. [중요, 필독] FuriosaAI FAQ를 읽고 타일링에 대해 의문이 있어 질문 드립니다.

원본 이미지는 3040*1368의 사이즈이고 욜로모델 학습에서는 1280을 사용하였고 양자화도 똑같이 1280 사이즈로 해주었습니다. 추론을 위한 입력 이미지 크기는 보통 같으면 1280을 그대로 사용할테지만 512~768일 때 효율성이 높다고 하였습니다.

그러면 타일링을 통해 쪼개서 추론한다고 하셨는데 3040*1368인 원본 이미지 크기를 그대로 두고 이 원본 이미지를 1280*1280으로 부분 추론을 한다는 말씀이신지 궁금합니다. 또 타일링은 Furiosa 라이브러리에 쓸 수 있는 메소드가 구현되어있는지 궁급합니다. 감사합니다.

안녕하세요, 퓨리오사에이아이 김종욱입니다.

모델의 크기에 따라 다를 수 있지만, 효율성을 위해서는 512~768 정도의 사이즈가 YOLO에서 성능이 좋게 나온다로 이해하시면 됩니다.

타일링을 통해 쪼개서 추론한다는 것은, 3048*1368 원본이미지를 부분 추론 하여도 되고, 이걸 512~768 크기의 타일링을 통해 부분 추론을 해도 문제는 없습니다. 편한 작업의 형태는 현재 모델의 입력크기인 1280x1280으로 전처리 후에 실행하는 것이 편해보입니다. (성능에 문제가 없다면)

이러한 이유는 아시겠지만 객체 탐지에서 타일링은 경계면에 객체가 있는 경우 문제가 있을수도 있어 그를 해결하기 위한 작업들을 해야합니다. 이를 현재는 Furiosa 라이브러리에서 지원하고 있지는 않습니다.

2 Likes