안녕하세요 FuriosaAI 김종욱입니다. 질문주신 내용에 대하여 답을 드리면
양자화를 진행하는 경우에, 출력에 대하여 오차가 발생할 수 있습니다.
양자화를 진행하는 과정에서 보정 범위를 구하기 위해, 학습데이터 중 일부를 사용하게 되는데 이때 모델이 가질 수 있는 다양한 범위의 값을 잘 표현할 수 있는 데이터셋을 선정하여야 합니다.
즉, dequantize 된 float 형식의 값이라도 원본 모델과 달라질 수 있으며 이는 양자화시 사용한 데이터에 따라 영향을 많이 받고(학습 데이터 중 일부를 사용), 보정 범위를 계산할때 사용하는 CalibrationMethod 방법에 따라도 값이 달라질 수 있기 때문에 추가적인 테스트를 통하여 검증이 필요합니다.