위의 사진과 같이 오류가 발생합니다. 해결방안이 있을까요?
안녕하세요 FuriosaAI 김종욱입니다.
furiosactl info
명령어를 통해 인식되는 npu device가 있으신지 확인부탁드려도 괜찮으실까요?
네 warboy가 장착된 npu 2개가 잡힙니다.
해당 문제는 해결했지만, 다른 오류가 발생합니다. weight는 github 절차대로 변환하였습니다.
(eval_test) 1 mjkim1@promedius.dev@imdt:~/workspace/yolov5s$ python furiosa_eval.py --dfg_path=./yolov5s.dfg --eval_data_path=../coco/val2017 --eval_count=10 --output_path=./output
libfuriosa_hal.so --- v0.11.0, built @ 43c901f
Saving the compilation log into /home/mjkim1/.local/state/furiosa/logs/compile-20230906000629-7oujpj.log
Using furiosa-compiler 0.10.0 (rev: f8f05c8ea built at 2023-08-09T03:30:02Z)
2023-09-06T00:06:29.088901Z INFO nux::npu: Npu (npu0pe0-1) is being initialized
2023-09-06T00:06:29.094730Z INFO nux: NuxInner create with pes: [PeId(0)]
2023-09-06T00:06:29.115008Z INFO nux::npu: NPU (npu0pe0-1) has been destroyed
2023-09-06T00:06:29.130026Z ERROR nux::capi: incompatible model image: invalid value: integer `169282073`, expected variant index 0 <= i < 11
==========================================================================================================================================================================================================
Information Dump
==========================================================================================================================================================================================================
- Python version: 3.9.17 (main, Jul 5 2023, 20:41:20) [GCC 11.2.0]
- furiosa-libnux path: libnux.so
- furiosa-libnux version: 0.10.0 (rev: f8f05c8ea built at 2023-08-09T03:30:02Z)
- furiosa-compiler version: 0.10.0 (rev: f8f05c8ea built at 2023-08-09T03:30:02Z)
- furiosa-runtime version: 0.9.1-release (rev: a240782)
Please check the compiler log at /home/mjkim1/.local/state/furiosa/logs/compile-20230906000629-7oujpj.log.
If you have a problem, please report the log file to https://furiosa-ai.atlassian.net/servicedesk/customer/portals
with the information dumped above.
==========================================================================================================================================================================================================
Traceback (most recent call last):
File "/home/mjkim1/workspace/yolov5s/furiosa_eval.py", line 84, in <module>
main()
File "/home/mjkim1/workspace/yolov5s/furiosa_eval.py", line 31, in main
with furiosa.runtime.session.create(dfg_path) as session:
File "/home/mjkim1/miniconda3/envs/eval_test/lib/python3.9/site-packages/furiosa/runtime/session.py", line 474, in create
return Session(
File "/home/mjkim1/miniconda3/envs/eval_test/lib/python3.9/site-packages/furiosa/runtime/session.py", line 142, in __init__
raise into_exception(err)
furiosa.runtime.errors.IncompatibleModel: model binary is not compatible (native error code: 13)
해결되셨다니 다행입니다! 공유해주신 에러는 furiosa-runtime
과 furiosa-compiler
간 버전이 맞지않아 발생하는 문제입니다.
이전에 공유드렸던 yolv5s 깃허브가 SDK-0.9.1 기준으로 작성되어있어, 해당 버전 기준으로 해결 방법 안내해드립니다.
(1) 컴파일러 패키지 다운그레이드 - furiosa-libnux, furiosa-libcompiler 0.9.1-2
변경
sudo apt install libonnxruntime=1.13.1-2
sudo apt install furiosa-libcompiler=0.9.1-2
sudo apt install furiosa-libnux=0.9.1-2
(2) 파이썬 패키지 버전 맞추기
pip install "furiosa-sdk[full]"==0.9.2
(3) 양자화과정을 새로 실행하신 후 테스트 진행
위와 같은 순서로 진행해보시면 해결될 것으로 예상 됩니다. 감사합니다.
감사합니다. 잘 해결되었습니다!!
주가적으로 질문이 하나 있는데,
위 사진의 npu는 메모리가 어느정도인지 궁금합니다
말씀하신 메모리가 on-chip 메모리인지 아닌지 몰라 문서 공유드립니다. 현재 Warboy의 하드웨어 스펙은 SDK-문서에서 확인가능하십니다!
문서에서 명시하고 있는
Memory Size : 16 GB (max. 32 GB) 입니다.
저희가 일반적으로 GPU를 사용할때, nvidia-smi를 통해 GPU의 모델 메모리 상태를 확인할 수 있는데, 혹시 비슷한 기능의 명령어가 있을까요?
메모리 상태를 확인할 수 있는 명령어의 개발을 진행중에 있어, 현재로써는 사용하실 수가 없습니다.
다만, 모델 컴파일시 얻을 수 있는 summary를 바탕(모델이 차지하는 메모리량)으로 대략적이나마 동작하는 과정에서 어느정도의 메모리를 소비한다는 것을 유추하실 수 있습니다.
모든 답변 감사드립니다.
문제들을 해결하는데 큰 도움이 되었습니다