--target-npu warboy-2pe 컴파일 에러

$ furiosa-compile detection_model_9281408_simplified_quant.onnx --target-npu warboy
위 명령어로 컴파일을 진행하면 컴파일은 성공하지만 추론을 진행할때 아래와 같은 에러가 발생하고

(warboy) clapi@sysadmin-B7105F48TV4HR-2T-N:~/ocr_npu/innocr/npu/model/detector$ python infer_multi_backend.py --image /home/clapi/ocr_npu/innocr/mods/ocr/detection/bankbook.png --backend furiosa --model 
output.enf --output ./results/result_570880_furiosa.json                                                                                                                                                   
2025-08-14T08:09:07.819789Z  INFO furiosa_rt_core::driver::event_driven::coord: FuriosaRT (v0.10.5, rev: 5537afb71-modified, built at: 2025-01-10T02:06:37Z) bootstrapping ...                             
2025-08-14T08:09:07.826289Z  INFO furiosa_rt_core::driver::event_driven::coord: Found furiosa-compiler (v0.10.1, rev: 8b00177, built at: 2025-01-08T03:45:42Z)                                             
2025-08-14T08:09:07.826320Z  INFO furiosa_rt_core::driver::event_driven::coord: Found libhal (type: warboy, v0.12.0, rev: 56530c0 built at: 2023-11-16T12:34:03Z)                                          
2025-08-14T08:09:07.826334Z  INFO furiosa_rt_core::driver::event_driven::coord: [Runtime-0] detected 1 NPU device(s):                                                                                      
2025-08-14T08:09:07.853798Z  INFO furiosa_rt_core::driver::event_driven::coord: - [0] npu:0:0-1 (warboy-b0-2pe, 128dpes, firmware: 1.7.7, 386a8ab)                                                         
2025-08-14T08:09:07.854009Z  INFO furiosa_rt_core::driver::event_driven::coord: [Runtime-0] started                                                                                                        
2025-08-14T08:09:07.855448Z  INFO furiosa::runtime: Saving the compilation log into /home/clapi/.local/state/furiosa/logs/compiler-20250814170907-vuur4l.log                                               
2025-08-14T08:09:07.897038Z  INFO furiosa_rt_core::driver::event_driven::coord: [Runtime-0] created Sess-b1688724 using npu:0:0-1                                                                          
2025-08-14T08:09:07.923942Z  INFO furiosa_rt_core::driver::event_driven::coord: [Sess-b1688724] compiling the model (target: warboy-b0-2pe, 128dpes, file: output.enf, size: 51.2 MiB)                     
2025-08-14T08:09:09.711727Z  INFO furiosa_rt_core::driver::event_driven::coord: [Sess-b1688724] the model compile is successful (took 1 secs)                                                              
2025-08-14T08:09:09.722798Z  INFO furiosa_rt_core::driver::event_driven::coord: compilation failed, unloading npu:0:0-1                                                                                    
2025-08-14T08:09:09.722838Z ERROR furiosa_rt_core::driver::event_driven::coord: [Runtime-0] EventLoop shutting down due to a FATAL ERROR: "Model and device configuration mismatch (num_slice: 64 != 128)" 
Traceback (most recent call last):                                                                                                                                                                         
  File "/home/clapi/ocr_npu/innocr/npu/model/detector/infer_multi_backend.py", line 124, in <module>                                                                                                       
    main()                                                                                                                                                                                                 
  File "/home/clapi/ocr_npu/innocr/npu/model/detector/infer_multi_backend.py", line 120, in main                                                                                                           
    run_furiosa(args.image, args.output, args.model)                                                                                                                                                       
  File "/home/clapi/ocr_npu/innocr/npu/model/detector/infer_multi_backend.py", line 78, in run_furiosa                                                                                                     
    session = frt.session.create(compiled_model_path)                                                                                                                                                      
  File "<string>", line 70, in wrapped                                                                                                                                                                     
runtime.SessionTerminated: runtime has been already terminated

$ furiosa-compile detection_model_9281408_simplified_quant.onnx --target-npu warboy-2pe 다음과 같이 컴파일을 진행하면 아래와 같은 에러가 발생합니다.

(warboy) clapi@sysadmin-B7105F48TV4HR-2T-N:~/ocr_npu/innocr/npu/detector$ furiosa-compile detection_model_9281408_simplified_quant.onnx --target-npu warboy-2pe                                 [1547/1933]
[1/6] 🔍   Compiling from onnx to dfg
Done in 1.3023801s
[2/6] 🔍   Compiling from dfg to ldfg
▪▪▪▪▪ [1/3] Splitting graph(LAS)...Done in 190.87357s
▪▪▪▪▪ [2/3] Lowering graph(LAS)...Done in 241.3251s
ERROR: failed to lower the operator#3:
Conv2d
Padding { top: 0, left: 0, bottom: 0, right: 0 }
stride: (H: 1, W: 1), dilation: (H: 1, W: 1),
clipping: (Min: -inf, Max: inf),
groups: 1
name: 
  /Concat_output_0

input tensors: 3
  input tensor 3279: [1x1536x29x44] NxCxHxW, 1959936 B, i8
(axes: [], <(m:-110.96511840820313, M:126.94270324707031) x 1>)
(s: 0.9329718496285233, o: -9) x 1
  source: unknown
  input tensor 2192: [1920x1x1x1536] NxHxWxC, 2949120 B, i8
(axes: [], <(m:-128, M:127) x 1>)
(s: 1, o: 0) x 1
  source: unknown
  input tensor 2193: [1920] W, 7680 B, i32
(axes: [], <(m:-2003541791.1215687, M:2003541790.1885967) x 1>)
(s: 0.9329718496285233, o: 0) x 1
  source: unknown
  total bytes: 4916736
output tensors: 1
  output tensor 3280: [1x1920x29x44] NxCxHxW, 2449920 B, i8
(axes: [], <(m:-110.96511840820313, M:126.94270324707031) x 1>)
(s: 0.9329718496285233, o: -9) x 1
  source: unknown
  total bytes: 2449920
error: Other error

–target-npu warboy-2pe으로 컴파일시 에러를 해결할 방법을 문의드립니다.

안녕하세요, 퓨리오사에이아이 이지수입니다.

  1. 해당 명령어로 컴파일 시, pe 1개만을 사용하게 컴파일이 진행되는데, 추론 시 pe 2개를 fusion 하게 사용해서 발생하는 오류입니다. 추론을 진행하시는 코드에서 pe 1개만 사용하도록 지정해주시면 해결할 수 있는 오류로 보입니다.
  2. 해당 오류의 경우, 모델을 직접 확인해봐야 정확한 오류 원인 파악이 가능할 것 같습니다.

감사합니다.

추론을 진행하는 코드에서 pe 1개만 사용하도록 지정하는 방법이 적힌 튜토리얼이 있을까요?

아래 문서를 참고하시면 좋겠습니다. 예제는 그림으로 첨부했습니다.