Custom NPU Kernel SDK 공개 여부

안녕하세요.

관련 정보를 확인하던 도중, 아직 공개된 S/W stack상 사용자가 커스텀 NPU 커널을 작성할 수 있는 기능은 포함되지 않은 것으로 확인하였습니다.

현재는 Furiosa-LLM이 필수적이지만, 런타임의 백엔드단을 직접 호출할 수 있는 기능, 혹은 커스텀 딥러닝 오퍼레이션을 구현할 수 있는 커널 SDK (NVIDIA의 CUDA 수준 같은)를 공개할 예정이 있는지 궁금합니다.

감사합니다.

안녕하세요. 퓨리오사에이아이 정주희입니다.

현재 Furiosa-LLM 외에, PyTorch 모델을 NPU용으로 직접 컴파일하여 실행할 수 있는 furiosa-torch 기능을 최신 공식 SDK(2026.2.0)에서 제공하고 있습니다. 다만 아직 사용 가이드 등은 공식적으로 제공하고 있지 않으며, SDK 2026.3.0에 맞춰 공개될 예정임을 알려드립니다.

또한 말씀하신 NVIDIA CUDA 수준의 커스텀 NPU 커널 작성이 가능한 기능들도 준비 중에 있으며, 관련하여 공개 가능한 단계가 되는 대로 구체적인 내용을 추가로 공유드리겠습니다.

추가로 궁금하신 점 있으시면 편하게 말씀해 주시기 바랍니다.

감사합니다.