[rngd] Furiosa SDK 2024.2 (Beta0) 펌웨어 error 및 온도 관련 문의

2번에 대한 답변 드립니다.
우선 RNGD에서 HBM의 Operating Temperature는 ~105도 입니다.
일반적으로 RNGD 내의 FW가 온도를 모니터링하고 온도에 따라 동작 속도를 throttlin하고 (예. 80도 이상일 경우 frequency를 조정), 115도를 넘어가면 동작을 종료시킵니다.
따라서 일반적으로 사용자가 직접 모니터링하고 종료시킬 필요는 없을 것입니다.

추가적으로 clock frequency는 내부적으로 DVFS에 의해 동작하여 사용자가 직접적으로 clock frequency를 알기는 어렵습니다.
일반적인 average power는 사용하는 모델에 따라 다릅니다만, llama 3.1을 mlperf와 같이 최대 load로 동작시킬 경우 현재 180W 정도 소모합니다.
(이후 릴리즈에서 지속적인 에너지 효율 향상이 있을 예정입니다)
idle power는 idle 상태에서 furiosa-smi로 확인하실 수 있으며, 현재는 약 38W 정도입니다.

감사합니다.