ITちゃんねる

仕事に役立つIT関連の最新ニュース

MicrosoftがLLM推論のGPU使用効率を向上させる「Splitwise」発表

MicrosoftがLLM推論のGPU使用効率を向上させる「Splitwise」発表

Splitwiseでは、LLM推論を2つのフェーズした上で別のマシンに割り当て、それぞれの特性に応じて利用するハードウェアが最適になるように設計することで、ハードウェアのコストを削減しながらスループットを最大化することに成功したという。