ITちゃんねる

仕事に役立つIT関連の最新ニュース

1GB未満のGPUメモリで動作するビジョン言語モデル「SmolVLM-256M」

1GB未満のGPUメモリで動作するビジョン言語モデル「SmolVLM-256M」

米Hugging Faceは1月23日(現地時間)、ビジョン言語モデル(VLM)「SmolVLM-256M」と「SmolVLM-500M」を発表した。2億5600万パラメータを持つSmolVLM-256Mは、Hugging Faceが2023年8月にリリースした「Idefics 80B」(800億パラメータ)の約312分の1という小さな規模で同等以上の性能を達成している。高度なビジョン言語タスクには20億パラメータ以上のサイズが必要と見られてきたが、「10分の1のサイズのモデルがビジネスにとって非常に有用であることを証明した」としている。