ITちゃんねる

仕事に役立つIT関連の最新ニュース

大規模言語モデルの仕組みが目で見てわかる「Transformer Explainer」

大規模言語モデルの仕組みが目で見てわかる「Transformer Explainer」

GPT-4やLlama、Claudeといった大規模言語モデルは、2017年にGoogleの研究者が発表した「Transformer」というフレームワークの上に構築されています。このTransformerをベースにしたAIモデルがどのように機能するのかを視覚化したツール「Transformer Explainer」が、ジョージア工科大学のPolo Club of Data Scienceによって公開されています。