ITちゃんねる

仕事に役立つIT関連の最新ニュース

GPT-4oはどのように画像をエンコードしてトークンに分解しているのか?

GPT-4oはどのように画像をエンコードしてトークンに分解しているのか?

AIチャットサービス「ChatGPT」のモデルの1つ、GPT-4oは、人間から受け取ったテキストをまず「トークン」に処理した後、AIが扱いやすい数値ベクトルに変換して計算を行います。画像でも同様の処理を行いますが、その際にどのような処理をしているのか、プログラマーのオラン・ルーニー氏が推測しました。