ITちゃんねる

仕事に役立つIT関連の最新ニュース

GPT4を使ってGPT3.5をハッキングしてジェイルブレイクすることはできるのか?

GPT4を使ってGPT3.5をハッキングしてジェイルブレイクすることはできるのか?

OpenAIの大規模言語モデルであるGPTシリーズは、人間並みに自然な文章を生成することが可能ですが、ひわいな言葉や犯罪的な内容を含む発言は生成しないように制限が加えられています。GPT-3.5に設けられたこの制限を取り外す「ジェイルブレイク(脱獄)」という行為を、記事作成時点で最新モデルであるGPT-4を使って試してみた結果を、エンジニアのRaghav Toshniwal氏が公開しています。