【深層学習】ハルシネーションについて学ぼう

本記事ではハルシネーションについて解説しています。
目次は以下の通りです。

ハルシネーションとは

ハルシネーションは、人工知能が事実に基づかない情報を生成する現象であり、その中でもっともらしいウソ、つまり事実とは異なる内容や文脈と無関係な情報が生成されることが特徴です。
ハルシネーションは英単語で和訳すると幻覚を見るという意味になります。これが幻覚みたいであることからハルシネーションとつけられています。

ハルシネーションの種類

ハルシネーションの種類は大きく分けて2つあります。違いを一言でいうと学習データに基づいているが基づいていないかですね。
それぞれ「Intrinsic Hallucinations」と「Extrinsic Hallucinations」があります。
Intrinsic Hallucinationsとは学習データに基づいているが、事実と異なる情報を生成する現象で、Extrinsic Hallucinationsとは学習データには存在しない事実を新しく生成する現象です。

具体例を用いて考えましょう。
例えば「Aさんは東京で電車に乗った」という学習データを入力したとしましょう。ここで、「Intrinsic Hallucinations」が起こる例としては「Bさんは東京で電車に乗った」と回答が出力されます。つまり、データから違うということがわかります。
一方で「Extrinsic Hallucinations」が起こる例としては「Aさんは東京で電車に乗り、羽田空港に向かった」と回答が出力されます。つまり、学習データからのみだと真実とは限らないことがわかります

ハルシネーションの原因と対策

ハルシネーションの原因として以下のものがあげられます。

・誤ったデータの活用
・データの学習不足

対策として以下のものがあげられます。

・ファクトチェック
・学習データの質の向上

まとめ

本記事のポイントを以下にまとめます。

・ハルシネーションは、人工知能が事実に基づかない情報を生成する現象
・大きく分けて「Intrinsic Hallucinations」と「Extrinsic Hallucinations」がある
・データの質が原因であり、ファクトチェックや学習データの質を上げることで対策

コメント

タイトルとURLをコピーしました