Bertモデルの異義語解釈性能を調べる

12/18/2019

というブログを読む。

Bertは文脈に依存する異義語の単語埋め込みを正しく表現できることがウリなわけで、Googleは確かにそれを実証している。

が、実際にBertモデルを使った実験をやったとして、エラー分析の必要がある。

エラー分析の時に単語埋め込みが期待どおりにされているか？というのは、どうしても避けて通れない疑問。

例えば、最近だとこんなことがあった。Bert RTEモデルのエラー分析をしていると、構文表現はまったく同じなのに特定のキーワードの時だけRTE予測が失敗するということがあった。

こういう時には、どうしても単語埋め込みの状況を調査したいところ。

特に異義語の場合は、「そもそも文脈で違う意味が解釈できているの？」と調べる必要も出てくる。

こういう時に、今回のブログ内容はいいかもしれない。

Natural Language processing

Posted by user

セクション記号

AOKで保険の契約−２

ディスカッション

コメント一覧

まだ、コメントがありません

コメントをどうぞコメントをキャンセル

この記事のトラックバックURL

プロフィール

ぼく（ときどき私）
現在、南フランスで博士課程にいる。
研究テーマはシュミレーションとパラメタ推定。
Python歴 9年。

自然言語処理を業務で５年ほど経験。
スタートアップでゼロから分析システム設計などなど。

ドイツ移住後はフリーランス資格を取得し、生活。
自然言語処理エンジニア（兼 Pythonエンジニア）で生計を立てる。
ドイツ生活中にGoethe-zertifikat B2を取得。

フランス語の言語学習しながら、研究活動。
研究内容のこと、Pythonのこと、言語学習のこと、フランス生活のことなどを書いていきます。