2020/04/30 文の理解方法を切り替えてみる

05/02/202005/09/2020

こんなことを書くよ

テキストを読んでいると、解釈にしくじる時がある。
解釈をしくじりと意味理解不能への原因は、テキストの構造の見えなさにありそう。
テキスト構造の解釈方法を脳の中で工夫してみると、理解が早くなった。

そもそもなんでこんなこと思ったか

ぼくには、理解がすんなりできるタイプの英文テキストと、理解がすっとできない英文テキストがある。

ここでいう理解がすんなりできるというのは、「前から順番に読んでも単語と単語つながりががきれいに頭の中で整理できる」テキストのことを言う。

反対に、理解がすんなりできないテキストというのは、「単語の個々の意味はわかっているのだけれど、単語のつながりが見えてこない」テキストのことを言う。

例として英語の例をあげるけれど、日本語でもこうした現象はときどき起きる。

外国語での解釈しくじりの方が明瞭に「わからないこと」を自覚できるからだ。

日本語での「わからない」状態のときは、「わからないこと」を自覚せずに、誤った解釈をするときがある。

理解しやすいテキストとは？

たとえば、ぼくにとっての「理解がすんなりできる」テキストというのは、ニューステキストや、技術論文のテキストを指す。

例えば、下のテキストなどはぼくにとって「構造がわかりやすい」。

前から順番で読んでいっても、単語と単語のつながりが自然に明瞭に理解できている。

“A Fast and Accurate Dependency Parser using Neural Networks"
https://nlp.stanford.edu/pubs/emnlp2014-depparser.pdf

理解しづらいテキストとは？

少し余談になるが、どうぶつの森　ポケットキャンプというスマホアプリがある。最近、ぼくもはじめてみた。

英語版ではAnimal Crossingという。

ぼくのスマホは言語が英語設定になっている。

そのためだと思うが、どうぶつの森も自動的に言語が英語になっていた。

英語でも理解できるから、問題ないだろう。と思ってゲームを進めていく。

すると、「ん？これはどういうことだ？意味がわからない・・・」という文はそれなりの頻度で出てくることに気がついた。

特に、こいつ。Daisy Maeの発言はテキスト構造を理解するために５秒くらいかかる。

（テキスト構造が把握できれば、意味理解はすぐにできる）

何が違うのか？

理解しやすいテキスト、理解しづらいテキスト、何が違うのだろうか？と考えてみた。

そこで、仮説的に「ニュースと論文テキストでは単語と単語の関係性（文構造）が定型的になるように工夫して書かれているのではないか？」と考えてみた。

文構造が定型的ならば、脳はだいたいの構造をすでに把握していると言える。
（これは人による。ぼくは英文のニュースと論文をよく読んでいるから、ぼくの脳は構造をよく把握してるのかもしれない）

しかし、普段の文構造と違う書き方が目の前に来ると、脳は無理やり知ってる文構造に当てはめようとしながら理解しようとする。

目の動きの速さも「脳が知っている文構造を理解するための速さ」で動いていく。

結果的に「文構造がわからない」という状態が発生してしまう。

仮にこの仮説が本当だとすれば、「脳に文の構造を教えてあげながら読むと、理解ができる」という話になりそうだ。

言語処理的に言うと？

おそらく、ぼくの脳は、ニューステキストと論文テキストの構文解釈を得意にしている。

単語からある程度の文構造が予想できているので、「単語->構文解析（意識していない）->意味解釈」が可能なのだろう（End-to-Endのタスクみたい）

ということは、ぼくの脳が苦手な文には「単語->品詞解析->構文解析->意味解釈」を意識的にしてあげると良さそうだ（深層学習NLPよりも前の時代の解き方みたい）

実際にやってみた

「どうぶつの森ポケットキャンプ」の英語テキストを読むときに、文構造を意識してみることにする。

スクショに「ぼくの脳がこんな感じで単語の羅列を切っている」という様子を示してみた。

単語列を区切るのと同時に、「ここが名詞で、おそらくこいつが主語。次に動詞で・・・」みたいな理解もしている（言語処理的にはチャンキングタスクに近いことをやっているかもしれない）

whatの名詞節は青カッコのように、入れ子構造として認識をする。

これで読解スピードがかなり上がった。ということは、どうやらこの方法で良いらしい。

なので、これからも、「ん？この文はよくわからない」と感じたら、意識的に文構造を理解するようにするといいだろう。

ちなみにこいつの発言

それでもDaisy Maeの発言を解釈するには、やはり最大３～４秒程度の時間がかかる。

おそらく、こんな仮説が言えそうだ。

命令形で発言する頻度が高い。主語がないので、ぼくの脳が命令形と理解できるまで混乱を起こす。
- しかも、下のスクショだと、Plantが名詞のように見える（ぼくには）ので、さらに誤った解釈を起こす。
- 実際は、Plantが名詞というのはありえない。単数形で冠詞が存在していないので、これは動詞の原形と言える。
省略形の書き方をする。下のスクショだとcatching’のような。
- ぼくの脳は省略形の英語表記に弱い。
- ノーベル文学賞作品のA mercyという黒人文学を読んだことがある。南部アメリカ表現が多くて、かなりわからなかった記憶が強い。南部アメリカ表現には省略形が多い気がする（主観）

構文解釈モードも２つ用意しておくと良さそう

言語処理的には、構文解析には２種類がある。

脳も２つの解釈モードを意識しておくと良さそうだ。

１つは句構造解析モード。隣接してる単語と句をくっつけて行くといい。
基本的には、このモードで解釈を進めていってかまわないだろう。

ただし、このモードでは、接続詞の範囲や句の範囲の解釈にしくじることがある。
（言語処理の技術的にも同じ問題があったはずだ）

Bottom Up or Shift Reduce Parsers | Set 2 - GeeksforGeeks

で、もう１つのモードが依存構造木解析モード。

このモードでは、１度、文をぜんぶ読み込んだ後に、文の解釈をはじめる。というやり方。

https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=8827454 より

なので、２つのモードを組み合わせて読むと、こういう風になりそうだ。

はじめは句構造解析モードで文理解をすすめる。
文の最後に到達したときに、意味を理解できてなかったら、依存構造木解析モードに切り替える。

UncategorizedNLP

Posted by blog_author

2020/5/1 ロックダウンの生活？宇宙飛行士の生活の方が大変だよ。