自然言語処理技術は消滅危機言語に何ができるだろうか?

A8バナー広告

このところ,自分はどんなことをやってみたいのか?という疑問に駆られる.

すると,「言語文化保存活動をしてみたい」と思うようになった(と,いうより前から思っていた)

そもそもこういうことを思い始めたのは,Master時代にある1冊の本を読んだことがきっかけだ.その本はThe Last Speakersという.

冒険的な要素もありつつ,言語分析と認知分析の話も交えたルポタージュになっていて,なかなか楽しい本だった.

似たような本でA Fortune-teller told meという本を読んだこともある.この本は言語的な分析はないが(著者がニュース特派員で言語学者ではない),文化的な分析があって面白い本であった.

で,世界中には消えていく文化や言語があると知ったわけだが,自分には何ができるだろうか?と常々おもう.

そう考えると,自分にはNLPの知識と実務経験が豊富にある.Master時代には欠けていたビジネス分析もそれなりに経験をしてきた.いまならできるかもしれない.そう思って,まずは調査をしてみることにした.

まずはThe Last Speakersの著者のDavid Harrionにメールをしてみた.とはいえ,大学の教員は忙しいからまぁ,返事の望みは薄いだろう.

次にGoogle検索をしてみる.いくつか関連する論文やスライドは出てきた.

何ができるのか?よりも何を実現したいのか?

いろいろ調べていくうちに,ふと思った.

「何ができるか?」をベースに考えても,意味はなさそう(そもそも,ぼくはNLP専門でやってるので,技術知識はすでに知っている)「何を実現したいのか?」から考えた方がいい.

まずはそこから順番に考えていくことにした.

まず言語文化保存活動の社会的意味はどこにあるのだろうか?社会的意味がない活動はただの自己満足で終わってしまう.さすがにそれはやりたくない.

The Last SpeakersやBielefeld Universitätのスライドでも触れているが,「言語が消えるということは文化が消えることである」.文化が消えるということはその文化圏で生きた人の記録が消えるということだ.

つまり,まずは文化があったことを記録する必要がある.しかし,これはまぁ,ある程度はすでに実現している.すでに先人たちが本やレポートの形にして文化記録を残している.中にはコーパス化されているケースも存在する.

では,次に考えるべきは「文化記録を現代人にどうやって価値付けするのか?」ということ.テキスト検索したいのであれば,Googleでいくらでもできる.しかし,テキスト検索というのは「すでに知りたいキーワードを知っている」から可能であって,そうでない場合は有効なツールとは言えない.

そこで,ふと思い出したのは昔に読んだニュース記事.民話「赤ずきん」の進化を系統樹で解明、英研究

民話研究の世界ではよく知られているが,昔話の類は独立して自然発生的に民話が成立したわけではない.地域から地域へと話の伝達されて,似た要素の民話が成立している.

では,この考え方を応用して考えると,現代人が見たり,読んだりしてるお話の類も実は昔から伝わってきた要素を引き継いでいる可能性がある.

と,いうことを示せるようになれば,少なくとも現代人も「こんな民話が昔はあって,こんな文化があったのか」と知ることはできる.と,なれば,とりあえずは「現代人に文化記録を見せる」は達成できる(そこから先は別の次元の話)

だから,まずは物語を入力すると,似た民話を示してくれるツールがあると良いかもしれない.

まずはこの線で考えてみることした.