よりよい未来の話をしよう

方言が消滅するかも?未来への鍵を握るのは「方言翻訳AI」

日本には多くの方言が存在する。関西弁、博多弁、広島弁など耳にしたことがある人も多いのではないだろうか。実は今、一部の方言が消滅しつつある。その理由の1つに話し手の減少が挙げられる。地方在住者でも若い人は主に標準語を話すため方言を話す人は高齢者が多く、担い手が徐々に減っているというのだ。

そんな問題に対し、とある大学や自治体では「AIを用いた方言の翻訳」を試みているとの情報を得た。そこで今回は方言を取り巻く現状や方言を残す意義、また方言翻訳AIの開発に取り組む人たちに話を聞くことにした。

方言はなぜ衰退したのか?

まずは方言と標準語の歴史についてみてみよう。

元々、「話し言葉」といえば全国各地の方言しか存在していなかったが、明治時代にさしかかり「標準語」という概念が登場し、1900年頃から近代的な国家づくりを目指して学校での「標準語教育」が推進された。これが標準語の始まりとされている。

実際に1933年の「中等学校作法要領」には「努めて標準語を用ひ、方言・訛語、卑語は避けざるべからず」との記載がある。このことからも学校教育では標準語を用い、方言を避けなければならなかったことが分かるだろう。(1)

そこから方言は時代の変化とともに徐々に衰退する。その原因について、人間文化研究機構の木部暢子機構長は「学校教育と高度経済成長やテレビの普及」と述べている。(※2

1955年からの高度成長期には集団就職の影響もあり多くの若者が地方から都市部へ移り住んだ。さらに1950年代後半からはテレビが普及して子どもたちが標準語を吸収することになる。このような経緯で標準語が広まり、方言が衰退することになったのだ。

※1 参考:達富洋二「豊かなる国語教室のための方言の活用」
https://archives.bukkyo-u.ac.jp/rp-contents/KK/0003/KK00030L125.pdf

※2 参考:熊本日日新聞「古い京言葉残る九州の方言 標準語と使い分けながら後世へ 木部暢子・人間文化研究機構長 【識者の視点】」
https://kumanichi.com/articles/1234327?check_logged_in=1

日本に方言はいくつあるの?

ここで気になるのが日本にはいくつ方言があるのかということだ。

現在の方言研究界で一般的な考え方とされているのは、日本の国語学者である東条操が1953年に発表した方言区画論で、そこでは方言を16種類に分類している。

まず初めに全国の方言を、本土方言と琉球方言の2つに大きく分け、本土方言はそこから東部方言、西部方言、九州方言に分けられる。東部方言は「北海道方言」「東北方言」「関東方言」「東海東山方言」「八丈方言」に、西部方言は「北陸方言」「近畿方言」「中国方言」「雲伯(うんぱく)方言」「四国方言」に、九州方言は「豊日(ほうにち/ほうじつ)方言」「肥筑(ひちく)方言」「薩隅(さつぐう)方言」にそれぞれ分類される。

また、琉球方言は「奄美方言」「沖縄方言」「先島(さきしま)方言」の3つに分類することができる。

ただし、方言には様々な定義が存在することや、近場の集落レベルでも方言が異なるなど、かなりの数の方言が日本には存在することから明確に分類できるものではないと考えられていることに注意したい。(※3)

ちなみに「〇〇弁」は方言をさらに細かいエリアで絞りこんでいった場合に、特定の地域やまち単位で使用される言語体系のことをいう。

達富洋二「豊かなる国語教室のための方言の活用」より筆者作成

ここで「琉球方言」について触れたい。実は2009年にユネスコ(国連教育科学文化機関)が発表した調査結果では、琉球方言の下位分類である奄美方言や沖縄方言、それから主に北海道などで話されてきたアイヌ語が消滅の危機にある言語・方言として扱われているのだ。

また本発表では世界の言語の消滅危機についても触れられており、約2,500に上る言語が消滅の危機にあるとして掲載されている。(※4)

※3 参考:国立国語研究所「方言と日本語教育 第1部日本語の方言概説 第3節 日本の方言一束日本一」
https://repository.ninjal.ac.jp › files › kk_nkss_020

※4 参考:文化庁「消滅の危機にある言語・方言
https://www.bunka.go.jp/seisaku/kokugo_nihongo/kokugo_shisaku/kikigengo/index.html

なぜ方言は残さないといけないの?

このように消滅危機に瀕している方言も存在するわけだが、そもそもなぜ方言を残さないといけないのだろうか。文化庁のサイトでは以下のように記載されている。(※5)

方言は地域の文化を伝え、地域の豊かな人間関係を担うものであり、美しく豊かな言葉の一要素として位置付けることができる。 「方言の尊重」とは、国民が全国の方言それぞれの価値を認識し、これらを尊重することにほかならない。

また熊本県立大学文学部の馬場良二元教授は方言の必要性について以下のように述べている。(※6)

日本語を教えるときにわからない日本語は、「現代」、「過去」の日本語を調べ分析する必要があります。そのときにどうしても必要になるのが歴史と方言。今ある日本語を知ろうと思うと多くのバリエーションを知らないといけません。現代日本語のデータとしても方言は必要なのではないか

これらをまとめると、方言を残すことには大きく2つの理由があることが分かる。1つは地域の文化を残していくために必要ということ。方言はその地域で生活する人たちを形作る、つまりその地域に住む人たちのアイデンティティでもある。2つ目は日本語の研究をする上で欠かせないということ。今の言葉を理解するためには元々どのように使われていたのか、どこからやってきた言葉なのかを研究する必要があるのだ。

※5 参考:文化庁「第20期国語審議会 新しい時代に応じた国語施策について(審議経過報告) Ⅰ言葉遣いに関すること」https://www.bunka.go.jp/kokugo_nihongo/sisaku/joho/joho/kakuki/20/tosin03/04.html#:~:text=%E6%96%B9%E8%A8%80%E3%81%AF%E5%9C%B0%E5%9F%9F%E3%81%AE%E6%96%87%E5%8C%96,%E3%81%99%E3%82%8B%E3%81%93%E3%81%A8%E3%81%AB%E3%81%BB%E3%81%8B%E3%81%AA%E3%82%89%E3%81%AA%E3%81%84%E3%80%82
※6 参考:公立大学法人熊本県立大学「方言を残すということ馬場教授インタビュー」
https://www.pu-kumamoto.ac.jp/users_site/produce-x/yamato/prof-baba.html

「ニヤニヤする」は体の不調をうったえる言葉?

記事の冒頭で方言が消滅しつつあることには触れたが、方言の担い手が減少すると、ある問題が発生する。それは方言話者と標準語話者とのコミュニケーションの中で方言が伝わらない場面が出てくる、ということだ。

この問題を解決するべく、弘前大学ではAIを用いた津軽弁の翻訳ツールの開発が行われているという。一体どのような経緯で開発をすることになったのか、弘前大学大学院理工学研究科の今井雅教授に伺った。

「開発を始めたきっかけは東北電力からの依頼でした。電話で話している言葉が聞き取りづらいので、何とか文字化できませんかという依頼です。音声認識をして文字化するツールは当時も存在したのですが、海外製のものばかりで日本語の識別は困難という現状でした。

そこで日本語に特化したツールが必要ということになり、理工学研究科の私が担当することになりました」

きっかけはコールセンターの困りごとであったが、研究を進めるうちに津軽弁を話す人たちが抱える大きな問題に気づいたそうだ。

「医療現場や介護現場で方言が通じないことが大きな問題になっていることが分かりました。弘前市の医者や介護士は他の地域出身の方も多く、場合によっては海外出身の方もいます。そうなると患者が津軽弁で症状を伝えてもうまく伝わらないわけです。たとえば、津軽弁と標準語では体の部位を表す単語も違っていて、かかとを津軽弁では“あぐど”と言います。

症状を伝えるときの表現も特徴的で、症状を伝える際に“ニヤニヤする”という言葉を使うことがあります。これは決して笑っているのではなく、津軽弁ではお腹がシクシク痛む症状のことを表します」

このような背景もあり、弘前大学の介護の授業では『病む人の津軽ことば』(1991年、青森県文芸協会出版部)という教材をもとに、津軽弁を学ぶ授業があるそうだ。

「弘大×AI×津軽弁プロジェクト」のWebで公開されている津軽語辞書
http://tgrb.jp/dic/?kana=21

新潟県出身の今井さんが津軽弁を残したいわけ

音声情報を文字に変換するためには、変換元である津軽弁のデータが必要だ。しかしツールの開発当初、津軽弁のデータベースは存在していなかった。そこで今井さんは津軽弁の文字情報、その次に音声情報を収集するという手順でデータを集めていった。

「一般的に1つの言語を翻訳するためには約20万の文字情報や音声情報が必要と言われています。しかし現時点では、文字情報で3万〜4万、音声情報が1万なので、20万にはまだまだ遠い状態です。一方で、利用シーンを医療や介護現場などに限定すれば情報量はそれほど必要ない。なので、まずはそれらの現場でよく使われる単語を中心に開発を進めています」

日常生活で困っている人たちの不自由を解消したいということ以外にもう1つの思いが今井さんにはある。それは津軽弁を未来に残していきたいという気持ちだ。

「津軽弁を話せる人は高齢者が大半です。津軽弁の情報が高齢者のみに蓄積されている状況では、話し手がいなくなると、津軽弁を理解すること、ひいては津軽弁に触れることもできなくなります。

仮にネイティブに津軽弁を話す人がいなくなった場合でも、集めた情報をデータベース化すれば津軽弁を未来に残していくことができますよね」

津軽弁の生のデータを集めるにはネイティブに津軽弁を話す人たちが元気なここ数年が鍵を握る、と今井さんは言う。そして話を聞く中で驚いたのが、今井さんの出身地が新潟県ということだ。つまり弘前大学に赴任するまでは津軽弁に縁もゆかりもなかった。そんな今井さんが津軽弁を残そうと考えるのはなぜだろうか。

「たとえ話し手が少ないとしても、津軽弁も1つの文化なわけです。津軽弁が消滅すると言うことは、津軽弁を中心とした津軽文化にも影響を及ぼしかねない。時代が令和へ移り変わっても、いまだに残っている津軽文化が消滅してしまうというのは、もったいないですよね。

文化を残すためにまだ抗える術があるなら挑戦したい。これらの取り組みに時間がかかることは理解しているので、津軽弁収集やAIツール開発はライフワーク的にやっていくつもりです」

津軽弁の音声データを集めるために協力を呼びかけるポスター

全世帯に配布するタブレットに山形弁AIを搭載する

次に話を伺ったのは、方言翻訳のAI開発ツールに取り組む山形県西川町だ。自治体がこうした取り組みを行うのは珍しいが、一体どのような背景で取り組むことになったのか。菅野大志町長に話を伺った。

「西川町は65歳以上のみで構成される世帯が全体の30%以上、高齢者の割合が全体の47%と高齢者が多く住む町です。私は毎週のように町民と政策に関する対話会を行っています。そこで高齢者の方から話題に上がったのが、“話し相手が欲しい”ということでした。

西川町では、防災や広報情報発信、遠隔医療実施の観点から全世帯にタブレットを導入するので、その中に対話ができる人工知能を搭載すれば、高齢者の話し相手になるのではないかと思いつきました。

ただしAIは基本的に標準語にしか対応していない。標準語対応のAIをタブレットに入れて配布しても、山形弁は聞き取れず会話は成立しません。そこで山形弁を翻訳できるAIを開発することに至りました」

一方で、タブレット配布にあたって、普通に配布しただけで使ってもらえるのだろうかという懸念があったそうだ。そこで菅野町長が考えたのが「方言翻訳AIをきっかけにタブレットに親しみを持ってもらう」という方法だ。具体的にどのように取り組んだのか。

配布するタブレットの画面イメージ。地域のイベントの情報や天気がトップページに表示されている。

タブレットに山形弁を教えたのは、あの〇〇さん

「高齢者に対するデジタル政策は難しいという印象を持っている人も多いと思います。実際、高齢者には『私はどうせ使えないから』といったようなデジタル技術への気持ちの壁がある人が多いのも事実です。この壁を取り払うために何かできないかと考えました。

そこで考えたのが、高齢者に説明する際に人工知能などの難しい言葉をなるべく使わず、親しみを持ってもらえるような工夫を加えるということです。今回、山形弁仕様のAIツールを作る上で『タブレットに山形弁を教える先生役オーディション』を実施しました。山形弁ネイディブスピーカーの町民に参加してもらい、そこで選ばれた6人に山形弁の録音をしてもらって、そのデータをAIに学習させています。

そうすることで『このタブレットが山形弁を理解するのは、あの〇〇さんが教えたから』ということになって、普通にタブレットを配布するよりもはるかに親しみを持ちやすくなるわけです」

人口が少ない西川町だが、逆に言えば人を辿れば知り合いということも多い。西川町の特色を生かした取り組みだと言えるだろう。タブレット配布を足がかりに、できる政策の幅が増えると菅野町長は語る。

西川町ではAIとの対話を通じた町民の健康管理を検討している。たとえば天気予報のデータを取得し気温の変化に伴う体調管理を行ったり、1日あたりの目標歩数を設定して運動を促したりといったことだ。これらの機能を搭載したタブレットは2024年2月上旬に配布される予定だ。

「町民の健康管理のために、現在は民生委員や保健師さんが各家庭の訪問を行なっています。今後、高齢者が実用的にタブレットを活用できるようになれば、タブレットとの対話を通すことで事前に不調を察知し、そういう人から優先的に対応できる仕組みが構築される。それによって人手が限られるアナログな対応を、デジタルを駆使して最大化できる。

もちろんこれらの政策もタブレットに方言が伝わるAIが搭載されているからこそ実現できるわけです」

西川町出身・内閣官房デジタル田園都市国家構想実現会議事務局出身の菅野町長だからこそ人一倍の熱い想いで取り組む。方言翻訳AIを搭載したタブレットが土台となり、慣れ親しんだ言葉でデジタル技術を駆使した幸せな生活を送ることができる日も近いのかもしれない。

7月に実施されたオーディション風景。 世代ごとに方言のなまり具合が異なるため、先生役には40〜70代の人たちが選ばれた。

「方言か標準語か」ではなく、「方言も標準語も」

今回お話を聞いたお二人に共通していえることは「方言を話す人たちの生活が少しでも豊かになってほしい」という思いのもと行動されているということだ。ばらつきのあることに基準を定め、統一することで便利になることも多い。ただしその過程で、狭間にある人やものが削ぎ落とされてしまう可能性も考えなければならない。

今は標準的に使われている言葉でも元はどこかの方言からきていることがあるように、方言があることで日本語は豊かな言語とも言えるだろう。「方言か標準語か」ではなく、「方言も標準語も」どちらも共存していくための未来の鍵を握る可能性のある方言翻訳AIツール。完成したのちに方言や人々の生活にどのような影響を与えるのか引き続き注目していきたい。

 

取材・文:吉岡葵
編集:篠ゆりえ