未分類

2023年12月7日

【竹村公太郎】地形と気象が産んだ日本語(その1)―日本語は未来の言語―

AI翻訳 

 アジア開発銀行(ADB)
の関係者から原稿を頼まれた。
1年前ならお断りしたが
今回は二つ返事でお受けした。
要望された原稿内容は日本の
「水管理と文化」に関してであった。
私は「日本の流域管理の400年小史」
を頭の中で考えていた。
江戸時代の農村共同体の誕生と水争い、
そして近代の都市用水の参入と
合意形成を成功させた
ダム建設と水配分ルールであった。

 1年前なら断った。
理由は英文での提出だったからだ。
専門的でやっかいな
水争いと合意形成の歴史を
英文化するには手に余る。
しかし、今はAIがある。
AIを自分で操作はできないが、
パソコンが得意な若い人に頼めば
あっという間である。
 
 和文草稿を後輩に預けた後、
日本語の世界発信の障害が
なくなっていく未来を感じた。
いや、障害の解消ではなく、
日本語の有利さが
増していくのではないか
という思いであった。

異常な日本語「発生音」

 日本語は世界の中で
異常と言っていいほど
特異な言語である。
まず発生音が少ない。

 日本語の発声音数は、
せいぜい110個前後である。
退屈な会議の時に、
発声音数を何度も数えた。
あ、か、さ、た、な、
の五十音で約50個。
が、ぎ、ぐ、げ、ご、
の濁音で25個。
ぱ、ぴ、ぴゅ、ぺ、ぴょ、
などで20個前後。
このようにしてカウントしていくと、
総計110個前後の発声音数しか数えられない。

 日本語の発声音は母音が中心である。
例えば「ティッシュ」の子音の「ティ」は、
最近、日本語の発声音の仲間になった。
しかし、30年前、お年寄りは
発音できなくて「テッシュ」と発音して
若者の笑いを誘っていた。

世界各国の言語の発声音は遥かに多い。
日本語の音数約120に対して、
隣の韓国語は約500、
英語は2,000
そして中国語は強弱の変化も含めて
何千あるか数えきれないという。
もちろんその発音数は
ほぼ子音で占めている。

(図―1)でその状況を示した。

 発声音は会話の基本である。
語学力テストでも、
先進国の中で最も劣るのは日本であり、
発展途上国を含めても
日本は164カ国中155位であったという。
(エデュケーショナル・テスティング・サービスによる)
 
 発声音が少ないことが、
日本人の語学力が低い原因であることは
はっきりしている。
発声音が極端に少ない日本人は
情報伝達ができないのか?

異常な日本語「語彙」

 情報伝達の根本は言語であるなら、
子音発音が極端に少ない日本語は
情報伝達にとって不利なのか。

 言語といっても2つの手段がある。
発声と文字である。
日本語の発声は極めて貧弱だが、
文字言語つまり語彙は
圧倒的に豊富である。

 英語と日本語の語彙の数の比較を
(図―2)で行った。
普通の米国人の大人が
会話するに必要な語彙は
5,000語で十分足りるという。
それに対して日本の小学生6年生の児童が
知識として必要語彙は30,000語となる
。高校生や大学生ではなく、
小学生の語彙である。

 日本人は語彙に関しては圧倒的に強い。
日本の小学6年生に「人類生体学」や
「甲殻類」と黒板に書けば
どうにか説明する。
しかし、米国の高校生、大学生に
「Anthroposomatology」や「Crustacea」と
書いても答えられる学生は少ない。

漢字が有効かといえばそうでもない。
中国は漢字だけである。
次々と出てくる新語彙は、
全て漢字で表現されていく。
コカ・コーラの「可口可楽」は
どうにか分かる。
しかし、米国のロック歌手の
ボンジョビは「邦喬維」となると
ついていけない。
中国政府の専門機関は毎日、
数多くの漢字語彙を作成しているという。
中国人にとって、次々と生まれる用語を
漢字で消化していくのは容易ではない。

 日本語は文中に
「漢字」「カタカナ」「ひらがな」いざとなれば
「アルファベットの英語」「アラビア数字」も
文章に入れてしまう。
日本語は語彙なら何語でも来い、
という懐が大きい言語である。
 

AI時代のエース日本語
 AI時代、言語コンピュータは
人類に何を要求しているか?
それは豊富な語彙である。
コンピュータの得意技は、
無数の語彙を収集し、
前後の文脈から最適な語彙を選んで
文章を作成していく。
AIは「貴社の記者が汽車で帰社する」も
間違いなく一瞬にして正しく文章化する。

 語彙は文字である。
文字は地域差、年代差、個人差そして
時代に応じて変化しない。
AIにとっては極めて都合が良い。

日本で最大の語彙を掲載しているのは
「日本国語大辞典(小学館)」で、
50万の語彙が掲載されている。
これほどの語彙があれば、
その文章が、論文か、手紙か、
手紙でも一般の連絡か、
お祝いか、お悔みかをコンピュータは判断し、
感情語も選択して文章を作ってくれる。

 名前は失念したがある大学教授が
「日本語を学んで、
日本の国会図書館に行けば、
世界中の文明の情報を得られる」
と発言していた。
日本の図書館には
英語・独語・仏語の主要国だけではなく
世界中の国の翻訳本がある。
内容は様々な分野に渡り、
他国の図書館では見られない
多様性に溢れている。
日本語の語彙集に
海外の分野の語彙を足していけば、
比類なき完全な文章AIに向かっていける。

 語彙数が多い日本語は
AI時代に似合った言語であるようだ。
2023年4月に開催された
「G7デジタル・技術相会議」で、
チャットGPTに関して各国から
日本への期待が表明されたと報道があった。
日本の規制が緩やかだから
という理由で報道されていたが、
実は、日本語の語彙集には
とてもかなわないという思いが
隠されているのではないかと思ってしまった。

(図―3)は2023年6月時点で
チャトGPTを使用できる国である。

 AI時代が迫ってくる今、
日本語とはいったい何者なのか?
日本語の源流とは何か?
の疑問が迫ってくる。

(次号に続く)

関連記事

未分類

【藤井聡】出鱈目だらけの菅・所信表明演説。この政権が続けば、日本は奈落の底に突き落とされる。

未分類

【施 光恒】ドサクサ紛れのグローバル化

未分類

米中覇権戦争 残酷な未来透視図

未分類

【平松禎史】「霧につつまれたハリネズミのつぶやき」第六十四話『「納得がいく」令和の政策ピボットは実現可能なのか』

未分類

【藤井聡】「公明党・大阪市議団が日本を破壊する」というリスクについて

【竹村公太郎】地形と気象が産んだ日本語(その1)―日本語は未来の言語―への2件のコメント

  1. ts より

    日本語は日本人のアイデンティティ
    日本人とは何者なのかという問いに対する解があると思います。
    先生、次号が待ち遠しいです

    返信

    コメントに返信する

    メールアドレスが公開されることはありません。
    * が付いている欄は必須項目です

  2. 理科の人ってだいた~ん より

    そんなにツールに信を置いちゃって
    大丈夫なんですかね
    理科の人って大胆というか、コワイですね
    ニッポンサイコーなら、新字体を疑って下さい

    コンピュータがなにを以て精確か否かを
    判断しているかといったら
    まあ国語の辞書諸々なんでしょうけど
    その辞書なるものが大言海、広辞苑からして
    結構いっちゃってたりします

    もしこれが我々の慣用に重きをおいて
    生成しているとしたら
    まさにtraduttori, traditore!

    灰燼がカイジンハイジンどちらでも変換できて
    辞書も両方のせていたりしますが
    でも、どちらかはぜったいあり得ない読みです

    あと「日本国語大辞典」は語義というより
    初出例、使用例を調べるための辞書なんで
    語義はざんねん、甘かったりする

    五〇万という数に踊らされて鵜呑みにすると
    結構テキトーに済ませているところがあります

    原因はいろいろありますが
    やはり現代かな、新字体の導入が
    辞書に絶望的な混乱を招いたと思います

    返信

    コメントに返信する

    メールアドレスが公開されることはありません。
    * が付いている欄は必須項目です

コメントを残す

メールアドレスが公開されることはありません。
* が付いている欄は必須項目です

名前

メールアドレス

ウェブサイト

コメント

メルマガ会員登録はこちら

最新記事

  1. 日本経済

    【三橋貴明】なぜ基礎控除を引き上げなければならないのか...

  2. 日本経済

    【三橋貴明】消費税は間接税という洗脳を解く

  3. 日本経済

    【三橋貴明】世界を変える

  4. 日本経済

    【三橋貴明】世界が変わる

  5. 日本経済

    【三橋貴明】手取りを増やさないのは自民党

  6. 日本経済

    【三橋貴明】人の意見を変える方法

  7. 日本経済

    【三橋貴明】最強の野党

  8. アメリカ

    政治

    日本経済

    【藤井聡】如何にすれば私達は「日本を滅ぼす売国石破政権...

  9. 日本経済

    【三橋貴明】人間万事塞翁が馬

  10. 日本経済

    【三橋貴明】手取りを増やす

MORE

タグクラウド