執筆者プロフィール
今井 むつみ(いまい むつみ)
名誉教授今井むつみ教育研究所所長今井 むつみ(いまい むつみ)
名誉教授今井むつみ教育研究所所長
生成AIはここ数年で驚くべきスピードで進歩しており、紡ぎだす言語の流暢性は人間を超えている。生身の人間はしばしば言葉に詰まったり、言いよどんだり、文法を間違えたりするが、AIは、ハルシネーションはあってもどこまでもよどみない。
私は人間の子どもの言語習得の仕組みを研究しているのだが、生成AIの言語学習はあらゆる点で人間の子どもの言語の覚え方と対照的である。しかし、その違いが人間の言語の本質的特徴について、さらに人間の独特の理解の仕方について、私たちに様々な気づきを与えてくれる。まずは子どもがことばを覚えるときにどのような推論をしているのか見てみよう。
3つの種類の推論:演繹、帰納、アブダクション
一般的に推論と言えば演繹推論である。演繹推論はある命題あるいは規則が真であるか(あるいは規則に適合しているか違反しているか)を判断する推論である。「ソクラテスは人間である。人間はみな死ぬ。したがってソクラテスは死ぬ」という有名な三段論法は演繹推論である。
もうひとつのメジャーな推論形式は帰納推論である。帰納推論とは、データ系列からある規則性を見つけて、その規則をまだ起こっていない事象に適用し、予測する推論である。生成AIはまさにこの推論をする。生成AIはビッグデータから単語間の関係性を統計的に抽出し、次に起こる可能性がもっとも高い単語を予測する。
では私たち人間が日常的に行っている推論はどちらだろうか。
例えばこのような場面を考えてみよう。
待ち合わせた相手が来ない。電話もつながらない。「事故にあったのか」あるいは「昨夜私が言ったことが気に障ったのかもしれない」など、さまざまに心配する。人はこのように、何かが起こるとその原因を考えずにいられない。
人はまた、本来なら情報が足りず、結論を導き出せないような情報を自分の知識で補って結論を導くことも常にしている。時には話者の提供する情報が誤っていても、聞き手は本来の正しい情報を推論できることもしばしばある。『100万回死んだねこ 覚え違いタイトル集』という本*1はこの事例の宝庫である。この本は福井県立図書館の司書さんたちが、利用者が「この本ありますか?」と聞いてくる本のタイトルが間違っていて珍妙なものがあまりに多いのでそれらを集めた事例集だ。ある利用者は「村上春樹の『とんでもなくクリスタル』という本はどこですか?」と聞いてきた。司書さんは「そのタイトルの本はありませんが、お客様が探しているのは田中康夫さんの『なんとなくクリスタル』、あるいは村上龍さんの『限りなく透明に近いブルー』ではないでしょうか?」と返した。著者名もタイトルも間違っている情報から、推論によって見事に利用者の意図していた本の候補を言い当てることができたのだ。
このような推論は、演繹推論でも、帰納推論でもなく、アブダクション推論と言われる推論である。アブダクションは演繹と帰納に比べて聞きなれないことばではあるが、人間はもっとも自然に、いつもこの推論を行っている。もともとは、チャールズ・サンダース・パースというアメリカの哲学者が作ったことばである。パースは、このことばを「科学的探究における仮説形成推論」という意味で使った。
アブダクション推論を一言でいえば、「論理の跳躍を含む非論理推論」である*2。このように書くとアブダクションがいわゆる「よい推論」だと思う人は少ないだろう。実際、アブダクション推論は頻繁に誤りをもたらす。しかし、そもそも科学の「仮説」というのはあくまでも「理論に成長するかもしれない仮のアイディア」であって、多方面から多角的に検証されなければならないし、ある時代に科学者たちに受け入れられ、理論として確立した後でも、誤りが見つかり、修正されたり、別の理論に置き換えられたりすることは科学の歴史上何度となく繰り返されてきた。パースはアブダクション推論を科学における仮説形成のための特殊な推論として提唱したが、近年、認知科学の界隈では、アブダクションは、より広く、人が日常的に行う、演繹でも、帰納でもない推論を包括的に指して使われている*3。
人間は、たまたま経験した事象でも、自分の身体に起こったことでも、あるいは他者の行動についてでも、誤った結論に至るリスクがあっても、アブダクション推論をしている。科学は仮説がなければ進歩しない。つまり仮説形成は科学のもっとも重要で根源的な行為であるが、それは論理学では後件肯定の誤謬なのである。後件肯定の誤謬とは、「AならばBである」という事実から、「現状ではBであるからAが起こったはず」と考える推論で、これは論理の誤りである。例えば、Aという病気(例えば肺がん)にはしばしばBという症状が現れる(例えば咳がでる)、という現象があっても、Bという症状は他の病気でも現れるので、BだからAとは断定できない。しかし、医師が病名を診断するときには患者の訴えや既往症、年齢、環境などの不完全な情報から病名を絞り込む仮説を立てることをしなければ検査に進むこともできない。因果関係を明らかにするということは観察されるある現象から時間を遡及して、今観察できない原因を明らかにすることで、それ自体論理的には後件肯定という論理の誤謬を犯すことなのである。
ことばの学習もアブダクション推論によって可能になる
実は乳幼児もアブダクションの推論によって言語を習得する。子どもは大人にことばの「意味」を教えられ、それを暗記してことばを覚えていくと考えている人は多い。しかし「ウサギ」や「ミルク」のような単純なことばでさえ、その「意味」を子どもにわかるように教えることはできない。ことばが指す対象のひとつを指さして、そのことばを使うことくらいしか大人にはできないのである。しかし、ことばが発せられた状況はしばしばとても曖昧である。
これはクワインというアメリカの哲学者が「ガヴァガーイ」問題と名付けた「一般化の問題」である*4。まったく言葉が通じない未開の地で、先住民が、野原を走っているウサギを指して「ガヴァガーイ」と叫んだ。その意味は何か?「ウサギ」かもしれないが、「野を駆ける4つ足の動物」かもしれないし、単に「動物」かもしれない。あるいは「あれを捕まえろ!」という命令かもしれない。こんな変な、日常には起こらないことを考えるのは哲学者だけだと思うかもしれない。しかし、子どもは日々ガヴァガーイ問題に直面し、推論して結論づける。誤った意味に解釈してしまうことは日常茶飯事である。例えば、ある2歳児は、バスタブに「入る」ときも「出る」ときも「ハイル」と言った。「ハイル」という動きの方向を表す動詞を「またぐ」という動作のことばだと思っていたらしい。
子どもがことばを覚えるためにしなければならない推論は、まさに科学者が行う仮説形成の推論と同じアブダクション推論なのである。科学者が仮説を形成し、検証と修正を繰り返しながら理論を構築していくように、ことばを覚える幼児も状況から暫定的にことばの指示対象が何かを考え、話者がどのような意図でそのことばを使ったかを考え、どのようにそのことばが一般化できるかを考える。つまり、人に「意味を教えてもらう」のではなく自分でそのことばの「意味」を考えるのである。すぐに妥当な意味にたどりつけるとは限らないが、そのことばをどんどん他の状況で使う。使いながら、そのことばの解釈を自分で修正し、洗練されたものにしていくのである。この過程を経るからこそ、ことばの知識は身体の一部となり、適切な場面で自在に、創造的に使うことができる「生きた知識」となるのである。
超一流のピアニストとピアノ調律師にとってのことば
超一流の芸術家は「ことば」をどのように使っているのだろうか? 例えば音楽家はどうだろう。音楽はそれ自体が「普遍的な言語」だという発言をよく聞く。確かにそのとおりである。しかし、プロフェッショナルな音楽家が「自分の音楽をつくる」ときに、自分ひとりで演奏会や録音ができるわけではない。ピアニストが演奏するためにはピアノを自分の望む音色や響きに仕上げてくれる調律師の存在が欠かせない。ウイーンのコンサートホールの調律師ステファンが主人公の『ピアノマニア』というドキュメンタリー映画がある。ステファンは世界中の超一流のピアニストのためにピアノを調律する。ピアニストは自分のイメージの音に調律してもらうためにことばで伝えるしかない。まだ存在しない音はピアノを弾いて伝えられないからだ。一流のピアニストたちは、「もっと柔らかい音にしてほしい」というようにことばを使ってリクエストするしかない。しかし、実際に求める音は一人ひとり違うのである。そのときステファンは自分のイメージする「一般的な柔らかい音」に調律するのではない。そのピアニストの過去の演奏の膨大なデータから、その人が「柔らかい」というとき、それはどういう意味なのか、どういう音を指して「柔らかい」というのかを徹底的に考える。これはまさに究極に質の高い、限られた熟達者のみが可能な最高のアブダクション推論である。
算数に躓いている子どもたち
翻って、学校の勉強に躓いてしまっている子どもたちはどのように知識を習得しようとしているのか。この問題に向き合うために、私は「たつじんテスト」という名のテストを開発し、実施している*5。普通の単元テストや学力テストは、学校で教えられる教科単元を子どもがどれだけ覚えたかをテストする。たつじんテストはその逆で、教科単元の学習内容を学ぶための前提知識と推論の力が子どもに備わっているかを測るためのテストである。
多くの場合、学校の学びに困難を覚え、躓いている子どもは、その単元の理解に必要な前提知識をもたないか、根本的に誤った概念を持ってその単元を学んでいる。たとえば、非常に多くの子どもが分数の記号の意味を理解していない。たつじんテストの問題の中に、与えられた数直線上で、基本的な数記号(自然数、分数、小数)の位置を示すよう求めた問題がある。例えば、0から1の数直線上で1/2や2/5という数の場所を示す。そういう問題である。
調査を重ねた結果、浮かび上がってきた小学生・中学生の実態は衝撃的だった。「1/2」を0-1の数直線上の真ん中の位置に置けた子どもは5年生でも50%を切っていたのである。「1/2と1/3はどちらが大きいか」という質問も、5年生の正答率は49%だった。中学生に「1/1000+1/1000の答えにもっとも近い数を選択肢の中から選べ」という問題を出し、0, 1, 2, 2000を選択肢とした場合の正答率も30%ほどで、多くの生徒が2000を選択していた。小学生も中学生も、単純な計算はできるが、分数という概念も、それぞれの数記号の「意味」も理解しておらず、それぞれの記号がどのくらいの量なのかという直観を持っていないのである。しかし、数の記号同士を足したり引いたり掛けたりする計算だけはできるのである。
記号接地と意味の理解
彼らの躓きはどこから来るのだろうか。一言で表現するとしたらそれは「意味の不理解」である。彼らとて、分数のことを何も知らないわけではない。通分、約分や、足し算、引き算、掛け算などは一応知っている。つまり、記号の操作はできる。しかし、記号の意味はわからない。だから、異なる分母をもつ分数同士の足し算のように、ドリルでよく見る計算問題はできる。しかし、なぜ通分をしなければならないのかはわからない。そもそも1/2という記号の意味も、それどころか分数という概念の定義や意味もわからない。
ChatGPTがリリースされてまだ間もないころ、2023年3月に、小学生に出したのと同じ問題をChatGPT(無料版)に出してみた(図)。6%が分数で100分の6であることは「知っている」。6割が60%であることも知っている。しかし、その2つのピースを統合して正解にたどり着くことができなかった。ChatGPTのこのような「思考過程」は、上記の分数がわからない小中学生にとてもよく似ている。断片的な知識はもっている。しかしその「意味」がわからない。そして(だから?)断片の統合ができない。
計算はできるが意味はわからない。この姿はまさに、生成AIを思い起こさせる。いまや小学生にも活用され、またたくまに社会に浸透した生成AI。流暢に巧みに言語を操るが、彼らがしているのは、基本的には次の単語を予測することだけで、1つ1つの「単語の意味」は理解していない。彼らの「単語の理解」は、他の単語、あるいは語句との結びつきの強さを示す数値であり、外界に実際する対象に紐づいてはいない。「記号接地」をしていないのだ。
認知科学者のスティーブン・ハルナッドは今から30年以上前の1990年に人工知能の特徴として、「記号接地」ということばを誕生させた。このことばの誕生から30年以上が経った現在でも、AIが記号接地することはない。
生成AIは「ri/n/go」という音と画像の結びつきは学習し、「リンゴ」について言語的に記述された様々な事実を容量よくまとめて返すことはできる。しかし、りんごの実態、つまりその香り、味、舌ざわり、歯ざわり、手ざわりなどは知らない。これは「記号接地がない」の典型的状況である。それに対して、人間は幼い子どもでも「リンゴ」を蘊蓄ではなくその味、香り、歯ざわり、手にしたときの感覚、重さなどの感覚情報の総体として理解している。
しかし人間における「記号接地」は単に外界にリアルに存在する対象との紐づけで終わることはない。言葉は、それが名付ける典型的な対象とそのことば(記号)の対応付けを覚えても自由に使うことはできない。あることばを十分に使うことができるためには、そのことばが適用できる範囲を知らなければならない。しかし、範囲を知るためには、その単語と似た他の単語との関係や境界を知らなければならない。つまり、1つのことばの意味はその言葉単体の問題ではなく、それが所属する概念分野全体がいくつの単語でどのように分節されていて、どの単語同士が隣接しているのかを知らなければ理解できないのである。つまり、ことばを的確に使うためには、単語単体ではなく語彙全体をシステムと捉え、システムの中でそれぞれの単語の「意味」を理解しなければならない。これには高度なアブダクション推論を必要とする。
また、ほとんどの単語は複数の意味をもつ多義語である。ある子どもは、中華料理店で焼きそばが食べたかったが、店主に「ごめん、今日は麺が切れているからできないんだよ」と言われてしまった。その子どもは、「切れていてもいいからやきそば食べたい」と主張した。店主の「切れている」は「欠品」という意味だったが、その子は「麺はあるが、短くぶつ切りにされている」と解釈したのである。
ある特定の状況で、話者が使ったことばの意味を的確に解釈するということは、そのことばが慣習的に使われる異なる意味を知っていなければならない。しかし、それだけでなく、それぞれの意味がどのような状況でどのように使われるかという事例を豊富に経験している必要もある。言い換えれば、様々な意味に「接地」し、それぞれの文脈でのその単語の意味を解釈する、つまりアブダクション推論をする経験を豊富に持たなければ、単語の多義を柔軟に理解し、自分で使うことができない。逆にこれができるようになる過程で、自ずと質の高いアブダクション推論をする能力が磨かれていく。
世界中の超一流のピアニストが調律を熱望するピアノ調律師のステファンは、「優しい」「柔らかい」「鋭い」などのことばを手がかりに、依頼主のピアニストがイメージする、まだ実現できていない音を彼自身のアブダクション推論によって再現しようとする。どのような分野でも超一流の達人は、「普通」を逸脱し、他の人ではできない、生成AIにも代替されない仕事をする。しかし、逸脱がすぎると、他者はそれを理解できなくなる。他者にも理解可能なギリギリの、そして独自の逸脱ができることが達人の証である。その段階に成長できるためには、学び手はまず記号接地をし、そこから、試行錯誤を繰り返しながら、アブダクションを重ねながら自分にしか持ちえない知識とスキルを身に着けていくことが必要だ。
記号接地をしないAIはアブダクション推論もしない。ネット上に存在するデジタル情報からもっとも確率が高い予測をするAIは、学習材料とした熟達者の平均的パフォーマンスは再現できる。言い換えれば「普通に上手な」パフォーマンスはできる。しかし、人間の超一流の熟達者がもつ直観も、創造的な「逸脱」も原理的には成し得ないのである。
〈註〉
*1 福井県立図書館(2024)『100万回死んだねこ 覚え違いタイトル集』講談社文庫
*2 米盛裕二(2024)『新装版 アブダクション──仮説と発見の論理』勁草書房
*3 Thagard, P.(2007.)Abductive inference: From philosophical analysis to neural mechanisms. In A. Feeny & E. Helt(Eds.,)Inductive Reasoning: Experimental, Developmental and Computational Approaches(pp. 226-247.) Cambridge University Press.
*4 W・V・O・クワイン(1984)『ことばと対象』大出晃・宮館恵訳、勁草書房
*5 今井むつみ他(2022)『算数文章題が解けない子どもたち』岩波書店/今井むつみ(2024)『学力喪失』岩波新書