バイアスとノイズにまみれた人間の判断は必ず間違う

ダイヤモンド社と共同で行なっていた「海外投資の歩き方」のサイトが終了し、過去記事が読めなくなったので、閲覧数の多いものや、時世に適ったものを随時、このブログで再掲載していくことにします。

今回は2021年12月30日公開の「専門家や経営者も「ノイズ」により、 客観的無知を認められずに許容範囲を超えるミスを犯す」です(一部改変)。

fizkes/shutterstock

******************************************************************************************

ダニエル・カーネマンはエイモス・トベルスキーとともに、さまざまな独創的な実験によって、人間には多種多様な認知の歪み(バイアス)があり、選択や行動はつねに一定の方向にずれてしまうことを明らかにした。こうして行動経済学が誕生し、カーネマンは心理学者としてはじめてノーベル経済学賞を受賞した(トベルスキーはその前に死去)。

『NOISE(ノイズ) 組織はなぜ判断を誤るのか?』( 村井章子訳、早川書房)は、そのカーネマンが、「ナッジ(行動経済学の政策への応用)」で有名な法学者のキャス・サンスティーン、意思決定理論のオリビエ・シボニーとともに世に問うた新著だ。その主張をひと言で要約するなら、「意思決定が失敗する理由はバイアスだけではなく、それと同等か、それ以上に影響力の大きな要因=“ノイズ”がある」になるだろう。

バイアスがなくてもノイズは生じる

アメリカの裁判では、同じ犯罪であっても、若い黒人の有罪率は高く、童顔の白人だと執行猶予がつきやすい。これがバイアスで、裁判官や陪審員は、自分は人種差別とは無縁だと思っていても、無意識のうちに、白人よりも黒人を犯罪と結びつけている。

これだけでも不公平だが、こうした認知バイアスをすべてなくすことができたとしても問題は解決しない。裁判官に大きな裁量権が与えられていることで、同じ犯罪でも、どの裁判官に当たるかで判決や量刑が大きく異なっているのだ。

1970年代にこのことに気づいたのは著名な裁判官であるマービン・フランケルで、偽造小切手のほぼ同額の現金化で有罪になった(ともに前科のない)2人の男に対し、1人は懲役15年、もう1人が30日とされた事例などを大量に収集し、こうした異常な事態はとうてい容認できないと告発した。人種や年齢、性別、犯罪歴などの個別の要因を調整してもなお生じるこうした「ばらつき」がノイズだ。

バイアスが一切なくてもノイズは生じるし、それはしばしば許容できる範囲を大きく超える。CTやMRIの画像検査に人種や性別のバイアスが入り込む余地はないが、それでも同じ画像を複数の専門家に見せると、「がん」から「問題なし」まで検査の結果がばらつく。正解はひとつなのだから、このノイズを放置しておくと、健康なひとに不要な手術・投薬がなされたり、早期に治療すれば回復した患者が放置されたりする事態になる。

ノイズは裁判の判決や病気の診断だけでなく、児童相談所(虐待のおそれのある子どもを保護施設で預かるか、家庭に戻して様子を見るか)、難民認定申請(調査によれば、ある審査官は申請の5%しか許可しないが、別の審査官は88%を許可しており、「難民ルーレット」と名づけられた)など、広範な領域で観察されている。会社の採用や昇進、保険料・保険金の査定のような日常的な出来事にも大きなノイズがあり、当たりくじと貧乏くじで運命が変わったりする。「判断」のあるところには、つねにノイズが生じるのだ。

カーネマンらは、こうしたばらつきの要素を「レベルノイズ」「パターンノイズ」「機会ノイズ」の3つに分けて説明している。

レベルノイズは「きびしい裁判官」と「甘い裁判官」のばらつきのことで、被告人にとっては前者は「外れ」、後者は「当たり」になる。ここまでは多くのひとが気づいているだろうが、近年の心理学は、その時々の気分によって判断が変わることを明らかにした。

よく知られているのが刑務所の囚人の保釈審査の研究で、1日のうち午前中と昼食後は審査が甘く、昼前と夕方は審査がきびしくなった。これは意志力が枯渇するためで、最初は一人ひとりの事情を慎重に審査していても、空腹や長時間の仕事で疲れてくると意志力がなくなって、責任を問われることのない「保釈なし」に判断が傾くようになる。これが「機会ノイズ」で、天気のいい日や、応援するスポーツチームが勝った翌日には判断が甘くなるなど、さまざまなノイズが発見されている。

それに対してパターンノイズは、判断をする者の個性のことだ。いつもはきびしい裁判官も、高齢女性の軽犯罪には(自分の母親を思い出して)温情を見せるかもしれない。逆に被告人の利益を重視するリベラルな裁判官も、若い男性の薬物使用には(自分の息子に裏切られたことを思い出して)きびしい判決を出すかもしれない。

驚くのは、ばらつきのなかで、このパターンノイズの比重が予想外に大きいことだ。これは、専門分野ではレベルノイズの存在が(ある程度)知られるようになり、判断の手順をマニュアル化するなどして、改善が進んでいるからだ。機会ノイズは、心理学の研究対象としては面白いものの、実際の影響はそれほどのものではないらしい。

一方パターンノイズは、一人ひとりの判断者の個性であり、「人間らしさ」のことだ。これを否定してしまっては、「すべての判断は機械にやらせればいい」ということになってしまう。

そして著者たちは、まさにそのような主張をする。機械は原理的に「ノイズフリー」だが、アルゴリズムにバイアスが混入することはあり得る。だが人間の判断はバイアスとノイズの2つに「汚染」されており、一般論としては、判断は機械任せにしたほうがより「公平」なのだ。

だが人間の抵抗によって、こうした改革がすぐに実現できるとも思えない。だからこそ、すこしでも人間の判断からノイズを減らすようにしなければならない。そのため本書では、さまざまな現場でのノイズの事例だけでなく、それを改善する具体的な方策も豊富に提示されている。

その詳細は本を読んでいただくとして、ここでは『NOISE』のなかからとりわけ興味深かった議論を紹介してみたい。

社長の判断はチンパンジーと同じ

企業から官公庁、教育機関まで、日本の組織ではいまだにトップの「直観」で重要な決定するところが大半だろう。「だから日本的経営が世界から脱落するんだ」としばしば批判されるが、カーネマンらによればこうした状況はアメリカでもさして変わらないようだ。

CEOなどエグゼクティブの意思決定に関する調査によれば、彼らの大半が「直観だの、勘だの、判断力と称するもの」に頼っている。年齢が高く、経験豊富であるほどその傾向が高くなるのも日本と同じだ。

経営判断に関する研究によれば、直観の声とは「意思決定のプロセスにおいて、これが正しい、これが妥当だ、という確信のオーラ」だという。「ただしその確信のオーラには、明確に説明できるような正当な理由の裏付けはない。要するに、“自分にはわかっている。だがどうしてわかっているかはわからない”のである」というのが実態らしい。

なぜこんなことになるかというと、ひとは誰でも意思決定にあたって「これでよし」という内なるシグナルを必要としているからだ。なぜなら、この「シグナル」が得られないとものすごく不安になるから。

直観的な意思決定の問題は、それが正しいかどうかとはまったく関係ないことだ。心理学者のフィリップ・テトロックは、300人ちかい専門家(著名なジャーナリスト、学界の重鎮、国家指導者の顧問)を対象に、彼らの政治、経済、社会に関する予測が的中したかを20年にわたって調べた。その結果は、「平均的な専門家の予測的中率は、ダーツ投げをするチンパジーとだいたい同じ」という言葉でよく知られている。

テトロックによれば、専門家とは「説得力のある解説をする者」のことで、その予測が正しいかどうかは別だ。

なぜ人間のなかでもっとも賢い(はずの)専門家の予測が、チンパンジーと同じになってしまうのか。それは、複雑な問題には「解決不能の不確実性(知り得ない情報)」と「情報の不確実性(調べるればわかるが調べ切れていない情報)」があるからで、これを「客観的無知」と呼ぶ。

だが、CEOや専門家などの賢い(はずの)ひとたちは、自分が「無知(ignorant)」であることを認めることができない。これが「無知の否定(denial of ignorance)」で、「事実をいくら眺めてもまったく先が読めず、何かにすがりたいというとき、彼らは直観の声を聞いて自信を取り戻す。してみれば、無知が大きい時ほど無知を否定したくなるということになる」という話になる。

専門家の判断はすべて後づけ

専門家の客観的無知とはどのようなものか。それがよくわかるのが、2020年、プリンストン大学の社会学教授サラ・マクラナハンとマシュー・サルガニックをリーダーとする112人の研究者が、「社会科学者が実際に家族の将来をどの程度予測できるか」を調べた研究だ。

「脆弱な家庭と子供の幸福に関する調査」は、1998~2000年にアメリカの都市(人口20万以上)の「脆弱な家庭(その多くが貧困地域の母子家庭)」で生まれた約5000人の子どもの出生から15歳までをフォローした大規模な調査だ(出生時、1年後、3年後、5年後、9年後、15年後にデータ収集および両親・主保育者または本人からの聞き取りが行なわれた)。

その調査項目は「子供の祖父母の教育水準と職業から、家族全員の健康状態、家庭の経済・社会状態を表す指数、対面調査の結果、認知能力テストや性格テストの結果にいたるまで数千項目」に上り、それが膨大なデータベースに格納された。専門家が「脆弱家庭」について論じるときに必要な情報がすべてそろった宝の山だ。

だとしたら、このデータを縦横無尽に活用すれば、子どもの将来について正しい予測ができるはずだ。そう考えたマクラナハンとサルガニックは、その精度を競うコンペティションを実施し、各国の研究者に参加を呼びかけた。この企画は大きな反響を呼び、世界じゅうから応募者が殺到して、最終報告ではすぐれた成績を収めた160チームの結果が報告された。

予測するのは、子どもが15歳になったときの「住居の立ち退き、成績平均点、世帯の物質的生活条件」など6項目で、大半のチームがサイエンティストで構成され、機械学習(人工知能)を駆使して予測を行なった。

コンペティションの最初の段階では、参加チームはサンプル全数のうち半分のサンプルのデータにアクセスを許される。このデータには予測対象の6項目の結果も含まれていて、これでアルゴリズムをトレーニングする。次の段階で、トレーニングに使わなかった残りのサンプルにアルゴリズムを適用して6項目を予測する。

ビッグデータと(チェス、将棋、囲碁のチャンピオンにも勝つ)高度なAIを手にしているのだから、優勝したチームの予測精度はものすごく高かったにちがいない。誰もがそう思うだろが、結果は意外なものだった。

対象となった脆弱家庭が将来、家を立ち退くことになるかの予測は、的中率が57%(相関係数0.22)だった。主保育者の失業や、子どもの自己申告による「意欲」(目標を目指す忍耐力と闘志)など他の項目も同じで、一致率は最低で55%(同0.17)、最高でも58%(同0.24)でしかなかった。この成績は単純な線形モデルや人間による予測よりもよかったが、それでも「偶然よりすこしはマシ」という程度だ。

例外的に成績がよかったのは子どもの成績(一致率65%)と直近12カ月間の困窮状況(同66%)だが、前者はそれ以前の認知能力テストの成績から簡単に予測できるだろう。後者については、アルゴリズムは「空腹を感じたことがありますか?」「電話を止められましたか?」など11項目の質問に対する子どもの答えを総合して指数を算出したが、そんなことをしなくても、このように訴える子どもがいればその家庭が「困窮」していることはじゅうぶんに想像がつく。

コンペティションの結論は、「研究者たちは、(大量の情報を得たことで)脆弱な家庭についての理解が一段と深まったと感じたにちがいない。だが理解したはずの家庭に関する将来予測の精度は、この感触に釣り合わないほど低かった」というものだった。

一人ひとりの人生はものすごく複雑で、ビッグデータと人工知能をもってしても、子どもにどのような未来が待っているのかを正しく予測するのはものすごく難しい。“超絶AI”でも「客観的無知」を超えることはできないのだ。

めぐまれた家庭や、困窮する母子家庭で育つ子どもを見て、その将来を自信たっぷりに決めつける専門家がいるが、その予測はコイン投げ程度しか当たらない。成功者や犯罪者の人生を、子育てや家庭環境でしたり顔に説明するのは、すべて後づけの理屈にすぎない。専門家を含め、世の中に氾濫するこうした解説は、自分の客観的無知を隠蔽し、大衆にとってわかりやすい因果関係を巧みに「捏造」したものなのだ。

意思決定からノイズを減らすには「賢いひとを雇いなさい」

意思決定からノイズを減らすにはどうすればいいのか。著者たちのアドバイスは「賢いひとを雇いなさい」だ。なぜなら、一般知能が高いほど、よい判断を下す可能性が高いから。

「賢さ」を測定する方法としては、知能指数(IQ)よりも一般知的能力(general mental ability)を計測するGMAテストが近年では好まれている。アメリカ陸軍は1世紀以上前からGMAテストを導入しており、その膨大なデータから、「職業で到達した地位、選んだ職業における実績どちらについても、GMAスコアは他の能力、気質、適性、職業経験などよりずっと予測精度が高い」ことが何千もの研究で明らかになった。「言語や数値や空間把握などに関する標準化されたテストとしては、GMAテストは重要な結果の予測精度に関して群を抜いている」のだ。

知能指数で個人を評価することに対しては、「リベラル」な知識人を中心に強い批判が浴びせられてきた。「IQには意味がない」とか、「たんに頭がいいだけでは社会的・経済的に成功できない(幸福にはなれない)」などはいまでもよくいわれる。

こうした主張にもそれなりの正しさがあると思うが、著者たちによれば、知的な仕事(高度に複雑な作業)ではGMAスコアと職業的成功との相関係数は0.57(一致率67%)に達する。社会科学の基準では、相関係数が0.50を超えるのはきわめて高い予測精度で、「他の条件がみな同じであれば、知的能力が高いほど学問的業績のみならず仕事の実績も高い傾向がある」という事実はもはや否定できなくなっている。

これに対して、「医師や弁護士など高知能のグループでは知的能力の優劣はもはや無意味だ」との反論がある。医師国家試験や司法試験に合格した時点で、職業に必要な知能は保証されているのだから、あとは「共感力」や「誠実性」など別のパーソナリティが重要になるのだという。

だがこの(リベラルにとって)都合のいい理屈も著者たちに一蹴される。13歳のときに計測した能力で見て最上位1%(偏差値換算で73以上)の高知能グループでも、GMAスコアとその後の人生に強い相関があった。最上位1%集団の上位4分の1(偏差値78以上)は、下位4分の1(偏差値74以下)と比べて、博士号の取得、著作の出版、または特許の取得にいたる確率が2~3倍高かった。

この結果を著者たちは、「GMAは99パーセントタイル(偏差値73)と80パーセントタイル(偏差値58)、あるいは50パーセントタイル(偏差値50)との間だけでなく、99.88パーセントタイル(偏差値80)と99.13パーセントタイル(偏差値73)との間でもなお問題になるのである。それも大いに」とまとめている(偏差値換算は追加した)。

フォーチュン500にランクされる企業のCEOと424人のアメリカの富豪(保有資産で見て最上位0.0001%)の計約1000人を対象に行なった2013年の調査では、このハイパーエリート集団のなかでも、CEOでは教育水準が高く知的能力が高いほど報酬が多く、富豪では純資産額が多かった。

こうしたファクト(事実)から著者たちは、「一般的な知的能力は判断を要する職業におけるすぐれた結果に大いに貢献する」し、「あるスコアを超えたらその後の差はたいした意味を持たないというもっともらしい意見は、いまのところ実証的な裏付けを得られていない」とする。「判断力が求められる仕事に誰かを採用するなら、できるだけGMAスコアが高い人間を選ぶことが理に適っている」のだ。

私はこれまで、「知識社会における経済格差は「知能の格差」の別の名前だ」と繰り返し指摘してきたが、日本において賛同を得ることはほとんどなかった。だが英語圏では、ノーベル賞受賞者を含む超一流の執筆陣が、一般向けの啓蒙書のなかで同じことを堂々と述べている。

なお、ここでは「知能と知的作業が高い相関にある」という当たり前の事実が確認されているが、別の研究では、芸術などの分野においては上位5%(偏差値65)程度を超えると、知能指数と成功の相関はなくなるとされる。文学にしても、音楽や美術にしても、一般大衆は(自分とはかけ離れた)高知能の人間の創作物を求めているわけではないと考えれば、これも当然の結果だろう。

超予測者はなにが優れているのか

「正しい意思決定をするには高い知能がなければならない」というのはなんとも救いのない話だが、ここでがっかりする必要はない。「専門家の予測はチンパンジーと同じ」と述べて物議をかもしたテトロックは、2011年に「優れた判断力プロジェクト(GJP)」を始めた。膨大な数の予測を検証すると、ほぼつねにより正しい予測をする成績抜群のスーパースターがわずかながら存在することがわかったからだ。

テトロックは彼らを「超予測者」と名づけた。超予測者は専門教育を受けているわけではないが、どういうわけか学界などの専門家よりも正しい意思決定ができるのだ。

そこでテトロックは、専門家ではなく、さまざまな経歴を持つごくふつうのボランティア数万人に「北朝鮮は今年中に原子爆弾を投下するでしょうか」「ロシアは今後3カ月以内にウクライナの領土の一部を公式に併合するでしょうか」などの予測をしてもらった。すると予想どおり、大半の成績はお粗末だったが、2%だけ飛びぬけてすぐれたひとたちがいた。この超予測者について、ある政府高官は、「傍受した情報など機密情報を扱う資格のある情報機関のアナリストの平均を上回る」と評価した。

彼ら/彼女たちはなぜ、正しい予測ができるのだろうか。テトロックはそれを、「分析的、確率的に考えられる」からだという。

分析的に考えるとは、問題を構造化することだ。「EUから離脱する国はあるか」などの地政学的問題に取り組むとき、超予測者はいきなり漫然と予測するのではなく、まず構成要素に分解する。直観に頼らず、「答えがイエスになるのは何が起きた場合か」「答えがノーになるのは何が起きた場合か」を考え、次に、そこから派生する問いをまた考える。こうして問いと答えを重ねていく。

確率的に考えるとは、基準率をつねに探すことだ。「1年以内に中国とベトナムが国境紛争をめぐって武力衝突する可能性はあるか?」と訊かれたとき、彼らは直観に従うのではなく、「過去の国境紛争が武力衝突に発展したケースはどのくらいあるのか」を考え、もしそうしたケースが稀だとすれば、まずその事実を押さえる。その後にはじめて、中国とベトナムの現状に目を向けるのだ。

ここからわかるように、超予測者は絶対的な知的能力の持ち主ではないが、それをどう応用するかを知っているのだ。

このとき重要なのが「積極的に開かれた思考態度」で、自分の当初の仮説に反するような情報や反対意見を積極的に探し、「反対意見が正しく自分の判断がまちがいである可能性をいつでも認める用意があり、自分と同じ意見の人よりちがう意見の人に耳を傾けるほうが有益だと考える態度」だとされる。超予測者は、新しい情報を入手したとき、当初の予測を躊躇なく修正できるのだ。

テトロックは、超予測者は「永遠のベータ版」だという。彼らは「試す、失敗する、分析する、修正する、また試す」という思考サイクルが大好きなのだ。

裁判官や医師、難民審査の担当官だけでなく、わたしたちは自分の人生において日々、無数の選択を迫られている。その多くはささいなものだろうが、ときに重要な意思決定をしなければならないことがある。

そんなとき、直観を信じて、バイアスやノイズで誤った結論に飛びつくのではなく、超予測者のように考え、より正しい答を見つけることができるなら、幸福な人生を実現するうえで大きな助けになるだろう。

禁・無断転載