« 『安倍政権のネット戦略』/創出版 | トップページ | 『クォータリー マグナカルタ Vol.05』/島地勝彦 »

2014/01/12

『異端の統計学ベイズ』/シャロン・ヴァーチェ・マグレイン

4794220014 異端の統計学 ベイズ
シャロン・バーチュ マグレイン 冨永 星
草思社  2013-10-23


by G-Tools

ビッグデータに関する資料や書籍を当たっているうちにいつの間にか興味を惹かれていたのがベイズ。今思い返すと、ベイズの何を聞きかじって興味を惹かれたのか明確に思い出せず、また、ベイズと巷で取り上げられる意味でのビッグデータとの関連性が今ひとつ明確に説明できないけれど、ベイズ統計学と本著は非常に読み応えがあり抜群に面白かったです。数学に全く興味が持てなくても、現代の最先端のITを支えている理論、その考え方が、黎明の1740年頃から今に至るまでどんな歴史を歩んできたのか、スリリングなドキュメンタリーに惹きつけられると思います。

ベイズの定理そのものの解説や来歴は脇に置くとして、「ベイズ」という統計学の歴史を読もうとして思いがけず現在の日本の情況を顧みずにいられない記述に二箇所出くわします。一つは第二次大戦終結時にチャーチルが暗号化解読の証拠の破棄を命じた部分、もう一つは1970年代のアメリカでスリーマイル島原発事故をベイズ理論で予見していたという部分です。

p161「なぜこんなにも長い間、暗号解読を巡る話が伏せられてきたのだろう。たぶんそこには、自分たちがタニー・ローレンツ暗号を解読できるという事実をソビエト政府に知られたくない、というイギリスの意図が働いていたのだろう」

連合国の勝利にはチューリングらによるドイツ軍の暗号・エニグマの解読が大きく貢献したのですが、チャーチルはエニグマを所有したソビエトに、自分たちが暗号解読能力を保有していると知られないほうが好都合と判断したというものです。このために、暗号解読に多大な貢献をしたベイズ理論は陽の目を見られなくなるのですが、この判断をベイズ理論の立場から見るのか国家安全保障の立場から見るのかで意見は大きく異なってしまいます。これ以外にも、本著には幾度と無く「機密扱い」という文言が出てきます。学者達が国家の安全に貢献する研究を行ったにも関わらず、その成果が「機密」となって世に知らしめられない事態。特定秘密保護法の本来的に期するところはこういった国家の安全に関わる機密情報だと思うのですが、意図するところが仮に国民として納得できるそれであったとしても、その制定過程を誤ると理解できないし、その法によって実現される規制が本来の意図から大きく逸脱してしまうということを改めて思いました。

p326「アイゼンハワー大統領は1953年に「平和のための原子力」と題する演説を行って、原子力産業の展開に着手した」「そしてその20年後には、環境や人々への安全リスクに関する包括的研究はいっさいなされぬまま、アメリカ国内で計50基の原子力発電所が稼働していた」
p329「2003年にはアメリカの全電力の20パーセント相当が104基の原子力発電所で作られていたにもかかわらず、1978年からこれを執筆している今(2010年から2011年にかけて)までに、原子力発電所を新設せよという命令は一度も下されていない」

「これまで事故が一つも起きていないのだから、この先も事故は起こらないはずだ。そうはいっても疑問は残った。不可能とされることは、ほんとうに起きないのだろうか?」この言葉は、3・11における福島原発事故を経験した日本人には重く痛く突き刺さります。アメリカでは、「起きていないこと」の起きる確率を導き出そうという発想がありました。おそらく、日本にはそれはなかったのでしょう。これはひどく単純でかつ重大な違いのように思えます。今のところ起きていない事象の発生確率を考えるためにはどのようにすればいいか、そもそもそれを考えようとするかどうか、「ありえない」という言葉が安直に使える日本語の世界では、根付きようのなかったスタンスなのかも知れません。

ベイズ理論は、そのような「起きていないこと」の発生確率を考えることのできる理論です。これは頻度主義と言われる一般的な統計手法、つまり発生件数をカウントして検定して確率を導く方法ではそもそも扱いようのない課題でした。この点に興味をもたれたら、それだけでも読む価値のある一冊だと思います。

p013「何かに関する最初の考えを、新たに得られた客観的情報に基づいて更新すると、それまでとは異なった、より質の高い意見が得られる」「この定理を認めない人びとにとって、ベイズの法則は主観性の暴走でしかない」p047「西欧世界の至る所で純然たるデータの収集や組織化が加速して、正真正銘の情報爆発が起きた。1700年代には、動物の種や惑星が新たに多数確認されると同時に、物理的な宇宙に関する知識も飛躍的に増えた」 →ビッグデータを相対的な事象と捉えれば、過去に経験のある事象といえる

p048「膨大なデータの分析はきわめて難しい問題で、ラプラスはすでに、この問題を解決するには今までとはまるで異なる思考法が必要だ」「確率こそがさまざまな出来事とその原因につきものの不確かさを扱う手法」
p058「1771年、フランス政府はあらゆる地方の役人に、出生と死亡の数を定期的にパリに報告するよう命じた」
p060「ラプラスは母関数という名の数学の魔法を使って、手に負える関数から自分が望む関数を引き出していた」
p086「どの会社にも、ピーク時に予想されるすべての電話を処理できるだけのシステムを構築する力はなかった」
 →スパイクトラフィックの問題
p116「ジェフリーズが統計を使って未来の行動の指針を得ることではなく、科学的な証拠から推論を行うことに関心を持っていた」
p122「おもしろいことに、ひょっとすると解読できるかもしれない、と最初に考えたのはポーランド人だった」
p124「ドイツ側は、軍の意思伝達の標準手段となる装置をどんどん複雑にしていった。そして約四万個の軍用エニグマを、ドイツ陸軍、海軍、空軍、予備役、最高司令部、さらにはスペインやイタリアの国粋主義勢力やイタリアの海軍にもばらまいた。1939年9月1日にドイツ軍がポーランドに侵入する際に猛スピードで電撃作戦を展開できたのも、充電器つきエニグマのおかげ」
p130「チューリングはまず、ボンブが行わねばならない検査の数を減らすことにした」
p132「バンという単位は、これとほぼ同じころにベル電話研究所のクロード・シャノンがベイズの法則を使って見つけ出した「ビット」という情報の尺度と基本的に同じもの」「チューリングが信念を測るために考案したバンという尺度」
p139「枯れ草熱(花粉症)」
p161「なぜこんなにも長い間、暗号解読を巡る話が伏せられてきたのだろう。たぶんそこには、自分たちがタニー・ローレンツ暗号を解読できるという事実をソビエト政府に知られたくない、というイギリスの意図が働いていたのだろう」
p164「そのうえ間の悪いことに、1950年にはイギリス上流階級の二人のスパイー乱交好きを公言するアルコール中毒の同性愛者ガイ・バージェスと、ケンブリッジ大学の学生時代からバージェスの友人だったドナルド・マクリーンーが逮捕を逃れてソビエトに逃げた」
p174「過去に生きる人もいれば、未来に生きる人もいるが、もっとも賢い人々は今を生きる」
p180「ニューヨーク市の上空でDC-7型機とロッキード社の大型機コンステレーションが衝突して、乗客乗員やマンションの住人など計133人が命を落とした」
p196「尤度原理によると、実験データに含まれる情報は、すべてベイズの定理の尤度の部分にようやくされることとなる。尤度部分は新たに得られた客観的なデータの確率を表していて、事後確率とはまったく関係がない」「この原理によって、事実上分析は著しく簡素化される」
p224「マダンスキーが取り組んだ水爆の問題には、政治的にも統計学的にも微妙なところがあった。事故で爆発した原爆や水爆はそれまでに一つもなかった。1945年夏のアメリカによる日本への原爆投下からの12年間にいくつかの核爆弾が爆発したのは事実だが、それらはすべて兵器試験の一環で、わざと爆発させたものだった。」「これまで事故が一つも起きていないのだから、この先も事故は起こらないはずだ。そうはいっても疑問は残った。不可能とされることは、ほんとうに起きないのだろうか?
p318「1946年には、シャノンの「バイナリー・デジット」に代わるものとして「ビット」という言葉を作った」
p326「アイゼンハワー大統領は1953年に「平和のための原子力」と題する演説を行って、原子力産業の展開に着手した」「そしてその20年後には、環境や人々への安全リスクに関する包括的研究はいっさいなされぬまま、アメリカ国内で計50基の原子力発電所が稼働していた」
p328「データをランダムな変数として扱うことは、ときとしてベイズ派のアプローチと関連づけられている・・・ベイズ的な解釈を用いることも可能」
p329「2003年にはアメリカの全電力の20パーセント相当が104基の原子力発電所で作られていたにもかかわらず、1978年からこれを執筆している今(2010年から2011年にかけて)までに、原子力発電所を新設せよという命令は一度も下されていない」
p338「自分でシナリオをひねり出したうえで、それらのシナリオに専門家がどう賭けるを推し量るしかない
p343「件のB-52が空中で爆発したときにはちょうど風が吹いていたので、町とその周囲の畑の558エーカー(約2.3平方キロ)に放射性プルトニウムが降った」
p353「スペイン当局は、パロマレスの事故から40年近く経った2002年に、この一体の地表に放射能による危険はいっさい見られなかったと発表した。また、スペインおよびアメリカの防疫官は、パロマレスの住人は一人も放射能関連のがんにならなかったと報告した。そしてさらに、1000立方メートルに及ぶパロマレスの土を4810個の金属ドラム缶に入れて運び出し、サウスカロライナ州に埋める作業を行ったが、それに従事した1600人の空軍職員が被曝した放射能はごく微量で、現在の放射能を使った仕事に従事する労働者の被曝限度の10分の1でしかなかったと発表した。一般には、プルトニウムは飛び抜けて危険な放射性物質だと思われているが、政府の研究によると、プルトニウムのアルファ線はきわめて弱くて皮膚や衣類を通さない。また、たとえ飲み込んで摂取されても便に混じって排出される。プルトニウムは、吸い込んだときがもっとも危険なのだ。公式の報告書によると、プルトニウムに汚染された環境で30年以上生活し、仕事をしてきたにもかかわらあず、パロマレスの住民たちが吸い込んだプルトニウムの量は、国際放射線防護委員会が定めた最大安全量よりずっと少ないという。/そうはいっても、2006年には放射性のあるカタツムリが見つかり、地下に危険なレベルのプルトニウムがあるのではないかという恐怖が高まった。これを受けて米西合同の研究がはじまり、子供たちは爆発現場近くの野原で遊ばうぬよう、また、この地方のごちそうであるカタツムリを食べぬよう警告が出された」
p382「コンピュータが多変数革命を引き起こし、「(高)次元の呪い」と呼ばれる未知数の猛烈な大発生が起こりはじめたのだ」
p386「ハリスは、行列の演算に使われるAPLという言語を使ってディーゼルの排気に関するプロジェクトをプログラム」
p402「物理学者がモンテカルロ法と呼んでいた過程全体を改めて「マルコフ連鎖モンテカルロ法」、つづめてMCMC」「爾来ベイズとMCMCの組み合わせは、「データや知識の処理のために作り出されたメカニズムとしては、ほぼ間違いなく最強」
p405「BUGSのおかげでベイズは一躍人気者」
p407「乳がんはまれな病気なので、陽性という検査結果が出たとしてもほぼ全員ががんでないことが判明するのだ」
p409「一挙に全体が発見されるものなので、製薬会社がベイズ統計の事前の直感を主観的に偏らせる恐れがある。そのためFDAは、アメリカでの薬の販売認可を申請する際にベイズ統計を使わせてほしいという製薬会社からの圧力に、長い間抗い続けている」
p422「ジョン・ナッシュを描いた作品として、『ビューティフル・マインド』という本と映画がある」
p437「ヴォリンスキーは、1997年に患者が心臓発作を起こす確率の予測をテーマとする博士論文をまとめたときに、ベイズモデル平均化法という、互いに補足しあうモデルに結果を分担させ平均化する方法を用いたことがあった」「分担(シェアリング)」「ネットフリックスのコンテスト」
p446「脳がこれこれの行動をせよと命じるたびに、我々は少し違った動きをする」
p448「文章や画像を意味や内容にしたがって吟味できるのは人間の脳だけだ」

|

« 『安倍政権のネット戦略』/創出版 | トップページ | 『クォータリー マグナカルタ Vol.05』/島地勝彦 »

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/7655/58928412

この記事へのトラックバック一覧です: 『異端の統計学ベイズ』/シャロン・ヴァーチェ・マグレイン:

« 『安倍政権のネット戦略』/創出版 | トップページ | 『クォータリー マグナカルタ Vol.05』/島地勝彦 »