世界の情報量は求められるのか?

情報学 | 2011/02/19

先週、Science誌に、「情報を保存、通信、計算するための技術的容量」についての調査結果が掲載されたことが話題になっています(論文ニュース)。この論文によると、保存された情報は2.9億テラバイト、通信された情報は20億テラバイト、情報処理能力は6.4兆MIPSだそうです(テラはギガの1000倍で、1兆)。これだけを聞くとすごい数字のようですが、最新のハードディスクが1テラバイト単位ですので、その3億倍というのは、まぁ、妥当なところではないかという気がします。むしろ、通信量がその7倍というのは、さすがに多いな…と思いましたが。

○情報量の解釈依存性

さて、雑談はさておき、そもそもこの論文のような形で「世界中のあらゆる情報の情報量」を求めることができるのでしょうか。これは、情報学的には若干複雑な問題です。

上記の論文では、紙やフィルム、レコードに記録された情報も調査しているとのこと。しかし、そもそも紙に印刷された情報の情報量をどのように求めることができるのでしょうか。たとえば、ある本があり、そこにはイラストや写真などが一切含まれていなかったとします。ここに書かれている文字を、現在の技術でデータ化、圧縮したときの情報量は求めることができます。しかし、この本の情報量は、本当にこれだけでしょうか?紙質や印字品質の欠けを含めて情報を正確に保存しようと思ったら、一ページずつスキャナで取り込まないといけません。これは文字だけの情報よりもはるかに大きいことになります。

では、このときの読み取り解像度はどの程度にするべきか。これは、その本の媒体に対する評価によって大きく変わります。その本が、世界最初の印刷物で、紙や活字の状態まで重要だと考えられるのなら、非常に高い精度の画像情報が必要とされます。しかし、去年発売された出版物なら、フォントの種類やデザインは重要でも、それ以上の細かい情報はどうでも良いと考える人が多いでしょう。

さらに、こういうことも言えます。A4の白紙の紙があったとします。普通に考えたら、この紙の情報量はゼロです。しかし、それが事件の犯行現場に残された証拠だとしたら、その紙には多くの情報が含まれていることになります。朝食のパンは、何の情報も含んでいないように見えますが、表面の凸凹や内部の気泡の配置を記録しようと思ったら、かなり大きな情報量を持つことになります。このように、情報量というのは、解釈によって決まるものなのです。

○シャノンの情報量とシステム

これは、情報に関する特殊な意見ではありません。ビットやバイトと言った単位で表される「情報量」を数学的に定義したシャノンの理論から、自然に導かれる結論です。

シャノンは情報の定義をする上で、対象そのものに情報が備わるという見方を取りませんでした。シャノンは、送信者と受信者が、「メッセージとその表現方法の組み合わせ(コード)」について、あらかじめ合意していて、それに基づいて通信が行われるとき、「情報量」を決められると考えたからです。たとえば、A~Zの26個のアルファベットから取り出された1文字を相手に伝えるという状況を考えます。このとき、送り手も受け手もA~Zのアルファベットを理解していないといけません。そこでは、エー、ビー、シー…という概念(メッセージ)と、A, B, Cという文字(表現方法)の対応(コード)が、送り手と受け手で共有されていないといけないのです。

つまり、シャノンの理論から導かれる自然な結論は、「メッセージとその表現方法の組み合わせ(コード)」が決まらないことには、情報量を求めることができないということです。これは紙のような単なる物体の情報量は、原理的に定義できないということを意味しています。

ただし、ある人がその物体に何らかのメッセージを想定する場合は、情報量を求めることができます。たとえば、A4の紙があったとします。ある人は、紙(表現方法)にビジネス上の一般的な文書(メッセージ)が保存されていることを想定するかもしれません。その人にとって白紙の紙という形で表現された情報の情報量はゼロです。しかし、紙の研究をしている人なら、その人とは全く別の、紙質に関する情報を、メッセージとして読み取るでしょう。この人にとってA4の白紙の紙(表現方法)は情報の宝庫なのです。このように、単なる物体の情報量を決めるためには、情報をそこに記録した人が、どのようなメッセージを伝えようとしたか、情報を読み取る人がそこにどういうメッセージを想定しているかが分からないといけません。いずれも簡単には決まらない問題です。

しかし、こうして「メッセージと表現方法の組み合わせ」が想定できる場合は、まだ良いのです。もう少し別の例を考えましょう。AさんとBさんが会話していたとします。この情報量はどの程度でしょうか。Aさんの身振り、手振り、息づかい、さまざまな情報が会話にかかわっています。しかし、かかわっていないかもしれません。この会話の情報量は測定不能としか言いようがありません。たしかに、日常会話においても、何か伝えたいこと(メッセージ)が存在して、それを伝えようとしているという場面はあるでしょう。しかし、そうしたメッセージは、多くの場合、伝えたい人が勝手にそう思っていると言う意味でのメッセージであり、二人の間で事前に共有されたメッセージ、シャノンの情報の定義に基づくメッセージとは違います。こうした状況で情報量を測定することはできないのです。

これは、私たちが「情報」と考えているほとんどあらゆることに成り立ちます。たとえば、ある「森」の情報量を考えたとします。そこに生きている生物の相互作用を情報と呼ぶのであれば、無限大とも言える非常に大きな情報がそこで交わされていることになります。しかし、警備会社の従業員なら、その森を警備するのに必要な画像データの情報量をもって、その森の情報量と考えるかもしれません。開発技師なら、森の性質や土壌の性質のデータがその森の情報量と考えるかもしれません。このように、特定の対象の情報量は、何らかの視点や見方を抜きにして考えても意味がありません。これは、シャノンの情報理論から自然に導かれる結論なのです。

○コンピュータ・システムと情報量

では、なぜ私たちは、ファイルやCD-ROMやハードディスクの容量を求めることができるのでしょうか。それは、コンピュータにはハードウェアやソフトウェアの設計上、「メッセージと表現方法の組み合わせ」(コード)が組み込まれているからです。コンピュータでは、多数の「メッセージと表現方法の組み合わせ」が世界共通で使われています。そして、こうしたコンピュータ・システムのコードに基づく限り、情報量を決めることができます。私たちが日常的に「情報量」と言うとき、多くの場合、こうした「コンピュータ・システムのコードに基づいた情報量」を意味しているのです。

では、紙やフィルムといったアナログメディアに保存された情報はどうでしょうか。先述したように、紙やフィルムに保存された情報は、シャノンの情報量の定義に厳密にしたがって客観的に情報量を決めることができません。しかし、こうした情報であっても、「一般的な用途に使うために、コンピュータが扱う情報に変換したときにどの程度の情報量になるか」を見積もることができます。これが、俗に言うところの「紙に保存された情報の情報量」です。ただし、当然のことながら「一般的な用途」と言っても人によって違うので曖昧です。メディアの情報を記録した人の意図、情報を読み取る人の視点など、さまざまな要素がそこに関わっており、客観的なものになりえないのです。

これは、厳密に言えば、CD-ROMやDVDでも同じです。CD-ROMの容量は700メガバイト程度ですが、表面の微妙な凹凸の変化に興味を持っている研究者は、それよりはるかに大きな情報量が想定することができるかもしれません。しかし、それを「一般的な用途」と言うことはできないでしょう。CD-ROMやDVDのようなデジタル媒体であれば、「一般的な用途」は明らかであり、それに基づいて正確な情報量を求めることができます。しかし、紙やレコードのようなアナログメディアの場合、人によって「一般的な用途」の解釈に差が生じ、かなり幅のある値しか求まらないことになります。

もちろん、Science誌に掲載された調査結果に意味がないとか非科学的だというわけではありません。「一般的な用途に使うために、コンピュータが扱う情報に変換したときにどの程度の情報量になるか」は、厳密には決まらないとは言え、ある程度の範囲に収まるだろうし、それに基づいて情報量を求めることには意味があると思うからです。しかし、そこで求められる情報量は、こうした理論上の限界を踏まえたものだということに、留意しなければいけません。これは「情報」を一般化して議論しようとする時に、非常に重要なポイントではないかと思います。

はてなブックマークに追加 del.icio.usに追加 POOKMARK Airlinesに登録 livedoorクリップへ追加 @niftyクリップへ追加 Buzzurlにブックマーク newsingにピックアップ Choixに投稿 Furlへ追加 Blinklistへ追加 Redditに投稿 twitterでReTweet

固定リンク | コメント(2件) | トラックバック(0件)

コメント

Don't think feel.

投稿: チョーさんは偉大 | 2011/10/07 0:12:25

こんばんは!インターネットには嘘の情報があふれていて、取り扱いに気をつけなきゃいけないのはわかったんですが・・・
どうしていけばいいのかわかりません。最低限の機能(学校の公式サイトやメール)だけにすればよいのでしょうか。

投稿: マヤ | 2012/01/05 20:35:51

コメントを書く

トラックバック

この記事のトラックバックURL:
(トラックバックは記事投稿者が公開するまで表示されません。)

情報学ブログをRSSで購読する

Googleで購読 はてなRSSで購読 livedoor Readerで購読 Bloglinesで購読 My Yahoo!に追加

その他のRSSリーダー

管理人のつぶやき