- 北の空からみなみへ -
exblog staff

タグ:pict-bit science ( 2 ) タグの人気記事
写真~はじめに(へっぽこ入門)
2008年 08月 24日
私の専門分野は、物理電気系・生体医療画像系(これで想像できる人は同業者 w)なのだが、このブログには画像や写真の理論的なことは何も書いていない。
少しずつ、点描的で雑多な けれども体系的で一貫性ある内容の文章を書いてみたいと思い始めている。(おそらく post カテゴリにまとめる形にする)

画像(写真)には、相反する要素がある。 相反するとは、「あちら立てれば、こちらが立たない」という状態。 片方を良くする(向上させる)と、もう片方が悪くなるという関係だ。

写真の歴史を(分岐を丸めて)ざっと振り返ると、写真乾板の白黒(モノクローム)⇒ 板状からフィルムへ ⇒ ブルー感光からオルソ(緑領域)へそしてカラー(パンクロ=全整色)へ ⇒ CCD/C-MOSといった固体検出素子へ という具合に進んできた。
 最後の 感光乳剤(フィルム)⇒素子(CCD)へという移行は、アナログからデジタルへという流れでもあった。 Analog/Digital はコンピュータで画像保存・処理する上で必要不可欠な過程であった。

画像がデジタル化したことで、不要画像の破棄ができるようになり再撮影が容易になりPC上で編集可能になりWeb上に発信可能となった。

アナログ画像であっても、感度(Sensitivity/Speed)と解像(Sharpness/Resolution)と雑音(Noise)の3要素は互いに相反した。 それはデジタル画像でもその関係は変わらず、さらには素子の受光した画像信号そのもの(RAWデータ)を処理する過程の中にも、「キメ細やかな濃淡を出そうとすると、ダイナミックレンジ(白から黒までの明暗の幅)が不足する」ような相反要素が存在している。 しかも、画像の総合判断は結局のところ人間の眼球経由で行われるわけなのだが、この目の特性と言うやつは年齢によって急速に劣化してゆくものでもある。

感度と雑音の影響を受ける「感覚」指標は、諧調(コントラストのメリハリと再現幅とが、鮮やかさになりダイナミックレンジになる)度になる。 この濃淡の分解能や、白トビしている(あるいは黒ツブレしている)中の微妙な濃淡を見分ける能力は、ほぼ256階調(つまり2進情報の量でいう8bit)であるといわれる。
 たしかに全年齢を通じて大雑把なくくりであるとそうなのだが、ごく普通の成長過程の人間でも20歳前後の一番に眼球性能のよい時期には、1024諧調を見分ける人はざらである。(半数はいないかもしれないが3分の1程度はいたような気がする。 学生時代の感触だけであるが)
 私は1024階調止まりだったから真偽のほどは分からないのだが、中には4096階調(12bit)の濃淡を「違いが判る」と言ったものもいた。 確かにその本人が違いを見分けられたというのが本当だったのかは確かめようもないのだが、資料でもそのような記載はあったように思う。
 実は、ワークステーションなどの専用グラフィック表示機構のないPCの表示で濃淡の諧調は256階調(8bit)しか表示できない。 RGBそれぞれ8bitなので フルカラー(24bit=16メガ色=1677726色)表示と称しているが、モノトーン画像(白黒表示)の限界諧調度は256階調しかないのだ。 銀塩写真(感光乳剤を塗布したアナログ写真)の白黒描出と、デジタル写真のそれとは印象が異なることがあるし、画面と透過フィルム印刷でも異なることがあるが、このあたりの「情報量」は扱い方でかなり違う。


情報の量ではなく質という観点から見ると、ノイズの特性が大きく質を左右する。
そして、このノイズというやつは、感度と反比例する(感度を上げるとノイズが増える)関係にある。 また、解像度を落とすということは感度を上げるということに直結する(長さ縮尺半分にすると画素あたりの受光面積は4倍になる)。

理論的な解説ではないですが、ノイズの視覚的特長をつかむによいかもしれません。
 ノイズ分析

 画像サイズを1/2に縮小すると、1ピクセルに4ピクセル分の情報がたたみ込まれる(マクロ的に考えると、画像の4枚加算と同じ程度にS/Nが向上)のだから当然です。
 いわば、2x2サイズの単純平滑化フィルターをかけたのと同じ効果になります。
 ※ S/N とは 「Signal-Noise ratio:信号雑音比」のこと。 定量的には4倍の画像加算で2倍のS/N向上が見込めます。 ISO 1600→400 に落として2倍のノイズ低減効果、100まで落とせば4倍に。 感度が同じであれば、(星の写真など)4枚加算で2倍になる計算となります。 理論的には、情報量(撮像時間や加算数)を2倍にするとノイズは√2倍に増えるので、結果的にS/N比は1.4142倍の向上なのです。

視覚上の雑音の検出特性は、年齢差よりも個人差が大きい気がします。(これはちょっとデータが記憶にないので、私の私的見解です)
 実のところ、視覚はかなりノイズだらけの出来損ない情報から、元情報を自動補間して認識する機構です。 このような脳内補間の能力は網膜センサーの性能の劣化を経験と訓練で穴埋めしているので年齢による衰えが目立たないのかもしれないと思います。


解像する力(空間分解能とも呼べます)は、これまた20歳頃にピークであとは低下の一途です。ピント合わせ=矯正視力 で補正しても、網膜上に結ばれた像自体を検出する能力が低下します。 若者で150μmを識別できます。 一般には200μm程度以上でないと(白黒100%の高コントラスト画像でも)識別は困難とも言われます。 PC上の像は ひとつの標準として72dpi(インチあたり72ドット)なので、353μmの画素サイズですが、結構許容できています。 < 人によっては目を近付けると 赤緑青の短冊が判ってしまうでしょうが ^^;
 以前の記事 : デジタル画像(へっぽこ)入門 - 空間周波数

単純な白黒画像に還元して、
  • 空間の解像度
  • 画素内の濃淡具合
  • 雑音によるざらつき
の3点に絞るなら、少しは解説できるかなという程度ですが、ぼちぼちと書いてみたいと思います。


そうそう、個人的には結構、写真ブログが好きでたまにお邪魔するのですが、あまりキレイな写真を見すぎると自分では恥ずかしくなってUPできないのでほどほどにしています。 んで、あんまりほどほどにし過ぎて、URL忘れることも多いので、今回おきにいりすと欄にいくつか書き加えます。

こちらには、北海道に住みながら未だ見たことのないブルーリバー(美瑛川)を紹介した記事を。
どのブログも、写真ブログとしてとっても憧れちゃいますねぇ。。。拙者はウンチクオヤジブログがせいぜいです(笑)


追記
[PR]
by bucmacoto | 2008-08-24 15:01 | particle
デジタル画像(へっぽこ)入門 - 空間周波数
2007年 09月 10日
 複数の画像ファイルの時は、これまでページサイズを抑える目的で More欄 を多用してきた。
 けれど、今回は小サイズのものばかりなので.おもて欄だけで解説することにチャレンジ♪
 ※ もくろみ挫折・・・w

 おそらくアナログのレコ-ド盤を,ストロボ光源や蛍光灯のちらつきで観察し,現れるシマを安定させることで回転数を微調整した経験をお持ちの方も多いだろう。 (おそらく私と同世代 ^^)

 ブラウン管テレビ画面をカメラで撮影した場合に横じまが目立つ時がある。 走査線とシャッターとのタイミングで、同期部分~非同期の領域とが混在するためだ。 これは長時間のシャッターを選択することで解消できる(平滑化・平均化の作用による)。
 ところが、映画のフィルムやVTRではそれができなくなる。 これは 一定時間の間にコマを送らなくてはならないためだ。 このように周期的な間隔でデータを取得することをサンプリング(標本化)という。

 元情報を損なわずにサンプリングするためには、一定の細かさが必要だ。
 これをサンプリング定理と呼び、その周期(つまりは最低限のサンプル周波数)の1/2までの情報しか再現できない。 これはナイキスト周波数と呼ばれる。
 目的とする対象の上限が決まっているなら、例えば音楽のように人間の可聴帯域(聞き分けることのできる周波数の幅)を対象とするなら、音楽CDでのサンプリングのように44.1KHzと決めることができる。 このCD-DAのサンプリングレートでは、22KHzがナイキスト周波数になる。 これは平均的な人間の可聴周波数上限である20KHzに由来する。 現在さらに高周波数のデジタルサンプリングがスーパーオーディオ規格として提唱されているが、これはかつて上限とされてきた20KHzが意識上で聞き分けられる範囲であって、聴覚閾値下の領域ではさらに高周波数にまで感じ取ることが出来るらしいことによる(録音した虫の音と、生で聞く虫の声に差を感じた経験者なら実感できるだろう)。 原音に忠実に・・・と願うほどに、上には上があることを思い知らせてくれる。

 音は時間軸に沿った強弱の信号だ。 1次元のサンプリング信号である。 等価な情報を視覚的に表現する道具として、オシロスコープ(商品名。 一般名はシンクロスコープ)波形がある。

 それに対し、画像は2次元空間に収められた信号の強弱だ。 単一輝度の信号なら白黒画像に、3原色(Red/Green/Blue)それぞれに輝度を与えるならカラー画像になる。

 さて、音楽でチューニングをする場合に、単一の音階(通常Aコード:ラの音 = 440Hz)を用いる。 このような単一波長(整数倍音を含んでも、ヒトは最低音階:基音を認識する)の音は、単色音ということができる。 ちょっと横道だが、人間がオギャーと生まれた泣声は万国共通で、このラの音(Aコード)であるのだという説もある。(眉唾だw)
 440Hzというのは、一秒間に440回の振動があるということだ。 音の波形を観察すると、なるほど440個の山と谷が観察できる。 音波とは違うが、交流電源波形の50Hz(西日本で60Hz)でも、山-谷の組み合わせ(ピークとボトムが両方あって1周期)が毎秒50回反復している。

blank.gif

 空間の場合は、白と黒のシマ模様(直線対)を ライン・ペア(LP)と呼ぶ。 例えば、1cmの中に10本の黒線と10本の白線があるなら、それは 10LP/cm の空間周波数ということになる。(医療画像などではこの性能が機器性能の指標のひとつ)
 だいたい50LP/cm、つまり5LP/mm(1ミリ幅に白黒縞模様が5セット=200μm)が目の良いヒトでも裸眼の限界と言われる。 教科書上では200μmが識別限界と記述されている。
post at 2007.09/10
last edit at 2007.09/11


こちらへつづきます(上記表示をカメラで撮影したのがこちら。)
[PR]
by bucmacoto | 2007-09-10 22:12 |   pre/pro