【DS検定頻出・画像データ処理#1 】標本化・量子化・符号化

「画像処理」とは、画像データの性質（形状、色、サイズ、方向など）を加工し、そこからデータの特性を抽出するための技術全般を指しています。例えば、画像のリサイズ、トリミング、特定の被写体の輪郭の強調といった処理が挙げられます。処理した画像を、画像認識（写っている対象物を識別するタスク）に使用することが多いです。そのため、画像処理は認識タスクに有効な特徴量を際立たせるという役割を持っています。

また、動画データは画像データを多数枚連続的につなぎ合わせたものなので、動画の処理とは画像を連続的に、高速に処理することです（別の記事で解説します）。

生データとしての画像データは、アナログ情報であるため、コンピュータを用いて画像認識を行うためには、適切な方法で数値化し、デジタル情報に変換する必要があります。

アナログの画像をデジタル表現に変換するために、「標本化（サンプリング）」、「量子化」、「符号化」の順番で変換を行います。

この「標本化→量子化→符号化」の流れは画像処理に限ったものではなく、音声データのサンプリングレートにおいても同じ考え方です。

■画像の標本化
■画像の量子化
■画像の符号化

■画像の標本化

標本化とは、アナログの画像を等間隔の格子状に区切り、各格子の色の濃淡を読み取る処理です。区切られた格子の一つひとつは「画素（ピクセル;pixel）」です。1つの画素は1つの単色（色の濃度）を表しています。画像のデジタル表現の最小単位はこの「画素」です。

ここで、サンプリングの粒度が荒い、つまり格子の幅が大きいほど格子の数が少なくなるため、情報量が少なくなります。ジャギーと呼ばれる段階状のギザギザ線が現れて、被写体の輪郭をぼやかしてしまいます（図１左）。被写体の曲線や斜線の輪郭に特に現れやすいです。エイリアシングと呼ばれる本来存在したい縞模様が現れることもあります。

画像の「解像度」を高めることとは、被写体を鮮明に忠実にデジタル表現で再現することです。そのためには、ある程度細かい粒度でサンプリングを行うことが必要です。しかし、逆に格子が細かすぎると、データサイズが大きくなり、計算コストが高くなります。そのため、標本化処理においては、画像の再現度と計算コストのバランスを図ることが必要です。

そもそも、多数の画素の集合体として一枚の画像を表現するため、標本化した後に画素の多いデータの方が画像の被写体が鮮明に表現されます。例えば、私たちは写真データについて、「○○pixel」のような表現で写真の鮮明度を表すことがありますね。画像のサイズは変わらないので、画素が多いとは、画素が小さくて細かいことと同じことです。

画像の解像度は通常、ppi（pixel by inch）という単位で表現しており、デジタル化された画像の１inch（〜2.5cm）あたりの画素数の値です。図１には、左から低いppiでジャギー現れているものから、高いppiで解像度の高い鮮明な画像の順で示されています。