キーワード辞典
Byteに纏わるエトセトラ

登録日 13/10/02   更新日 19/08/17



ビット

コンピュータが扱うデータのサイズの最小単位。英語の binary digit の略。 1個の、ドーナツ型の磁石(磁気コア)の回転の向きや、コンデンサの電荷の量などの、状態の違いによって、 1ビットで、2つの値を表現する。
因みに、「磁気コア」の「コア」は「コアダンプ」の語源。


キャラクタ

キャラクタマシンにおいて、 そのコンピュータで使用する英数字コード1文字分。 そのビット数は規定されておらず、6だったり、7だったり、8だったり、コンピュータによってマチマチ。
キャラクタマシンについては、後述。


ワード

そのコンピュータがデータを処理をする際の、ひとかたまりの単位。 「ワード」のビット数はコンピュータによって違う。 日本語で「語」と言ったりする。 例えば、COMET2は、1語が16ビット。


バイト

元々は「複数ビット」を意味する、データのサイズの単位。 1バイトのビット数は規定されておらず、実は、コンピュータによってマチマチであったが、 1980年頃から1バイトは8ビットであることが一般的になり、 2008年にISO(国際標準化機構)やIEC(国際電気標準会議)で 「1バイトは8ビット」という意見が採択されている(IEC_80000-13)。

但し、1バイトが8ビットでは無いコンピュータも、存在する。
例えば、日本電気のACOS-6は、1バイト=9ビットで処理をし、1ワードは36ビットである。 内部で使用するコードは、内部処理ルーチン等で使われる6ビットの文字コード(BCDコード)と、 COBOL等での通常の文字処理を行う際に使うJISコード(JIS X 0201)の二種類を持つ。 前者は1ワードは6文字分、後者は1ワードは4文字分となる。

また、C/C++の言語規格では、 「char型のサイズは1バイト」と定義されているが、 「1バイトが8ビット」という定義は無い。 char型のビット数は、CHAR_BITマクロで定義され、 CHAR_BIT マクロは、 ヘッダで定義されるマクロで、 少なくとも8以上に定義されることが保証されている。 よって、もし、1バイトが16ビットであったり、64ビットであったとしても、 規格上は何ら問題は無く、そうした処理系が実際に存在する。


オクテット

上記の理由により、敢て8ビットであることを明示する為に、バイトに換えて使用する言葉。 1オクテットは8ビット。通信分野で、使われている。




キャラクタマシン

「キャラクタ(1文字の文字コード)」で文字を表現し、 この単位を基にしてデータを処理するコンピュータ。 バイトマシンが一般化する以前、大昔の事務処理用汎用コンピュータに多く、文字単位の処理を行うのが得意。 数値は二進化十進法の可変長データである為、計算過程での誤差が起きない特徴が有る。
「キャラクタ」のビット数は、6だったり、7だったり、8だったり、コンピュータや処理系によって違い、 更に、複数のキャラクタをまとめてワード単位として処理をするものが登場するが、処理の基本は文字単位。 COBOL経験者は、懐かしいかも。後述の「おまけ」も参照のこと。


ワードマシン

「ワード」のサイズを基にしてデータを処理するコンピュータ。 数値を、整数、短精度、倍精度、など、固定長のデータ型で表現する。科学技術系の汎用コンピュータ向け。 コンピュータのプロセッサの場合、そのプロセッサの汎用レジスタのサイズをワードとし、 その倍長を「ダブルワード」、半分を「ハーフワード」などと呼ぶものもある。
キャラクタマシンにもワードの概念は有るが、 「ワードマシン」は12ビット~36ビット程度のワードの扱いを得意とし、 「キャラクタマシン」は6ビット程度の「字」の扱いを得意とした。


バイトマシン

「バイト」という単位を基にしてデータを処理するコンピュータ。 物凄く乱暴に言うと、キャラクタマシンとワードマシンを一緒くたにした様なコンピュータ。 前述の様に、1バイト=8ビットとは限らない為に、 8ビットを明示するための語として「オクテット」があるが、オクテットマシンとはまず言わない。



おまけ・1

初期のコンピュータでは1文字の文字コードを6ビットとし、 3ビットずつ2つに分割することで、0~7のアラビア数字だけで済む八進法2桁で表現した。 その影響で、ワード長も6の倍数であることが多かったため 八進法によって表現するのが都合良く、コンピュータ業界では八進法が広く使われた。 しかし、チェックビットなどが付き、使用したい文字も増え、 計算機のワード長が8ビット(オクテット)からなる バイトの倍数によって構成されることが一般的になると、その半分の、 二進数4桁(4ビット)を1つにまとめた十六進法の方が便利な為、 八進法が使われることは少なくなった。
今でも教科書に八進法が出ているのは、此の為。


おまけ・2

メールで使用されるBASE64は、データを、 別に用意した6ビット(64種類)の表示可能な文字コード表に対応させる事で、処理されている。






[ 赤い玉の画像 ] 「キーワード辞典」の目次へ

[ 黒板消しとチョーク受けの画像 ]