文字コレクション

文字コレクションとは

文字コレクション(character collection)はCIDフォントの用語で、フォントに収録される文字(character)の集合のことをいう。アドビはこのように character という語を用いているが、実質はむしろ glyph に近い概念であることに注意。「文字コレクション」も、グリフセット(glyph set)とほぼ同義だと考えてよい。

種類

命名規則

文字コレクションの名前は 登録者, 配列, 追補(registry, ordering, supplement)の3部分からなり、これをハイフンで繋げたものになっている。例えば登録者 Adobe、配列 Japan1、追補 6 であれば、Adobe-Japan1-6 となる。

追補の部分は0もしくは正の整数となっており、文字コレクションに文字が追加された回数を表している。新規に文字コレクションが作成された場合は追補0となり、既存の文字コレクションに文字を追加する場合には、追補の値を1だけ増加させる。

CJK用の文字コレクション

登録者・配列追補対象言語
Adobe-CNS10, 1, 2, 3, 4繁体中国
Adobe-GB10, 1, 2, 3, 4簡体中国
Adobe-Japan10, 1, 2, 3, 4, 5, 6日本語
Adobe-Japan20 (obsolete)日本語(補助漢字
Adobe-Korea10, 1, 2韓国語

ベトナム語用文字コレクションは現在のところ作成されていない。

CID

文字コレクション中の各文字には、CID (character identifier; 文字識別番号)という連続した番号が0から順に振られる。番号が振られた文字コレクションを順序文字コレクション?(ordered character collection)というが、単に文字コレクションということが多い。最初の文字(CID+0)だけは、「未定義の文字を表すための文字」とすることが決められている。

文字コレクションに文字を追加する場合には、現在の文字コレクションの末尾に続けて追加分の文字を並べる。文字の削除はしないことになっているため、CIDに空きができることはない。また、文字の変更や入れ替えは認められていない*1。これによって互換性が保たれている。

外部リンク

読み: もじこれくしょん

Tag: adobe 文字コレクション 文字コード

*1
ということになっているが、実際には変更されていたりする。例えば キャロン付きグリフをめぐるAdobe-Japan1の混乱 - Mac OS Xの文字コード問題に関するメモ など。