文字コレクションとは
文字コレクション(character collection)はCIDフォントの用語で、フォントに収録される文字(character)の集合のことをいう。アドビはこのように character という語を用いているが、実質はむしろ glyph に近い概念であることに注意。「文字コレクション」も、グリフセット(glyph set)とほぼ同義だと考えてよい。
種類
命名規則
文字コレクションの名前は 登録者, 配列, 追補(registry, ordering, supplement)の3部分からなり、これをハイフンで繋げたものになっている。例えば登録者 Adobe、配列 Japan1、追補 6 であれば、Adobe-Japan1-6 となる。
追補の部分は0もしくは正の整数となっており、文字コレクションに文字が追加された回数を表している。新規に文字コレクションが作成された場合は追補0となり、既存の文字コレクションに文字を追加する場合には、追補の値を1だけ増加させる。
CJK用の文字コレクション
| 登録者・配列 | 追補 | 対象言語 |
| Adobe-CNS1 | 0, 1, 2, 3, 4 | 繁体中国語 |
| Adobe-GB1 | 0, 1, 2, 3, 4 | 簡体中国語 |
| Adobe-Japan1 | 0, 1, 2, 3, 4, 5, 6 | 日本語 |
| Adobe-Japan2 | 0 (obsolete) | 日本語(補助漢字) |
| Adobe-Korea1 | 0, 1, 2 | 韓国語 |
ベトナム語用文字コレクションは現在のところ作成されていない。
CID
文字コレクション中の各文字には、CID (character identifier; 文字識別番号)という連続した番号が0から順に振られる。番号が振られた文字コレクションを順序文字コレクション?(ordered character collection)というが、単に文字コレクションということが多い。最初の文字(CID+0)だけは、「未定義の文字を表すための文字」とすることが決められている。
文字コレクションに文字を追加する場合には、現在の文字コレクションの末尾に続けて追加分の文字を並べる。文字の削除はしないことになっているため、CIDに空きができることはない。また、文字の変更や入れ替えは認められていない*1。これによって互換性が保たれている。
外部リンク
- [PDF] Adobe Technical Note #5014: Adobe CMap and CIDFont Files Specification (1993-06-11)
- Adobe-Japan1-6文字コレクションに対応する日本語OpenType®フォントについて
読み: もじこれくしょん
- *1
- ということになっているが、実際には変更されていたりする。例えば キャロン付きグリフをめぐるAdobe-Japan1の混乱 - Mac OS Xの文字コード問題に関するメモ など。