青空文庫 派生プロジェクト
あさっての向かい風
青空文庫“Unicode 変換”計画
(Unicode 版への変換作業)
0208 版から Unicode 版への変換作業のガイドライン(試案)をつくってみました。変換の実作業をおこないながら、その手順や思ったこと、統一しておきたい形式などをメモしたものです。同じようなことを考えていらっしゃるかたがいたら、ぜひご意見をうかがいたいと思います。
この作業手順で、おおむねみなさんからのご賛同が得られれば、青空文庫で現在登録してある0208 版(著作権の有効期限を経過したものでかつ、第3・4水準漢字などをふくむテキスト)の Unicode 版への変換作業をぼちぼちとではありますが進めたいと考えています。
2002.1.25 公開
2002.1.30 5)基本(0208)版と差しかえ(Unicode)版の関係について……を追加
2002. 2. 1 1)「JIS0208版変換」の表記を「JIS X 0208版変換」に変更
2002. 2. 3 3)ファイル管理 未変換の注記が残っているファイルのマークは「◆」に変更
2002. 2. 7 4)包括 包摂規準と包摂の適用除外について……の方針を大幅変更
2002.4.27 5)……メモを追加
志田
| 1)0208 版の加工 |
| 2)Unicode 版への変換(Mac OS X10.1 のばあい) |
| 3)ファイル管理 |
| 4) |
5)基本(0208)版と差しかえ(Unicode)版の関係について
Unicode版は、最新の基本版をダウンロードしてつくることにします。変換後に基本版に修正が入るばあいもじゅうぶんにありえますが、そのつど、修正するのはたいへん効率がわるくなってしまうので、その作業は、第1期プロジェクトの完了にめどがついた段階で考えることにします。
ためしに制作したUnicode版は、安易に古い頒布CDからファイルをコピーして作成してしまったものですので、いくつかの古い間違いがそのまま残っています。したがって、すでにダウンロードなさったファイルはβ版としてとりあつかい、おのおの削除してくださることをお願いします。それ以外の修正も反映させた上で、再公開します。
メモ(2002.4.27追加)
・優先順位 ルビあり版>ルビなし版
・ファイル名は、基本版名プラス「_uni」
・ファイル名が重複しないように登録期日ごとにフォルダ分類する
※実作業上でうまれてくる手順のバリエーションなどには随時柔軟に対応したいと思います。
※得られる結果がほぼ同一であったり、あるいはより以上の効果が見込まれる方法があるばあいは、それへの移行を妨げません。むしろ積極的に評価し、追随したいと考えます。
※0208 版の新規登録へおいついたところで、第1期 Unicode 化プロジェクトを終了したいと思います。