項目データの入力 #
観智院本類聚名義抄の項目データの入力方法を解説する。 以下、観智院本類聚名義抄を名義抄またはKRMと呼ぶ。
項目は掲出字と注文とからなる。
ここでは、名義抄の主要な項目データ(例:krm-main.tsv
)について、掲出字の入力と注文の入力とに共通する事項を中心に解説する。
この文書で説明する入力規則のうち、文字の表現方法に関する規則(Unicode外の文字、特殊記号など)は、krm-notes
をはじめとする他の公開データにも共通して適用される場合がある。公開データ全体の構成やファイル形式の詳細については、公開データの概要を参照されたい。
公開データは、TSV 形式を主に用いるが、内容の可読性を配慮して JSON 形式にしたものもある。
まず、掲出字・項目構造とID体系について解説する。KRM データのID体系は複雑なので、利用者は注意深く読んでもらいたい。 次にUnicodeを利用した文字の符号化と表現を解説する。Unicode によって表現できない文字の扱いは複数の方式を併用しているので、その点も解説した。 最後に、誤字・脱字など書写上の問題、省略符号や踊り字など文字・語の表記形式、 割注、小字注記など付加注記・レイアウトを整理して、書写・表記・注記における問題と対応をまとめる。