掲出字データ入力の詳細 #
ここでは掲出字の入力の方法の詳細を説明する。 なお、1.2 項目データの入力での説明を繰り返したところがある。
Unicodeによる符号化 #
説明
およそ次の方法によりUnicodeによる符号化を行う。
- Unicodeによっても入力できない例は、当面、漢字の部品を組み合せて示す IDS漢字構成記述文字列(Ideographic Description Sequence) により入力し、IDSでも表現できない文字は■を入力する。
- IDSは漢字構成記述文字(Ideographic Description Character)により示す。
- IDSのデータは守岡知彦がCHISE IDS検索で 構築・公開しているものを利用・参照している。
- IDCは⿰ ⿱ ⿲ ⿳ ⿴ ⿵ ⿶ ⿷ ⿸ ⿹ ⿺ ⿻の12字である。
- IDSで表現しにくい区別は近い字形とβ、γ等とを組み合せて記述することもある。
入力例
1. ⿰亻胃
2. ⿰亻⿱𡈼儿
3. ⿺辶秋
4. 正β
5. 再β/再γ
6. ⿰日重 U+2C047(𬁇)
1はIDS入力の例であり、人偏に胃を書く字体を示す。
2は凭(U+51ED)の異体字かと思われるが、原文字形を再現する必要がある場合には入力例の ように示す。これは複数のIDCを使用した例でもある。
3は辶に秋を書く字体を示す。
4はβ入力の例であり、匸の中にヽが横に二つの字体を示す。
5は再とその異体字が2種使われており、IDSで表現しがたく、βとγを用いて簡略に示す例である。
6の⿰日重はCJK統合漢字拡張EのU+2C047(𬁇)にあるが、 ユーザの環境により表示されないことがある。
GlyphWikiの利用 #
上地宏一氏のGlyphWikiで原文に 近似した明朝体の字形を表示するために GlyphWiki(上地宏一氏)を利用する。
次にはmarkdownの記法で示す。
入力例
![正β](https://glyphwiki.org/glyph/hdic_hkrm-01075140.png)
とすると、次のように表示される。
これでは文字サイズが大きいので、小さいサイズを使う場合には
![正β](https://glyphwiki.org/glyph/hdic_hkrm-01075140.50px.png)
とすれば、次のように表示される。
なお、ファイル名hdic_hkrm-01075140.pngは、HDICデータベースの KRM(観智院本類聚名義抄)の01075140であることを表している。
01075140の01は仏上、 075は75ページ、140は1行4段目の単字項目であることを示している。
サイズを指定して のように表示する方法もあるが、説明は省略する。
虫損・判読不能 #
説明
虫損(insect holes)で判読できない字や点画が複雑すぎてIDSの表現が困難な字を「■」(黒い四角, U+25A0)として入力する。虫損が一部で判読可能な字は「□(某)」のように示す。
入力例
複字形式の掲出字 #
説明
複字形式の掲出字の異体字併記と熟語は、掲出字を「/」(全角スラッシュ, U+FF0F)で区切って入力する。
入力例
異体字併記:翛/倐/倏/翛β
熟語:一/人
熟語:不/良/人
省略符号 #
説明
熟語の掲出字に見える省略符号(omission mark)「|」は、被注字(annotated headword, 被釋字)或いは前掲する掲出字を代用する時に使用される符号で、「ー」(長音符, U+30FC)を用いて入力し、その後の「()」(全角括弧)内に該当字を入力する。
入力例
五/ー(人)、...、真/人、漁/ー(人)、海/ー(人)
踊り字 #
説明
複字形式の掲出字に使われる踊り字(repetition mark, 疊字符)は「〻」(二の字点, U+303B)を用いることとし、「々」(同の字点, U+3005)を用いない。
入力例
曽/ー(祖)/〻(母)
脱字 #
説明
脱字(omitted character, 脫字)であることが明らかな掲出字は、「[]」(全角の角括弧)に入れて示す。
入力例
是/[以]
不/奈/[何]
将/為/[便]
嘻/[囉]
奢/[侈]
奚/[如]
孕/[婦]
娣/[婦]
嘻/[囉]
比/[目]
将/[指]
磬/[控]
䴏/[豆]
桃/花/[石]
樹/[神]
革/[葱]
誤字 #
説明 誤字(miswritten character, 誤字)であることが明らかな掲出字は、 校訂済みの字体をEntryに、原文の字体をEntry_originalに示し、備考欄に校訂の根拠を示す。
入力例
Entry Entry_original Remarks
向/後 〇/ー(彴) 掲出字は「向後」とすべきを誤る。岡田研究193-194頁に「ー」使用は高山寺本が適切との指摘あり。
姡 活 掲出字は誤写。高山寺本・蓮成院本・西念寺本「姡」に作るにより改める。
本文訂正の符号 #
説明
本文訂正の符号は、転倒符、見消符、補入符がある。
- 転倒符(reverse mark, 顛倒符)は複字形式の掲出字の順序を正すものである。
- 見消符(deletion mark, 抹消符)は正しい掲出字を傍書(side note, 旁記)するものである。
- 補入符(interpolation mark, 補入符)は掲出項目の順序を正すものである。
- 本文入力は、訂正の符号によって正しい内容に修正ものを本文を入力し、備考欄にその詳細を記載する。
次の入力例では、注ごとに詳しい説明を施している。 項目データでは、どの箇所を訂正したのか、分かりにくいので、 注文の種類ごとに分割したデータとして、公開する予定である。
入力例
Entry Def Remarks
儻/儻 コヒネカハクハ 西端誤写諸例54頁③文字のいれかわり818。高山寺本「コネヒカハクハ」の「ヒ」の右肩に転倒符あり、文字のいれかわりの誤りは解消済み(草川昇「類聚名義抄和訓小考」29頁)。
拻 不定「ウシヽ歟」相撃 正宗索引「ウシヽ」に「ウシヽはホシヽの誤か、完の草ホシヽと見たるか言の誤なり」、「フ」に「字鏡に音灰不言相撃とある不字か。これは研究もの」。草川和訓集成「ウシヽ」で採録。池田按:原文「フ定相撃」の「定」の左に朱見消して右に朱で「ウシヽ歟」を記載。漢字を仮名と誤認して案語を加えたもの。
倩 シヘタク 「ヘ」は「タ」の右に補入。正宗索引「シヘタク」、正宗索引補正「シタ-へリ」(シタリのへの右に小字へ)。草川和訓集成「シヘタク」で立項、高山寺本・西念寺本「シヘタク」とする。
掲出字に施された声点等の註記 #
説明
掲出字に施された声点・仮名字音、傍訓、漢文注記、異本注記は、「掲出字補注」とし、それぞれ◎、⦿、◇、▲を付して示す。
入力例
Entry Def
版/ー(位) ◎版「ヘム」 シルシノキ(HH@@@)
⿰虫⿱龶囬/(中略)/虱/(以下略) ⦿虱「キサヽ」 十四字俗 ハへ シラミ 朿 ◇朿「来歟」 音刺 ⿺辶⿱一誰 ▲⿺辶⿱一誰「羅カ」 メクル
複字形式の掲出字ID #
説明
複字形式の掲出字IDは一番目の掲出字IDを代表として示し、二番目以降の掲出字IDは公開するCSV形式のデータでは省略する。
掲出項目「AB」の「A」の掲出字IDがK08084411、「B」の掲出字IDがK08084412とすると、公開するTSV形式のデータでは「A」の掲出字IDのK08084411だけ表示している。