掲出字データ入力の詳細

掲出字データ入力の詳細 #

ここでは掲出字の入力の方法の詳細を説明する。 なお、1.2 項目データの入力での説明を繰り返したところがある。

Unicodeによる符号化 #

説明

およそ次の方法によりUnicodeによる符号化を行う。

  • Unicodeによっても入力できない例は、当面、漢字の部品を組み合せて示す IDS漢字構成記述文字列(Ideographic Description Sequence) により入力し、IDSでも表現できない文字は■を入力する。
  • IDSは漢字構成記述文字(Ideographic Description Character)により示す。
  • IDSのデータは守岡知彦がCHISE IDS検索で 構築・公開しているものを利用・参照している。
  • IDCは⿰ ⿱ ⿲ ⿳ ⿴ ⿵ ⿶ ⿷ ⿸ ⿹ ⿺ ⿻の12字である。
  • IDSで表現しにくい区別は近い字形とβ、γ等とを組み合せて記述することもある。

入力例

1. ⿰亻胃
2. ⿰亻⿱𡈼儿
3. ⿺辶秋
4. 正β
5. 再β/再γ
6. ⿰日重 U+2C047(𬁇)

1はIDS入力の例であり、人偏に胃を書く字体を示す。

2は凭(U+51ED)の異体字かと思われるが、原文字形を再現する必要がある場合には入力例の ように示す。これは複数のIDCを使用した例でもある。

3は辶に秋を書く字体を示す。

4はβ入力の例であり、匸の中にヽが横に二つの字体を示す。

5は再とその異体字が2種使われており、IDSで表現しがたく、βとγを用いて簡略に示す例である。

6の⿰日重はCJK統合漢字拡張EのU+2C047(𬁇)にあるが、 ユーザの環境により表示されないことがある。

GlyphWikiの利用 #

上地宏一氏のGlyphWikiで原文に 近似した明朝体の字形を表示するために GlyphWiki(上地宏一氏)を利用する。

次にはmarkdownの記法で示す。

入力例

![正β](https://glyphwiki.org/glyph/hdic_hkrm-01075140.png)

とすると、次のように表示される。

正β

これでは文字サイズが大きいので、小さいサイズを使う場合には

![正β](https://glyphwiki.org/glyph/hdic_hkrm-01075140.50px.png)

とすれば、次のように表示される。

正β

なお、ファイル名hdic_hkrm-01075140.pngは、HDICデータベースの KRM(観智院本類聚名義抄)の01075140であることを表している。

01075140の01は仏上、 075は75ページ、140は1行4段目の単字項目であることを示している。

サイズを指定して

のように表示する方法もあるが、説明は省略する。

虫損・判読不能 #

説明

虫損(insect holes)で判読できない字や点画が複雑すぎてIDSの表現が困難な字を「■」(黒い四角, U+25A0)として入力する。虫損が一部で判読可能な字は「□(某)」のように示す。

入力例

複字形式の掲出字 #

説明

複字形式の掲出字の異体字併記と熟語は、掲出字を「/」(全角スラッシュ, U+FF0F)で区切って入力する。

入力例

異体字併記:翛/倐/倏/翛β
熟語:一/人
熟語:不/良/人

省略符号 #

説明

熟語の掲出字に見える省略符号(omission mark)「|」は、被注字(annotated headword, 被釋字)或いは前掲する掲出字を代用する時に使用される符号で、「ー」(長音符, U+30FC)を用いて入力し、その後の「()」(全角括弧)内に該当字を入力する。

入力例

五/ー(人)、...、真/人、漁/ー(人)、海/ー(人)

踊り字 #

説明

複字形式の掲出字に使われる踊り字(repetition mark, 疊字符)は「〻」(二の字点, U+303B)を用いることとし、「々」(同の字点, U+3005)を用いない。

入力例

曽/ー(祖)/〻(母)

脱字 #

説明

脱字(omitted character, 脫字)であることが明らかな掲出字は、「[]」(全角の角括弧)に入れて示す。

入力例

是/[以]
不/奈/[何]
将/為/[便]
嘻/[囉]
奢/[侈]
奚/[如]
孕/[婦]
娣/[婦]
嘻/[囉]
比/[目]
将/[指]
磬/[控]
䴏/[豆]
桃/花/[石]
樹/[神]
革/[葱]

誤字 #

説明 誤字(miswritten character, 誤字)であることが明らかな掲出字は、 校訂済みの字体をEntryに、原文の字体をEntry_originalに示し、備考欄に校訂の根拠を示す。

入力例

Entry   Entry_original  Remarks
向/後  〇/ー(彴)    掲出字は「向後」とすべきを誤る。岡田研究193-194頁に「ー」使用は高山寺本が適切との指摘あり。
姡  活  掲出字は誤写。高山寺本・蓮成院本・西念寺本「姡」に作るにより改める。

本文訂正の符号 #

説明

本文訂正の符号は、転倒符、見消符、補入符がある。

  • 転倒符(reverse mark, 顛倒符)は複字形式の掲出字の順序を正すものである。
  • 見消符(deletion mark, 抹消符)は正しい掲出字を傍書(side note, 旁記)するものである。
  • 補入符(interpolation mark, 補入符)は掲出項目の順序を正すものである。
  • 本文入力は、訂正の符号によって正しい内容に修正ものを本文を入力し、備考欄にその詳細を記載する。

次の入力例では、注ごとに詳しい説明を施している。 項目データでは、どの箇所を訂正したのか、分かりにくいので、 注文の種類ごとに分割したデータとして、公開する予定である。

入力例

Entry   Def Remarks
儻/儻  コヒネカハクハ  西端誤写諸例54頁③文字のいれかわり818。高山寺本「コネヒカハクハ」の「ヒ」の右肩に転倒符あり、文字のいれかわりの誤りは解消済み(草川昇「類聚名義抄和訓小考」29頁)。
拻  不定「ウシヽ歟」相撃    正宗索引「ウシヽ」に「ウシヽはホシヽの誤か、完の草ホシヽと見たるか言の誤なり」、「フ」に「字鏡に音灰不言相撃とある不字か。これは研究もの」。草川和訓集成「ウシヽ」で採録。池田按:原文「フ定相撃」の「定」の左に朱見消して右に朱で「ウシヽ歟」を記載。漢字を仮名と誤認して案語を加えたもの。
倩  シヘタク    「ヘ」は「タ」の右に補入。正宗索引「シヘタク」、正宗索引補正「シタ-へリ」(シタリのへの右に小字へ)。草川和訓集成「シヘタク」で立項、高山寺本・西念寺本「シヘタク」とする。

掲出字に施された声点等の註記 #

説明

掲出字に施された声点・仮名字音、傍訓、漢文注記、異本注記は、「掲出字補注」とし、それぞれ◎、⦿、◇、▲を付して示す。

入力例

Entry   Def
版/ー(位)    ◎版「ヘム」 シルシノキ(HH@@@)

⿰虫⿱龶囬/(中略)/虱/(以下略) ⦿虱「キサヽ」 十四字俗 ハへ シラミ 朿 ◇朿「来歟」 音刺 ⿺辶⿱一誰 ▲⿺辶⿱一誰「羅カ」 メクル

複字形式の掲出字ID #

説明

複字形式の掲出字IDは一番目の掲出字IDを代表として示し、二番目以降の掲出字IDは公開するCSV形式のデータでは省略する。

掲出項目「AB」の「A」の掲出字IDがK08084411、「B」の掲出字IDがK08084412とすると、公開するTSV形式のデータでは「A」の掲出字IDのK08084411だけ表示している。