krm_pronunciations

krm_pronunciations

観智院本類聚名義抄(以下、名義抄)の音注は、 反切、類音注、仮名注があり、それらに声点が施されることも多い。 日本漢字音のデータベースとしては、加藤大鶴氏らによる 「資料横断的な漢字音・漢語音データベース」(略称DHSJR)が非常に充実した 内容を持っている。またその仕様も詳細に公開されている。 DHSJRの仕様に合わせたデータ公開を検討中である。

DHSJRではデータ列の構成として23のカラム名を設定している。

HDICに収録の名義抄との連携をとるためには、HDIC側で作成する データファイルに固有のカラム名を付けて、HDIC内のデータファイルと 連携するための主キー (Primary Key) と外部キー (Foreign Key) を設定することが必要になる。

主キーとして、音注ID (pronunciation_id)、 外部キーとして、注文ID (definition_seq_id) を設定した。

名義抄は音注の形式が多様なので、これを分類するために 音注型 (annotation_format)を設定した。

DHSJRは日本語のカラム名となっているが、HDICでは 英字を用いているので、HDIC内のデータ処理の 都合上、英字を用いたカラム名を設定することとした。

現在の試案は以下のとおりである。英語の説明と日本語の説明を併記した。 日本語の説明はDHSJRが規定しているものである。英語の説明は、 HDICとの対応をとりやすいように説明したものである。 DHSJRから英語の説明が公表されるまでの暫定的な措置である。

HDIC独自のカラム名は太字とした。

DHSJR HDIC key English explanation Japanese explanation
ID dhsjr_id DHSJR unique ID for each single character (integrated data only) 単字ごとのユニークID(統合データのみ)
音注ID pronunciation_id Primary Key Pronunciation annotation ID, extracted from definition_sequence_id, containing only entries where the type of order is pronunciation annotation. Variant forms are appended with ‘b’, ‘c’. 音注ID。kr_definition_sequence_idから、注文の種類が音注のものだけを取り出したもの。変異形を追加したものには末尾にxを付した。
注文ID definition_seq_id Foreign Key 5-digit numeric ID starting with ‘F’, sequentially assigned to heading entries. Definition components under each heading are ordered based on their appearance, and order indicators like _01, _02, etc., are appended accordingly. The heading itself is appended with _00. 連番で与えられるFで始まる5桁の見出しの数値IDに加えて、見出しの下に記される注文の各要素を出現順に区分し、出現の順番に_01、_02のように追加したもの。見出しには_00を追加する。
資料番号 material_id Material ID 資料ID
資料名 material_name Name of the material 資料の名称
資料内漢字番号 material_charcter_index Sequential number of character appearance in the material 漢字の資料内出現順の通し番号
資料内漢語番号 material_word_index Sequential number of word appearance in the material 漢語の資料内出現順の通し番号
単字_見出し character_headword Headword column of characters with phonetic annotations 音注が付された漢字の見出し列
単字_出現形 character_form Characters with phonetic annotations 音注が付された漢字
漢語_見出し word_headword Headword column of words containing characters with phonetic annotations 音注が付された漢字を含む漢語の見出し列
漢語_出現形 word_form  Words containing characters with phonetic annotations 音注が付された漢字を含む漢語
漢語_alphabet word_alpha Entered when there is an alphabetic representation of the word 欧文による漢語の表記がある場合に入力されている。
語種 word_type  Indicates the word type when there are mixed-language words 混種語がある場合に、語種を示す。
漢語内位置 word_position Position of the single character within the word 漢語内での単字の位置
単字長 character_mora_count Number of morae for the single character 単字の拍数
声点 tone_marks Four tones (even, rising, departing, entering), six tones (even-light, rising, departing, entering-light) and voicing for single characters 単字に対する四声(平上去入)、六声(平平軽上去入軽入)及び清濁。
声点型 tone_pattern Combination of tonal marks for words. Characters without tonal marks are represented by * 漢語に対する声点の組合せ。声点がない単字については*で表す。
仮名注 kana_notes Phonetic annotation in kana notation (including kana fanqie) 仮名表記による字音注(仮名反切を含む)
仮名型 kana_pattern Combination of kana annotations for words. Characters without kana annotations are represented by *. 漢語に対する仮名注の組合せ。仮名注がない単字については*で表す。
反切 fanqie Fanqie annotation for single characters 単字に対する反切注
類音 similar_sound Similar sound annotation for single characters 単字に対する類音注
音注型 annotation_format Pattern of combined phonetic annotations (e.g., kana, fanqie, similar sound, tone marks). 仮名注、反切、類音、声点などの複数の音注が組み合わさった形式のパターン。
節博士 fushi_hakase Hakase notation attached to musical materials such as Shōmyō 声明等音楽資料に付される博士譜など
その他 other_phonetic_annotations Other phonetic annotations その他の音注
出現位置 material_location Foreign Key Location of single characters and words within the material 資料内の単字・漢語の所在
備考 remarks_pronunciation Matters to be noted 注記すべき事柄

現在は、事例研究のDHSJRとの連携にて 検討しているので、そちらも参照されたい。