English
krm_pronunciations

krm_pronunciations #

概要とファイル形式 #

観智院本類聚名義抄(以下、名義抄)の音注は、 反切、類音注、仮名注があり、それらに声点が施されることも多い。 日本漢字音のデータベースとしては、加藤大鶴氏らによる 「資料横断的な漢字音・漢語音データベース」(略称 DHSJR)が非常に充実した 内容を持っている。またその仕様も詳細に公開されている。 そこで、HDICプロジェクトしして、DHSJR の仕様に合わせたデータ公開を公開することとした。

DHSJR ではデータ列の構成として 23 のカラム名を設定している。

HDIC に収録の名義抄との連携をとるためには、HDIC 側で作成する データファイルに固有のカラム名を付けて、HDIC 内のデータファイルと 連携するための主キー (Primary Key) と外部キー (Foreign Key) を設定することが必要になる。

主キーとして、音注ID (pronunciation_id)、 外部キーとして、注文ID (definition_seq_id) を設定した。

名義抄は音注の形式が多様なので、これを分類するために 音注型 (annotation_format)を設定した。

DHSJR は日本語のカラム名となっているが、HDIC では 英字を用いているので、HDIC 内のデータ処理の 都合上、英字を用いたカラム名を設定することとした。

各カラムの説明 #

現在の試案は以下のとおりである。英語の説明と日本語の説明を併記した。 日本語の説明は DHSJR が規定しているものである。英語の説明は、 HDIC との対応をとりやすいように説明したものである。 DHSJR から英語の説明が公表されるまでの暫定的な措置である。

HDIC独自のカラム名は太字とした。

DHSJR (Japanese) HDIC (English) Key English Explanation Japanese Explanation (from DHSJR)
ID dhsjr_id DHSJR unique ID for each single Hanzi (Chinese character) (integrated data only) 単字ごとのユニークID(統合データのみ)
音注ID pronunciation_id Primary Key ID for each Phonetic Gloss. This is derived from definition_seq_id by extracting only those elements where the type (from definition_type_name in krm_notes) is Phonetic Gloss. Suffixes ‘b’, ‘c’, ’d’ are appended for variant forms. 音注ID。kr_definition_sequence_idから、注文の種類が音注のものだけを取り出したもの。変異形を追加したものには末尾にxを付した。 (User indicates ‘x’ is incorrect, and ‘b,c,d’ is correct for variants)
注文ID definition_seq_id Foreign Key An identifier for each component of the Definition (Original Glosses) or for the Headword itself within an Entry. It is formed by appending a sequential suffix (e.g., “_00” for the Headword, “_01”, “_02” for subsequent elements) to the corresponding entry_id. 連番で与えられるFで始まる5桁の見出しの数値IDに加えて、見出しの下に記される注文の各要素を出現順に区分し、出現の順番に_01、_02のように追加したもの。見出しには_00を追加する。
資料番号 material_id Material ID 資料ID
資料名 material_name Name of the material 資料の名称
資料内漢字番号 material_character_index Sequential number of a Hanzi (Chinese character)’s appearance in the material 漢字の資料内出現順の通し番号
資料内漢語番号 material_word_index Sequential number of a Chinese word’s appearance in the material 漢語の資料内出現順の通し番号
単字_見出し character_headword Headword column for Hanzi (Chinese characters) with Phonetic Glosses 音注が付された漢字の見出し列
単字_出現形 character_form Hanzi (Chinese characters) that have Phonetic Glosses 音注が付された漢字
漢語_見出し word_headword Headword column of Chinese words containing Hanzi (Chinese characters) with Phonetic Glosses 音注が付された漢字を含む漢語の見出し列
漢語_出現形 word_form Chinese words containing Hanzi (Chinese characters) with Phonetic Glosses 音注が付された漢字を含む漢語
漢語_alphabet word_alpha Entered when there is an alphabetic representation of the Chinese word 欧文による漢語の表記がある場合に入力されている。
語種 word_type Indicates the word type when there are mixed-language words (e.g., hybrid Sino-Japanese words) 混種語がある場合に、語種を示す。
漢語内位置 word_position Position of the single Hanzi (Chinese character) within the Chinese word 漢語内での単字の位置
単字長 character_mora_count Number of morae for the single Hanzi (Chinese character) 単字の拍数
声点 tone_marks Tone marks for single Hanzi (Chinese characters), indicating Four Tones (平上去入), Six Tones (平平軽上去入軽入), and voicing (清濁). 単字に対する四声(平上去入)、六声(平平軽上去入軽入)及び清濁。
声点型 tone_pattern Combination of Tone marks for Chinese words. Hanzi (Chinese characters) without Tone marks are represented by a full-width asterisk (*). 漢語に対する声点の組合せ。声点がない単字については*で表す。
仮名注 kana_notes Kana glosses (仮名注) for Hanzi (Chinese characters), including kana-based fanqie. 仮名表記による字音注(仮名反切を含む)
仮名型 kana_pattern Combination of Kana glosses for Chinese words. Hanzi (Chinese characters) without Kana glosses are represented by a full-width asterisk (*). 漢語に対する仮名注の組合せ。仮名注がない単字については*で表す。
反切 fanqie Fanqie spellings (反切) for single Hanzi (Chinese characters). 単字に対する反切注
類音 similar_sound Similar sound notes (類音注) for single Hanzi (Chinese characters). 単字に対する類音注
音注型 annotation_format Pattern of combined phonetic information (e.g., Kana glosses, Fanqie spellings, Similar sound notes, Tone marks). 仮名注、反切、類音、声点などの複数の音注が組み合わさった形式のパターン。
節博士 fushi_hakase Fushi-hakase notations (melodic or intonational markings) attached to musical materials such as Shōmyō (Buddhist chant). 声明等音楽資料に付される博士譜など
その他 other_phonetic_annotations Other types of Phonetic Glosses. その他の音注
出現位置 material_location Location of single Hanzi (Chinese characters) and Chinese words within the material. 資料内の単字・漢語の所在
備考 remarks_pronunciation Matters to be noted regarding these phonetic elements. 注記すべき事柄

出現位置(material_location)は、 K・巻数(2桁)・風間版頁数(3桁)・行数(1桁)、段数(1桁)の形式で示す。 たとえばK0201474は巻2、14頁、7行、4段に出現することを表す。

現在は、事例研究のDHSJRとの連携にて 検討しているので、そちらも参照されたい。