krm_wakun

krm_wakun

これは、名義抄デーベースのKRM.tsvから和訓を抜き出して、 和訓の異形を整理し、異体字との対応を調整したデータである。

和訓に関する校勘と出典考証はkrm_notesに記載したので省略している。

和訓には、異なる読み方を傍書して併記する場合がある。

たとえば「倍」に「マサル」という和訓を付すが、「ル」の右に小さい片仮名で「ス」を傍書する。 これは「マサル」に加えて「マス」という和訓を注記したものである。

和訓にはジャパンナレッジ版『日本国語大辞典第二版』の情報を追加するので、 和訓の異形を併記する場合に対応する必要がある。

異体字との対応は、掲出字に異体字を示すことがあり、これを調整したものである。

たとえば、「ヤツカレ」という和訓は、掲出字「㒒/僕」の注文に見える。 和訓「ヤツカレ」は、「僕」に対する和訓であると同時に「㒒」に対する和訓となっている。 「爲」と「為」、「來」と「来」との関係も同様である。

ジャパンナレッジ版『日本国語大辞典第二版』には「表記」欄があり、名義抄の 漢字表記を収録しているので、これとの対応をとるための措置である。

2025年3月の仕様変更後のファイル名であることを明示的に示すため、 大文字のKRMではなく小文字のkrmを用いて krm_wakun.tsvとkrm_wakun.jsonという名称とした。

新旧のカラム名を対照すれば次のようになる。

New Column Name (v1.2.0) Old Column Name (v1.1.97)
wakun_id KRID_wakun_no
definition_seq_id KRID_no
kazama_entry_location KR2ID
hanzi_entry Entry
wakun_elements Def
wakun_form Word_form
wakun_standard_hanzi Wakun_Hanzi
wakun_variant_in_hanzi Wakun_variant
variant_hanzi_for_wakun Hanzi_variant
japan_knowledge_id JK_URL
- Remarks

Remarksはkrm_notesにまとめることとして、省略した。

次に、カラム名の内容を英語と日本語で説明する。

New Column Name (v1.2.0) English Explanation Japanese Explanation
wakun_id Wakun ID, extracted from kr_definition_sequence_id, containing only entries where the type of order is Japanese reading (wakun). Variant forms are appended with ‘b’, ‘c’, ‘d’. 和訓ID。kr_definition_sequence_idから、注文の種類が和訓のものだけを取り出したもの。変異形を追加したものには末尾にa, b, c, dを付した。
definition_seq_id 5-digit numeric ID starting with ‘F’, sequentially assigned to heading entries. Definition components under each heading are ordered based on their appearance, and order indicators like _01, _02, etc., are appended accordingly. The heading itself is appended with _00. 連番で与えられるFで始まる5桁の見出しの数値IDに加えて、見出しの下に記される注文の各要素を出現順に区分し、出現の順番に_01、_02のように追加したもの。見出しには_00を追加する。
kazama_entry_location ID including location information (Kazama edition: K, Book(volume), page(xxx), line(y), column(zz)), ranked 1, 2, …, n for multiple entries in a column. Where Book(volume) represents the volume number, page(xxx) the page number, line(y) the line number, and column(zz) the column number. 位置情報(風間版:K、冊子(巻)、ページ(xxx)、行(y)、列(zz))を含むID。列に複数のエントリがある場合は、1、2、…、n の順位になる。
hanzi_entry Collated Hanzi characters, standardized to the Kangxi dictionary form, including Unicode-representable variant forms. 原文の漢字を校訂したもの。康熙字典体とするのを原則としたが、Unicodeで入力できる新字体(通用字体、俗字体)を残すこともある。
wakun_elements Extracted Japanese reading (wakun) components from the full definition, one component per entry. 注文の全文から、和訓の要素を一つずつ抜き出したもの。
wakun_form Form of the Japanese reading (wakun). Inflected words are in dictionary form, excluding particles. The particles ‘no’ and ‘to’ from 文選 readings are omitted. 和訓の語形。活用のあるものは、助詞助動詞を除いて終止形とする。文選読みの「の」「と」は省略する。
wakun_standard_hanzi Standard wakun notation using standard kanji. 標準的な漢字による和訓表記。
wakun_variant_in_hanzi Variant form of wakun notation using standard Hanzi characters. 標準的な漢字による和訓の異形の表記。
variant_hanzi_for_wakun Wakun notation using variant Hanzi characters (itai-ji). 異体字による和訓の表記。
japan_knowledge_id The alphanumeric part of the JapanKnowledge URL for the corresponding entry in the Nihon Kokugo Daijiten 2nd Ed., starting from “20020” to the end, is recorded here if the wakun exists as a headword. If the wakun does not exist as a headword in the JapanKnowledge edition, null is entered. ジャパンナレッジ版『日本国語大辞典第二版』にこの和訓が見出しとして存在する場合に、そのURLの後半、20020から末尾までの英数字を記載する。見出しとして存在しない場合は null と入力する。