一、緣起
西夏文部件檢字法旨在提供除四角號碼和部首檢字法之外的一種全新的檢字方法,尤其對於部分殘缺漫漶的字更有效果。傳統的部首查字法在遇到字數較多的情況下查詢效率偏低,且還需要計算部首之外的剩餘筆畫數。四角號碼同樣也有重碼率高的缺點。古今文字集成推出的部件檢字法可以通過輸入一個字的所有部件或者部分部件來篩選需要的字。具體步驟如下:
第1步:首先將要查詢的字按視覺模式先橫向後縱向的方式拆分成若干部分。
第2步:拆分後按從上往下、從左往右的順序依次輸入部件,最後點擊查詢。
輸入部件時可用電腦版的西夏文部件輸入法輸入,在如手機或平板的移動客戶端上可使用在線輸入法輸入,首先打開搜索窗口右側的下拉菜單,選擇需要的輸入法。

在線輸入法有兩種,第一種是使用鍵盤根據部件筆順輸入的字母輸入法,每個筆畫的代碼請參考下圖的筆畫索引表,輸入時用小寫英文字母a-s輸入部件。例如,輸入cccq可以打出部件“𘢌”。

第二種是筆畫輸入法,針對不熟悉筆畫代碼的用戶,可通過根據筆順點擊筆畫按鈕鍵入部件。輸入錯誤時可點擊橙色的退格鍵 ← 刪除上一個字符,刪除鍵 × 為清空所有輸入內容。

下面我們將介紹西夏文的結構和拆分方法。
二、西夏文的結構
西夏文的結構和漢字的結構基本類似,可分成橫向2部分(左右結構)、橫向3部分(左中右結構)、橫向4部分、橫向5部分、縱向2部分(上下結構)、縱向3部分(上中下結構)、斜向2部分(半包圍結構),以下將相詳細介紹。
1. 橫向2部分:⿰(左右結構)
|
|
|
|
|
|
|
|
|
|
|
|
⿰𘦝𘢓 |
⿰𘧥 |
⿰𘥰𘫴 |
⿰𘢌 |
⿰𘢌 |
⿰𘩤𘠳 |
⿰𘫗𘢌 |
⿰𘫠𘢌 |
⿰𘫞𘣟 |
⿰𘢌 |
⿰𘠈 |
⿰𘥘 |
2. 橫向3部分:⿲(左中右結構)
|
|
|
|
|
|
|
|
⿲𘤮𘧃𘢞 |
⿲𘠁𘨆𘦙 |
⿲𘫺𘢅𘣑 |
⿲𘤊𘫽𘪣 |
⿲𘥀𘦏𘧈 |
⿲𘫽𘠁 |
⿲𘡃𘠢 |
⿲𘦛𘤧𘥿 |
3. 橫向4部分:
|
|
|
|
|
|
|
|
𘢔𘠶𘢌𘠴 | 𘢡𘣃𘢌𘠁 | 𘢰𘢌𘠁𘦡 | 𘤆𘠣𘡽𘠴 | 𘦘𘠣𘤣𘠢 | 𘢌𘠈𘠁𘣦 | 𘢌𘠐𘡯𘡧 | 𘦳𘠣𘤆𘠴 |
4. 橫向5部分:
|
|
|
𘫽𘠨𘠁𘢌𘤘 | 𘫽𘠨𘢌𘠁𘤘 | 𘢌𘠌𘤩𘠁𘠳 |
5. 縱向2部分:⿱(上下結構)
|
|
|
|
|
|
|
|
|
|
|
|
⿱𘠊⿰𘠮𘥦 | ⿱𘢸⿰𘡫 | ⿱𘡩⿲𘡯𘠈𘡑 | ⿱⿰𘡯𘡯⿰𘠁𘤕 | ⿱𘥅𘣡 | ⿱𘧉⿰𘠡𘠡 | ⿱⿰𘧘𘢌⿰𘥇𘠢 | ⿱𘨝⿲𘠁𘢌𘠁 | ⿱⿰𘢹𘡖𘣗 | ⿱𘤇⿰𘠠𘧦 | ⿱𘣋⿲𘠈𘠁𘠳 | ⿱𘨘𘠺 |
6. 縱向3部分:⿳(上中下結構)
|
|
|
|
|
|
|
|
|
|
|
|
⿳𘡅⿰𘢌𘢌𘣗 | ⿳𘡊𘣍⿰𘠶𘡃 | ⿳𘡎⿰𘠡𘢚𘣗 | ⿳𘢸𘥉⿰𘡵𘤻 | ⿳𘣍𘡩⿰𘢌𘠁 | ⿳𘢫𘠀𘠺 | ⿳𘠛𘡩⿰𘠒𘢓 | ⿳𘠚𘧉⿰𘢤𘢱 | ⿳𘠀𘡛⿰𘠐𘣣 | ⿳𘡩𘡛⿰𘡋𘡃 | ⿳𘡩𘤴𘥌 | ⿳𘡩𘡊⿲𘠡𘤧𘠢 |
7. 斜向2部分:⿺、⿸、⿵(半包圍結構)
|
|
|
|
|
|
|
|
|
|
|
|
⿺𘢍𘫙 | ⿺𘢦⿰𘠳𘠢 | ⿺𘦐𘩃 | ⿺𘠢 | ⿺𘫯𘤧 | ⿺𘩦𘢌 | ⿸𘡈𘪡 | ⿸𘠋𘤧 | ⿸𘡟𘢰 | ⿸𘡋𘤃 | ⿸𘪅𘣞 | ⿵𘢗𘩉 |
三、拆分原則
拆分西夏文時以是否能將整字從上往下貫穿拆分為基準,若無法貫穿則視為一個整體部件,下面的兩個例子右側為整體部件,雖然下方可以再次橫向拆分,故可視為橫向2部分。
|
|
⿰𘢌 | ⿰𘢌 |
在一些情況下,初次拆分後可繼續沿著橫向拆分,因此可以繼續細分,例如下圖中的字下半部可繼續分為“𘠳𘢰𘢌𘠴”4個部分。
|
⿱𘡊𘠳𘢰𘢌𘠴 |
對於部分殘缺或漫漶的字僅需輸入能看得清的部件即可查詢,例如:
|
由於左下角殘缺,因此可查詢“𘣍、𘥷”兩個部件。 |
|
由於中間部分殘缺,因此可查詢“𘡢、𘠅”兩個部件。 |
|
由於右側部分殘缺,因此可查詢“𘢌、𘢚”兩個部件。 |
|
由於中間部分殘缺,因此可查詢“𘡒、𘢌”兩個部件。 |
|
由於右下角殘缺,因此可查詢“𘡎、𘠐、𘢌”三個部件。 |
四、注意事項
1. 有一些字可以有多種拆分方法,輸入任意拆分即可查詢,此類字主要為上下結構,亦可理解為上中下結構,例如:
|
𘡊𘡎𘢌𘠁𘢌;𘡊𘠛𘠀𘢏𘠁𘢌;𘡊𘫩 |
|
𘫺𘠁𘢐;𘠛𘠙𘫺𘠁𘢐 |
|
𘠛𘠛𘠐𘧤𘦗;𘢴𘠐𘧤𘦗 |
|
𘠛𘡩𘠒𘢓;𘦶𘠒𘢓 |
|
𘠀𘡛𘠐𘣣;𘡳𘠐𘣣 |
|
𘪅𘣞;𘢮𘢌𘣞 |
2. 查詢時僅輸入部件,無需輸入“⿰⿱⿲⿳⿵⿸⿺”在內的結構描述符(IDC)。
3. Unicode中目前收錄了幾百個西夏文部件字符,但有少部分字形相同位置卻不同的字符,使用時需要注意,例如“𘡩、𘡪”和“𘫺、𘡅”這兩組,請注意部件在西夏文中的位置。
4. “𘤊、𘫽、”這3個部件的寫法差異細微,文獻中的寫法不一定嚴格遵循正字法,因此在查詢時如果查不到可嘗試其他的2種寫法代替。
5. 類似“𘡃、𘢌、𘡱、𘢪”的部件最後一筆一律視為捺,代碼用“q”輸入。
6. “𘤅”是一个比較特殊的部件,部件本身的結構為“⿰𘢋𘠁”。同字形的西夏文“𗼃”的含義是“聖”,这个部件出現的頻率比較高,查詢是可作為一個整體輸入,亦可拆分為“𘢋、𘠁”兩個部件分開輸入。
