创建一个extended
目录用于存放字典,并在配置中,将其引用,主要windows下路径用\
,unix下路径用/
name: pinyin_plus
version: "2022.11.22"
sort: by_weight
use_preset_vocabulary: true
import_tables:
# pinyin_plus, 放于第一行,用作用户自造词。需要与`name`保持一致。
- pinyin_plus
- luna_pinyin
- extended\userdict
- extended\xhzd
- extended\tsinghua.ocl
- extended\qqpy.default
- extended\qqpy.usually
- extended\sougou.chengyu
- extended\sougou.netword
根据RIEM的介绍,文件名和dict.yaml
里面的name
字段应该为一致的。
- 关于码表的格式
- 導出及導入文本碼表
- 以製表符(Tab)分隔的三列,分別是文字、編碼、使用頻次。其中,編碼是碼表中定義的完全形式,多個音節間以空格。
<輸入法語言代號>.userdb/
- 輸入法程序爲保存用戶的輸入習慣而創建的 用戶詞典。
- 碼表與詞典
- 使用頻次,往往用于多音字的场景
- 除了《新华字典》,《现代汉语词典》外,其他词库均去除单字词条。
use_preset_vocabulary
,是否導入預設詞彙表【八股文】。扩展词库默认设置为false
。
-
xhzd.dict.yaml
- 新华字典,有词频,来源
-
qqpy.default.dict.yaml
- QQ拼音默认词库,无词频,来源
-
qqpy.usually.dict.yaml
- 常用聊天短语,无词频,来源
-
sogou.default.dict.yaml
- 搜狗拼音默认词库,无词频,来源,其他细节见补充
-
sougou.chengyu.dict.yaml
- 搜狗拼音默认词库,无词频,来源,其他细节见补充
-
sougou.netword.dict.yaml
- 搜狗拼音网络新词,无词频,来源,其他细节见补充
-
tsinghua.ocl.dict.yaml
转换,工具,及其他见分支
- [ ]使用Oxford作为蓝本