GitXplorerGitXplorer
s

zi-dataset

public
113 stars
17 forks
1 issues

Commits

List of commits on branch master.
Verified
49058b3422ed0b7fd2f3beb4869e7fc3e3740d78

Update README.md

ssecsilm committed 5 years ago
Verified
1c17a4041808a61597e94ecc8b614631567203a1

Initial commit

ssecsilm committed 5 years ago

README

The README file for this repository.

zi

汉字数据集,包括约 20000 个汉字的相关信息,具体字段包括:

字段 说明 举例
zi 汉字本身
stroke_count 笔画数 7画
stroke_count_decomposed 笔画数拆解 木 + 3
mandarin_pinyin 普通话拼音
cantonese_pinyin 粤语拼音 lei5
english 英文 plum; judge; surname
radical 部首
radical_stroke_count 部首笔画数 4
radical_pinyin 部首拼音
radical_english 部首英文 tree
variant 变体,通常为对应繁体 NaN
fc_code 四角码 4040.7
cj_code 仓颉码 DND
zis_with_this_component 包含该字的字,即以该字为部件的字,以英文逗号分隔,不包含本身 NaN
leaf_component 叶子部件,即将该字拆分构成一个树后,其叶子节点便是叶子部件,用 / 拼接 木/子

WIP

  • [ ] 添加笔画顺序