汉字的相关信息库

乐趣论坛

金牌会员
注册
2019-04-25
消息
648
反馈评分
49
汉字数据集,包括约 20000 个汉字的相关信息,具体字段包括:

字段说明举例
zi汉字本身
stroke_count笔画数7画
stroke_count_decomposed笔画数拆解木 + 3
mandarin_pinyin普通话拼音
cantonese_pinyin粤语拼音lei5
english英文plum; judge; surname
radical部首
radical_stroke_count部首笔画数4
radical_pinyin部首拼音
radical_english部首英文tree
variant变体,通常为对应繁体NaN
fc_code四角码4040.7
cj_code仓颉码DND
zis_with_this_component包含该字的字,即以该字为部件的字,以英文逗号分隔,不包含本身NaN
leaf_component叶子部件,即将该字拆分构成一个树后,其叶子节点便是叶子部件,用 / 拼接木/子

数据库地址:https://github.com/secsilm/zi-dataset
 
后退
顶部