|
发表于 2014-9-9 00:09:45
|
显示全部楼层
( C. v7 v5 E; k5 c7 G, }* c" g5 S
: u2 h8 }5 N, B+ @ w& T帖子里涉及到的问题,够写博士论文了。帖子有点乱,我是没太看懂。4 x$ ~3 R- }$ l: L; H
% `" L: U; F% a1 I9 N! U& w不知道楼主知不知道拼音输入法里的U模式,+ b' H8 m2 z9 H( r
http://pinyin.sogou.com/help.php?list=3&q=8 9 y7 E; _& O1 Y- w, E7 U5 \, }
U模式主要用来输入不会读(不知道拼音)的字等。在按下u键后,输入笔画拼音首字母或者组成部分拼音,即可得到您想要的字 3 `8 b6 O" M, C* n1 N) L- T
我觉得部首查字法纯属多余。
8 B# H" q" w+ d: u& L% e- X( R% T. L# O7 _* F% Z
$ U2 N7 E9 {3 v# j( Z1.除部首外能很快给汉字分类(重码率小)又能减轻分类者负担的办法(这是不是叫做在开发者辛苦和用户辛苦之间平衡呢)
! f) _0 u$ b9 O& A( k7 w; h5 ~: P1 V! |我以前想过根据汉字的前两笔的笔画数字代码和最后两笔(或三笔),重码率为10%左右,可是分类十分慢,而且眼睛也投降了。
+ w3 l; Z3 } Y- }A: 我看不懂问题。
% T& t. F0 p3 a' U) t
$ }. R& ]/ L, s @9 q* E" |2. 如何合并两份字表,即AB表各有对方没有收录的汉字,怎样合并。7 X" t/ Q: J4 M* K- |2 l
A: 这个问题我也没太看懂。其实如果一个字占一行,那么直接可以用EditPlus的删除重复行功能(其它文本编辑器也可以实现类似的功能,如UltraEdit可以排序,排序过程中删除重复行)。Excel就更简单了,可以搜索“Excel 删除重复”。/ c% ?/ ~' h6 g- q' G/ b/ V
$ c$ z4 U( K3 R4 x/ T3.bing到sql等有些支持部首排序,可是sql语句不懂
H8 E4 ^3 {6 V- U# e$ X/ d& o* @5 Y( NA: 不懂就赶紧学,哪来那么多废话 ,这个年代,自学是生存发展之本,缺什么补什么。一天就可以入门了。
4 U+ Q+ G3 Y2 v- r5 `- N
# U) {! p+ Y8 w3 p# f4.中文分词词库,sphinx等那些对这个问题有用吗
# w) ^, o# G; L+ P+ g- vA: 没看懂。中文分词词库,免费的有不少,好的词库,值钱,值大钱。, [% w a+ A, N7 ^* _. `
# C% {0 V- ] [- K' m6 z# g
- t5 d1 S, ^; H- s( W6 _1 d, j; D; ~! I- {2 A' r
|
评分
-
1
查看全部评分
-
|