TA的每日心情 | 开心 2019-1-18 23:55 |
---|
签到天数: 230 天 [LV.7]常住居民III
|
本帖最后由 dfliaoyue 于 2018-4-26 17:34 编辑 / ? [+ Q; @# m7 s, g
8 c# z' `8 S: Z' L7 k: f. k5 f因为发现一本排版很棒的台湾的国语词典(指的是一个台湾人做的教育部新编国语辞典第五版,论坛里有授权转载的),于是想加个简体索引便于查找。简单试了下,发现一个比较便捷的方法。
" G0 I! J8 k! p% w# D0 w1. 用置顶的mdict editor tools提取词条。
! C9 y& `/ v/ D7 a( @6 n4 x0 a2. 将提取的词条拷到excel里,用审阅工具的繁转简转换。; A" E" E. c5 o u8 G; {
3. 将词条列表在第二列再拷贝一遍。现在是第一列简体、第二列繁体。
2 P2 i* k5 ?* f4. 将两列选中,拷进空白txt文档。
9 B: w& H% D3 f. g* H6 N7 P, w5. 用正则多行替换,去掉繁简同体的。查找项为^(.*?) \1$ 。不要直接拷贝我写的,把一行内容加个换行拷进去,再把前后词语换成^(.*?)和\1$ 。
% `. J4 U* T8 C. _6. 现在,你已经得到了所有且不重复的简体繁体对应表了。用正则替换为mdict词典的格式即可。第一行是简体,第二行@@@LINK=繁体,第三行</>。注意不要有空行。! H+ q) p" G* w! E+ i* E$ V) T
7. 解包原mdx,把前面得到的文本拷贝到解包出来的源文件后面,同样注意不要有空行。! q3 d. X3 g8 f4 K
8. 用mdxbuilder重新打包。注意编码格式。
$ L7 v+ B* e, ^7 G1 Q3 g
: O' q, s# ?2 o4 L9 U整套过程,由于现成工具多,最难的也仅仅是最基础的正则替换。注意像emedit的多行替换是需要选择多行模式的。
3 t8 @( E: F' g" @1 I% o% I' o& S3 a9 |5 X# J& K- o, ?) l
P.S. 繁体汉语词典不建议把内容转成简体。百科就随意了。 |
评分
-
2
查看全部评分
-
本帖被以下淘专辑推荐:
- · 词典制作|主题: 217, 订阅: 40
- · 词典制作|主题: 111, 订阅: 24
|