掌上百科 - PDAWIKI

用户名  找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1292|回复: 9

[求助] 词典制作求助

[复制链接]

该用户从未签到

发表于 2014-4-16 08:55:23 | 显示全部楼层 |阅读模式
各位老大好,我有个纯文本文件的词典,每行的格式是:中文,后面接着就是其释义,有的释义还包含中文(见附件示例),这样的词条有10万多,不知道有什么方法将其做成MDX词库呢?如果词条少的话,手工将中文与释义分隔开来,再制作词库很容易,但是词条太多了,逐一分开不现实,所以请教大大们,有没有什么好办法呢?不胜感激
2 N9 E7 u- p5 Y

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2014-4-16 15:33:01 | 显示全部楼层
楼主您那个纯文本词典,应该是这个词典的子集,已经有StarDict格式了,下载见:http://bkrs.info/taolun/thread-61-post-25205.html#pid25205, f  _1 j1 d9 S
参考:https://pdawiki.com/forum/thread-11989-1-1.html
! W+ o( z, ~" z; e& `% V9 c) O  W8 V, h2 h: R

该用户从未签到

 楼主| 发表于 2014-4-16 19:23:28 | 显示全部楼层
Oeasy 发表于 2014-4-16 15:33
- D7 L/ y6 b2 G' s9 }楼主您那个纯文本词典,应该是这个词典的子集,已经有StarDict格式了,下载见:http://bkrs.info/taolun/th ...
) ^/ V8 U2 ?6 B& R
恩,你说的这个我是知道的。但现在我有很多不是这个俄罗斯人编写的词条,我只是将其拿出来做个例子说明对于这样的格式有没有什么其他的方法来做词库。

该用户从未签到

发表于 2014-4-16 19:49:57 | 显示全部楼层
fedor 发表于 2014-4-16 19:23
' H/ v; P/ r9 l% W3 u) i, y' J恩,你说的这个我是知道的。但现在我有很多不是这个俄罗斯人编写的词条,我只是将其拿出来做个例子说明对 ...
' N3 N  N$ g# |# y' F
3 R' V; {7 V* I% e, G
可以的,试做见附件。8 n) a: q/ y# S; m
' d7 P+ C+ b! [  p0 R) h

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

 楼主| 发表于 2014-4-16 20:41:58 | 显示全部楼层
本帖最后由 fedor 于 2014-4-16 20:46 编辑
$ `: V7 t! @' e1 O6 F
Oeasy 发表于 2014-4-16 19:49
7 J/ a7 g8 e' O/ \, j可以的,试做见附件。
" b: S2 m& {2 W, B2 L& K3 v0 `9 m

9 I5 B* h1 r3 }+ t; N老大,你的这个是怎么做的啊?能否告知步骤啊,用哪些工具啊?

该用户从未签到

发表于 2014-4-16 21:00:38 | 显示全部楼层
本帖最后由 Oeasy 于 2014-4-16 21:03 编辑 9 B& L: O+ M% j/ G. |
fedor 发表于 2014-4-16 20:41
3 P3 M: }; M, d& G老大,你的这个是怎么做的啊?能否告知步骤啊,用哪些工具啊?
" [/ m2 m+ h. l
* v6 I" J8 r' z5 X( \' R2 \
办法非常多,步骤可多可少,最少一步。
9 m' ]* i0 `+ C% C- g6 c5 h2 r) O- C( X我这里用的UltraEdit,如截图" K: d1 u7 H4 f0 ]
0 A) z: n$ a0 F# b! `, T# D9 k

/ ?: i3 |5 L+ i& I查找
  1. (\S{1,})\s(.*)\r\n
复制代码
替换为
  1. \1\r\n\1 \2\r\n</>\r\n
复制代码
注意\1和\2间有个空格。- X7 _7 F8 F2 K- J2 o
正则表达式引擎是Perl" m7 f% B$ a8 B
% i5 T$ ~( U- O
替换完成后就可以用MdxBuilder制作为mdx了。7 R8 q: B% I9 C

该用户从未签到

发表于 2014-4-17 14:26:16 | 显示全部楼层
正在看正则表达式30分钟入门,O兄能否讲一下上面两条表达式的含义,谢谢!

该用户从未签到

发表于 2014-4-17 17:29:37 | 显示全部楼层
lzr80 发表于 2014-4-17 14:26
; h4 c5 f  V% J) \8 Q" ~正在看正则表达式30分钟入门,O兄能否讲一下上面两条表达式的含义,谢谢!
3 Z( i/ }* h) @4 X% O2 P) G& I/ v7 E
{:5_227:}
8 y6 ?5 ?) E/ H5 n- p* [7 G: D7 O3 y  ?, v9 X
对着百度百科http://baike.baidu.com/view/94238.htm,在页面内Ctrl+F相关表达式就行。
. d8 b' D- q) z- d比如\S
9 ?: _* \0 k0 G0 v0 V; S# T! q
\s 匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。
% u6 {* U4 p6 Z9 x+ g: Y\S 匹配任何非空白字符。等价于[^ \f\n\r\t\v]。

& ~' R) M  d9 E& Y6 j- O6 d1 @

该用户从未签到

发表于 2014-4-17 18:58:54 来自手机 | 显示全部楼层
thanks
  • TA的每日心情
    奋斗
    2022-7-18 17:14
  • 签到天数: 413 天

    [LV.9]以坛为家II

    发表于 2014-4-18 22:12:44 | 显示全部楼层
    感谢楼主和各位大神!
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-20 09:19 , Processed in 0.024012 second(s), 22 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表