掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 101310|回复: 187

[教程] mdict版制作方法和常用工具

    [复制链接]
  • TA的每日心情
    开心
    2018-10-17 09:01
  • 签到天数: 18 天

    [LV.4]偶尔看看III

    发表于 2008-10-11 11:20:56 | 显示全部楼层 |阅读模式
    本帖最后由 ldlcau 于 2018-5-22 12:02 编辑 ' @- v  l: v+ q; O6 B: L' l8 ]

    2 b' n- U8 d0 c  kmdict是显示mdx内容的工具,mdxbuilder是编译mdx源文件到mdx的工具,mdd是mdx的附加资源库文件,mdd不能单独执行。
    $ n' ~) p( l+ Q+ E( e6 L7 y& ~9 _
    8 t/ t6 S5 f5 a) @( N! C
       制作流程 图文资料--整理成mdx源文件--用mdxbuilder编译转换为mdx (mdd同时生成)--使用mdict浏览mdx(mdd)的内容。
    6 b/ c( ^8 U9 l
    0 L) B7 X2 Y& O1 ?& k! R1 d1、mdict制作常用文本格式(mdx源文件- U6 ?/ x( E$ q' p+ }7 W

    / ?  ?7 m( [/ J) {1 {mdx源文件常见格式详见附件中的示例
    8 e4 Y" @& q0 r+ O5 S/ @% S. h( f& M1 s
    转换软件MdxBuilder,下载地址https://pdawiki.com/forum/thread-3747-1-1.html8 @$ J& o) c/ g" \7 f1 U, R
    首先制作MdxBuilder转换所需的原始格式txt文本文件
    4 L7 }9 c( E9 D- {  c最常用的是MDict的html格式
    6 t( s, Y+ ^/ D8 O每个项目两行
    - p( H% _+ U. v" I$ V; e$ L% A第一行是关键字& t1 t* P; O  a- |. r: d/ P
    第二行开始是正文, 这里的正文应该包括关键字。可以使用html的标记(不要包含<html>
    ( c! U) ~: L8 m) w4 ?3 s. D, h<body></body></html>, 这个程序会自动加上, 另注意在转换时要指明源数据为html). ( {8 {8 N: e: z% h6 N; }
    如果需要显示音标的话,可以利用html指定字体就可以显示了。(参见下面的例子)
    / A7 X& f, B( ]* F9 e+ R6 _正文结束后必须用一行</>表示结束6 [# o7 X* W" X) r* ?
    例子: 1.txt
      ]/ U$ M5 x" `& }) [
    + k0 E8 X$ z# n; q( I  a词条1标题Whole: y8 ?& v+ l9 H- E- p. G
    词条1内容<font size=5>whole</font><br><font face="Kingsoft Phonetic Plain, Tahoma">(hol,hJl; houl)</font>8 I" J8 P9 A# }: p, a
    </>

    & }8 D1 i0 M  S- m9 V" [/ F) l词条2标题
    8 l9 [8 o3 k5 B' o8 |; M: u词条2内容
    - X% f, w( `3 l6 |: O. f3 C</>
    2 l: i7 F" w, E词条3标题3 I  X2 D& R+ s3 x( z& |5 t, P- Q# u
    词条3内容* l  a* Y' g; D! \/ Y8 y7 j% m
    </>$ u% o( Z  r9 _  [. E0 U
    / E( E) |) F  i! q$ F& q* ]7 X, @
    (注意"</>"和下一个记录间不要有任何其他空行,请参考example.txt中的例子)" ~: F% `  B- f( o6 j. x
    在html中连接到其它关键字的方法:$ n' o& f! u4 \# U. H
    <a href="entry://key">key</a>
    : }' @" Y+ K% h5 T2 B2 U其中key是关键字,
    3 M1 ]& p" i  D5 q% V词条内部跳转方法 <a href="entry://#1">目录一</a>   (一定要有<a name=1></a>相对应)- U2 J% b6 H+ W; R* E  p

    2 g5 _2 [* \: R/ z在html中嵌入图片的方法:(
    & o" J  v5 e0 E$ r<img src=file:///abc.gif>  其中src指向的文件名大小写不敏感) e6 y: N8 B! K4 u
    并将所有图片文件放在一个单独的目录中(不要与词典源文件放在同一目录中). 数据目录中可以
    % D& v0 y! o+ N& {0 h带有子目录。在使用MdxBuilder制作词库时,将Data路径指向上面存放数据的目录,该目录中的
    / E& j7 _0 M  v7 V5 o( K' v' O1 h7 l7 Q所有文件都会被压缩到后缀名为.mdd文件中,使用时该.mdd文件应当与.mdx文件在同一目录下。/ n1 I) F* p& m# k( D
    MDict 3.1 支持多个mdd文件组合成一个mdd来使用
    8 n5 V( T, l0 @8 L8 ^, {! Y制作方法:将图片分成几个目录,然后逐个目录打包就是了。9 {$ P2 l, N3 M0 @$ d
    打包后的文件名: 词典.1.mdd 词典.2.mdd  词典.3.mdd  ......: f$ l$ d, h; C) C
    调用方法不变。) g  c( ]' B8 r7 P4 a0 h) Q- ~3 |
    程序在第一个里找不到,就去第二个里找。。。
    / m) ~; S" h4 ~9 j. E6 T  g
    % s. C  }# ]: O4 l# a
    # K: d; R1 S2 s" X; O, \! W2 D/ I! R加入外部样式表的方法
    ( w. C/ G! C' B% _制作时在每个词条内容前加上
    " s; w' i8 L. y% l- n<link rel="stylesheet" href="style.css"># {* A2 a9 c: }( R; M# ^4 A
    这句话,然后生成mdx9 r, @! {( P- N& t( ]0 o( u
    生成的mdx与style.css放在同一目录下。8 o! D6 a. b/ _& w8 U
    style.css内容示例:

    1. 7 n6 T; O/ h  p7 D
    2. BODY { FONT-FAMILY: "宋体", "宋体", "宋体"; FONT-SIZE: 80% } /*注释页面字体大小*/ ; q; K  s: s* d' m8 Z- p1 D/ E' _
    3. TD { FONT-SIZE: 11pt } /*注释表格字体大小*/ ' W; H+ h: h* E  t0 p0 E. I
    4. A:link { COLOR: #000000; TEXT-DECORATION: none } /*注释链接样式*/ ) I) P3 Q% K, h
    5. 4 I  ]$ A* r5 `5 u
    6. A:visited { COLOR: #000000; TEXT-DECORATION: none } /*注释已访问的链接样式*/ ; a  W+ N) N# s$ s1 P8 f0 |2 @
    7. 5 I& I9 g: R$ e3 Y& d
    8. A:active { COLOR: #ff0033; TEXT-DECORATION: none } # U/ @8 }6 J. J9 F" M- y% g( ?/ g

    9. 2 h" X- |% I( }2 R) c7 C( p
    10. A:hover { COLOR: blue; TEXT-DECORATION: none }/*注释鼠标放在链接上样式*/ 1 I$ K6 f" w% u5 p+ C$ q& T. Q
    复制代码
    --------------9 f) ~6 D( ~+ f  v/ k7 G7 t+ a
    2、数据处理方法(生成mdxbuilder可以编译的文件,就是上面介绍的)
    : c6 O5 z$ Q& H1 P8 s+ r( @9 B6 L1 Y$ ~  s: d( k
    一、mdict编辑器网络版
    5 X. x2 L4 K" D7 b% u2 N, h6 s  处理好txt文本或者htm文件后,可以利用mdict编辑器 导入数据库后编辑然后再导出为mdx源文件,绿色文件解压后可直接运行。- }9 l/ N, L6 i/ G- E' d* ^
    https://pdawiki.com/forum/thread-4498-1-1.html / k! P+ ?3 |; k4 M- V0 ?. w
    支持无限多文本。  并且支持可视化在线编辑 和在线提取、批量下载网页文件推荐新手使用
    / V. a* I" T3 B0 C' H# S
    & \4 k2 w1 Y5 t% b4 v6 F5 o5 F" w: d7 V+ i* l" m8 c5 \4 w( l
    二、MDICT文本处理软件
      u8 d) |" |2 Q. _! {, Q* o& \* N9 n5 }. e1 a7 t
    简单的编辑工具
    ! _1 J) t$ h0 ca. MDict词库可视化编辑器
    * A) {; P4 n5 Z(Mdx Source File Maker) V0.3 http://bbs.pdafans.com/viewthread.php?tid=609517感谢 nbdx-mmrs 网友制作此软件8 c' r: h( Y7 D& P% Z2 i, G
    5 D3 Z& R$ i- {% S$ Z2 x
    b.批量文本处理程序,注意事项:每个txt文本文件的名称作为词条标题,类别处请留空(删除“AA”),下载见附件,这个缺点是有时会有乱码。
    1 ?. r/ c" M; `- i& v" t
    ! N6 Y& O) G# o  Y2 Ic.简易词典制作工具https://pdawiki.com/forum/thread-4513-1-1.html (感谢fdfdrere) 1 i' l: j- g8 c) L0 ^- b5 k

    2 p5 a+ s) u( J6 p% Cd、html2mdx / J4 K* k8 I& r: W6 v: ~
    将html文件转换为MDict格式文件的程序!Wncable(Bowang)大侠的工具软件,可以将Html格式一次性转换成符合Mdx格式要求的Txt文件,随后便可以用MdxBuilder软件直接生成Mdx文件了!2 q  `# a6 b. U$ ]
    https://pdawiki.com/forum/viewthread.php?tid=840 R  Z# d3 a* {) c, }# t
    ) M2 z5 B5 Y; }+ |) R/ s0 ?4 T  N
    三、其他方法
    5 f# V& f% _, ]) e" S0 ^a.逐条输入→MdxBuilder支持txt→MdxBuilder生成(适用于制作自己平时日积月累的东西,可以生成漂亮的表格)4 M; l% S+ E; L, ?: R6 g% M# n
    b.利用MdxBuilder支持的格式的词库转(适用于转现成的SugarDict,KDict词典)
    2 y2 s# ^( V4 l- Mc.其他→(excel)→文字编辑软件(用UltraEdit-32好于EmEditor好于word)→MdxBuilder支持的txt文档格式→MdxBuilder生成(适用于高效制作一切能方便转为excel文档的词典)
    ) W. i! \1 g& n- U) mhttp://bbs.pdafans.com/viewthread.php?tid=179661$ I# W5 I; e% r; t* ^" ~' y% p8 X
    d. 我的mdict词库制作体会 (莲花无语 提供) https://pdawiki.com/forum/thread-4088-1-2.html  ' |  k6 @% j7 D) G% S

    3 T1 s% x: V3 z* P四、危机百科
      O$ ~+ ?1 L. f
    原始数据:http://download.wikimedia.org/zhwiki/0 b! s2 o2 \5 L6 q, U

    / ^4 a2 d" E2 d; B: B! l6 s危机百科转mdx源文件制作工具
    # w% Y$ p/ Z. f# T- Z( Ohttps://pdawiki.com/forum/thread-1315-1-1.html
    + o& u' S3 P6 h, r8 n6 S3 V; t3 Hhttps://pdawiki.com/forum/viewthread.php?tid=86 ) U0 S+ t+ z( c2 _: m- b$ T/ m' t
    " @3 l7 R1 Q( [  K' G
    危机转换工具
    ' m! G7 r" o2 x$ B# FWikiToMDict2.0
    : |7 X  d) `- Q' X- dhttps://pdawiki.com/forum/viewthread.php?tid=86
    + v/ Z, O1 D0 J- ?3 ~- |0 b1 T+ Y' d& _5 @: B% m% G5 }2 _# K4 v
    Wi。ki2Txt V1.1" H9 c- ]* i7 A, P
    下载地址 http://bbs.pdafans.com/viewthread.php?tid=500730
    9 w" j& @' D  G4 V" e, cV2.1
    ( }' o" F0 D" }) R/ Khttp://bbs.pdafans.com/viewthread.php?tid=753395% |( `. G9 C( N  T' p
    , S% X& X7 n  L" ^
    五、Txt文件词条合并工具 Combine,绿色版
    & Y( l! |  E9 y( TWncable(Bowang)大侠的巨作,可将多个词典的相同词条合并成1个!
    , Z% F0 P: a, [/ @7 mhttps://pdawiki.com/forum/thread-87-1-17.html 8 W+ B) Z. L3 H3 I' V  r
    ' z7 l! F; m. _% _  [  v9 l! l
    六、mdxexport ,将Mdx文件转换为Txt文件, k/ q# Y& t# S0 P
    https://pdawiki.com/forum/viewthread.php?tid=954' ]1 X' m3 t/ ?7 J  i0 z

    ! L- L* R  r: ]# A2 c--------------; K- s. T0 `7 {8 l! u0 _8 E# Y, w
    3、mdxbuilder转换信息6 C  u) N3 _! G5 b% m* C
    , I2 [' M' A) z+ _& B; U2 a
    以上方法处理后得到的文件再用mdxbuilder转换: S, Y, E6 ^8 e$ e
    , i; Q+ M5 @5 p; {: z
    MdxBuilder关于选项的说明:/ P7 G5 f4 _! N
    a) Key case sensitive
    2 \8 [+ X/ {& x2 I" n$ z. X关键字(标题)是否大小写敏感。多数情况下词典是大小写不敏感的,所以不要选。
    ; |8 r# n2 E, H0 B9 o& mb) Allow export to text$ \  c" a  k- d  M
    是否允许导出为文本。如果选了,就可以用MdxExport这个工具吧词典导出为文本格式。
    $ I; b4 H8 T: F4 h2 m9 i+ ic) Right to left text
    % `0 b3 p- W/ i/ m  I# n文字的阅读顺序。中文是从左到右,阿拉伯文之类的是从右到左。& U- @3 z/ ^0 a9 S% s- U
    d) Strip key& B5 B3 Q% E* W$ a$ {2 R
    是否去掉关键字中的特殊符号。例如21世纪词典里的关键字是显示成"lis.ten" 这个样子的,如果不去掉".",则用户需要输入"lis.ten"而不是”listen"来查询单词。  d' y7 J$ p( I( |, v1 o( Y6 b
    e) Title
    2 ]: [& ?& |5 _$ k8 L+ e  A* T) W这个是用来标示词典的名字,计划将来在需要显示词典名称的地方进行显示用的。但目前暂时没有用处。5 a- D/ i' y8 V6 q2 W
    f) Description
    9 k+ v# K; I4 |/ l词典的详细介绍。第一次打开词典时看到的欢迎页面。! ]  |! ^6 I- W- K7 W  I
    g) Build Data archive8 ^! M9 q/ g0 L& o7 j8 K* }8 s
    仅进行数据文件制作。主要是用来制作图库,声音库时用。勾选后就不用填写Source路径。
    , Y) ]) A4 E, _- }) Ih) Index block size, Record block size. 这两个是调整性能用的,用缺省值就好了。
    - Z$ j) W8 M! {i) Encryption Key% w3 x0 Y) J; J7 R0 O
    词典加密的密匙,用于词典授权用的。可以参见MdxBuilder.zip里的LibKeygen.txt的说明
    . w$ }8 x% i' o5 ^' z- T" d0 C
    , k- S) ~. w1 j. r3 \+ O0 p! \5 s注意事项:
    % }; q8 y( G2 p7 B6 k6 p          1、图片链接最好使用 <img src=file:///1/1.jpg> 这样的格式
    9 W' K8 W) K6 G$ C1 {. E           2、转换出错一般是标题位置有多余的空行
    2 l  L* F( I' o+ W, o% c7 A如:
    6 O# \' B' N: Z1 V4 a& H   词条1标题
    2 v  f5 ^1 h* Y) ^2 O: n   词条1内容7 ?0 g. A1 d: A2 g" I2 D; Z% @- |% z
    </>
    8 p" i: P3 u7 K. j: l! m5 L( g! f) K& V2 i/ \
    词条2内容+ V4 t9 O6 \+ b3 O0 p  Q
    </>/ `1 F9 F8 ?/ n& q
               3、mdxbuilder处理转换后的mdx文档大小应在4G以下
    0 n, z1 Q+ L8 X- h
    0 C0 T8 n$ W& A. }MdxBuilder出错信息1 H' c3 Q5 ~/ g9 V- D; `0 M
    1、出错信息:“Keyword is longer than 255 at position: XXX of the source file”
    9 M; a0 t! T7 A可能原因:标题位置缺少换行,使用编辑工具编辑并存档后,txt并未能识别你所制作的文件己隔行。
    8 A& f% {& {! B) U5 M用UltraEdit打开文件按Ctrl-H进入16进制模式,然后按Ctrl-G, 再输入 XXX (就是报告错误的位置). 然后再按Ctrl-H返回文本编辑方式。。。
    8 h/ S" A9 T! h& S/ b$ n8 I
    解决方法:再新建一个档案,然后将所有的文字复制到新的档案中;指定行处增加换行。
    & y9 ?" S: Y5 H% r: S2、出错信息:加载正常,但转换中内存溢出。
    - P* p+ \: M( |1 D/ K; k3 m可能原因:源文件过大
    - d) I1 X8 p& l) @' d解决方法:使用mdxbuilder大文件特别版2 [, m$ d) R1 z+ k; H. s% ]' H
    3、出错信息:Invalid keyword at position: XXX of the source file。 Failed to load source file, process cancelled* s" b$ e+ V+ C" [4 [) ]% l1 y) g# G
    可能原因:标题位置出现不必要的空行。2 q  i& A) @+ z8 f# I/ g
    解决方法:用UltraEdit打开文件,Ctrl-G, 再输入 XXX (就是报告错误的位置). 删除空行,空行较多可用正则表达式批量处理。
    ' y, Y# I1 N; v0 ^/ |
    0 J9 N2 ^2 j& D------------------" {: y. Z+ a* s% b
    & r( D/ p% L6 L$ Q% R  i3 ~
    4、mdict版制作常用编辑工具软件(用来编辑mdx源文件 或 收集处理文本资料)
    0 M- g4 _" g( n
    UltraEdit-327 M1 O- d/ r9 R0 z
    编辑工具2 Z: w' P% M) R- P7 M/ Y
    UEDIT查找替换高级教程(制作电子书与MDIT辞典必看)
    2 v" @1 `  E7 m  C7 Q+ h其实UEDIT32的搜索替换至少有两个最明显的优点:( I% Y9 Z  C1 ]% a2 y
    一、执行速度非常快,是WORD的数千倍,不信你打开一个20M的TXT文档,用UEDIT替换只要3秒钟,用WORD看要不要几个钟头?
    3 B+ p, }9 y2 s6 ^二、UEDIT的替换内容可以包括查找到的内容,这是在WORD以及更高级更专业的“微软正则表达式”所都无法支持的,不过这个应用可能大部分的朋友都不知道。( y) N9 X9 _- H, R6 w( `5 m
       虽然许多极其复杂的文档查找与替换必须使用较专业的正则表达式来处理,但对于一般甚至比较高级的操作来说,UEDIT还是我们的不二选择。现在我来简要介绍一下UEDIT的查找与替换的高级应用。
    ' P+ g5 h* r* B' w以下的示例使用中文版UEDIT10进行讲解
      t6 V# h9 s( p) `, U# F1. UEDIT查找的快捷键是Ctrl+F(find)或ALT-F3,替换的快捷键是Ctrl+R(replace),再次查找的快捷键是F3。3 d+ j: |% L1 A. E5 t8 r; z) L
    2. 一般查找与替换功能:& N0 k& V0 m/ D' ]1 A# X$ i
    ※在查找/替换框内将“正规表达式”的√给去除,并分别在查找与替换的框格内输入所需的字符,执行查找与替换即可。
    ( g! }2 }7 j( G9 c* _2 M4 y8 i/ C※如果需要匹配回车键,在查找框中可输入^p(注意p是小写)来代替回车键
    ! M3 `9 `4 k9 S1 b9 ~6 Q' `说明:在unix格式中^n表示换行,而在mac的文本格式中^r 表示换行,dos格式中^p 表示换行,不过一般情况下^p 可以同时兼容^r 或^p, M% [; @* I* X  ?( f0 B
    举例:# B5 z+ U1 W  U" ]
    # Y. x0 K2 X, m* A
    dfdf
    2 A; u5 \6 h1 U+ B4 Oss
    ! N2 H: r2 Z* q* T+ D8 M7 Qfssdf给替换为dfdf,ss,fssdf格式:可在查找中输入^p,替换中输入,(半角逗号)即可。6 p  e! I- \' Q, x. v6 F+ G0 e, `$ b
    反之将dfdf,ss,fssdf给替换成以上三行只要在查找中输入,(半角逗号),替换中输入^p即可。2 w4 ~: x+ {  j- T4 q4 F
    高级查找部分:
    8 Q1 ~; u7 v# M" ~& C9 \1.要记住将查找/替换框中的正规表达式给√上; M) F1 [9 d! `4 }( J1 _, y
    2.常用的查找/替换命令:; ]9 v2 V8 d: a: ]* t
    %        匹配行头(0字符,仅是匹配一个位置)
    ! z0 M% H, z; U5 d% Z$        匹配行尾(0字符,仅是匹配一个位置)

    3 v$ ], G  ^5 f" ^% E?        在一行中匹配一个单字符
    # z) H5 @+ B( n1 L* L*        匹配一个或多个字符(不允许跨行匹配)3 K4 ~& }5 q6 r+ H# k- P7 N
    +        匹配+左边的那个字符一或多次(不允许跨行匹配).  + V0 T5 |% K) b5 N9 U  y3 \
    ++        匹配+左边的那个字符零或多次(不允许跨行匹配).

    0 w- D2 R* b0 m5 e% Y^b        匹配分页
    5 h" q' t( H2 ?% v1 }^p        匹配DOS文本的换行符(通用)
    9 C' F: C) ]" u/ ~^r        匹配MAC文本的换行符9 r: o6 z$ P8 X3 N6 |4 D
    ^n        匹配UNIX格式文本的换行符(在wondows操作系统中一般情况下可与^p互换)
    * k. s4 f7 k# ~- ?! L6 I% ~^t        匹配tab符
    1 u' o; W$ `$ E. y$ n
    [ ]        匹配单字符或字符范围) Y9 X9 l7 J# V( r
    ^{A^}^{B^}        匹配A或匹配B
    : s0 i5 c4 ^" k) h' N" C^(...^)        用于替换框中代替查找的内容
    7 U; N2 A( ]5 s0 ~2 v  a
    http://bbs.pdafans.com/viewthread.php?tid=565520&extra=page%3D1%26area%3D
    ( P' ~( t& T- @. d  M( A
    * v* D/ K; K' I+ M. [+ h. VEditPlus v3.21 汉化版
    4 ]3 v  q# y4 N4 A! g适合少量文本文件批处理,支持不超过50M左右的单个文件,拥有强大的正则表达式处理功能。
    0 d/ j. M% }6 z7 [http://www.sz1001.net/soft/690.htm
    ) H3 E* K# K% J* z" Q
    8 B1 J2 z7 B! q7 Q
    菲菲更名宝贝
    3 F' X$ w0 l7 U. Q, ]& ]$ z支持文件批量、改名以网页标题更名、以文本文件的第一行更名,各种内码转换等等;
    ; ]2 o7 v- b1 w3 I# Y: P. g+ }8 ?% a
    http://www.newhua.com/soft/59019.htm7 L' {! y- N* I- h' e/ Z
    http://www.ffhome.com/Soft/ShowSoftDown.asp?UrlID=2&SoftID=7
    # {! l& `8 C% {! ]- F2 r3 y  M$ I
    2 U, c% A. J* ?2 H# q, F5 L0 N多行文本替换工具7 D6 m0 h  m( D" w2 a
    http://www.rayfile.com/files/a089fd7a-973f-11dd-96d5-0019d11a795f// d3 G# E* [8 D# N" k8 z

    / ?7 R- q0 D& Q: l4 W5 XTextForever , I/ V1 E( @  n2 W
    TextForever(FineReader) 版本:1.75 评价:★★★★
    . f8 a1 w5 b$ ]' \! U6 z4 [文件: 中文简体版  中文简体版说明 English版(其中说明文件还是中文的)' `# |8 z7 w: w- S$ I, `
    中文繁体版 v1.58(感谢阿呆2的辛勤工作!) 1 F1 |+ y, m1 @
    功能: 提供以下功能:HTML->TXT转换、文件合并、TXT文件段落合并、TXT文件分行、编码(GB/GBK/Big5/Shift-JIS/Unicode)转换(只能用于Win 2k/XP)、文本替换、HTML代码整理、文件切分、文本提取、正则表达式、TCR批量压缩/解压,用于整理从Internet上下载的小说。软件原名FineReader,后更名为TextForever。 - E; M, Z( x7 y! \% x
    动机: 我初上网时常去“阿拉谈书屋”看小说,网主无聊到将每一页做成一个文件(后来他也为此而后悔不已),看起来很累,所以就想编一个程序能对下载下来的文件进行合并、整理,变成TXT文件以便阅读、打印。
      |4 c/ q" M$ u/ C为了编制这个程序,我专门从Internet下载了一堆HTML文档,苦读半月。所以有一次我和一个朋友开玩笑:他通过做主页练HTML,我则通过读主页练,大家殊途同归。2 j$ a: g% ?  l6 L
    说起来“阿拉谈书屋”对我所起的作用实在不小,不仅将我引进了Internet的大门,还为我学习Internet编程提供了强大的动力,先后产生了CrazyReader和TextForever(FineReader)。
    - O1 k$ n  A0 r7 \这个程序的段落合并功能则是在我对在网上大肆吹嘘的某“智能排版”工具感到极端厌烦的情况下做出来的,保证比它好使。 ( r0 l' b" i( y6 h

    " ]2 V" I+ d, ?5 d3 O, R2 Xhttp://www.comicer.com/stronghorse/software/exe/TextForever_chn.zip

    " l6 \$ f! ~& x3 u
    * y7 Y- l1 X1 B4 tteleport pro  网站网页抓取软件/ X% z5 {. h7 A3 n0 |
    Teleport Pro可以从Internet的任何地方抓回你想要的任何文件,它可以在你指定的时间自动登录到你指定的网站下载你指定的内容,你还可以用它来创建某个网站的完整的镜象,作为创建你自己的网站的参考。 Name:greendown     Code:714841311, L7 e2 b# R; q! W7 R" ~. y& m9 f
    http://www.quxp.com/download/view-software-1446.html
    3 j# V8 a' P3 A0 G+ y# G% Hhttp://www.86nt.com.cn/tracky/article.asp?id=38 $ T# _4 P- ?9 h

    7 {0 F% j9 Y. [! e8 E* R+ J4 o1 A# Iwget绿色版下载工具
    6 P& i) z0 d& s9 Q( [  N% |( P是一个从网络上自动下载文件的自由工具。5 D3 Y9 ~* n% o* O/ Q, s- a0 }
    wget可以跟踪HTML页面上的链接依次下载来创建远程服务器的本地版本,完全重建原始站点的目录结构。这又常被称作"递归下载"。在递归下载的时候,wget遵循Robot Exclusion标准(/robots.txt). wget可以在下载的同时,将链接转换成指向本地文件,以方便离线浏览。$ A& K5 `  ?5 ?9 D" x3 k" T
    ! @. ^; l9 b9 K% k  O7 H
    wget非常稳定,它在带宽很窄的情况下和不稳定网络中有很强的适应性.如果是由于网络的原因下载失败,wget会不断的尝试,直到整个文件下载完毕。如果是服务器打断下载过程,它会再次联到服务器上从停止的地方继续下载。这对从那些限定了链接时间的服务器上下载大文件非常有用。
    ) M# ?  _$ B; B& A# C* u
    . b* W8 |: t9 p* g2 r/ j6 S

    8 W  Y0 t* O8 @2 I/ e6 |5 K; M- X
    & l' C6 O( C1 P

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    评分

    7

    查看全部评分

    本帖被以下淘专辑推荐:

  • TA的每日心情

    2022-10-13 08:46
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    发表于 2022-8-25 14:49:41 | 显示全部楼层
                                           

    该用户从未签到

    发表于 2022-5-26 12:14:22 | 显示全部楼层
    本帖最后由 jiangwhei 于 2022-5-26 12:22 编辑 # M8 [5 s. V/ \: `. D" E
    4 T. d0 S0 _) m9 e5 u
    慢慢学的,终于有点眉目了。
  • TA的每日心情
    奋斗
    2022-6-1 15:34
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2021-12-3 11:14:01 | 显示全部楼层
    六、mdxexport ,将Mdx文件转换为Txt文件
    8 n' E, y5 A6 }2 p% Y
  • TA的每日心情
    开心
    2021-10-31 09:44
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    发表于 2021-10-27 21:55:03 | 显示全部楼层
    6666666666666
  • TA的每日心情
    难过
    2021-12-31 18:56
  • 签到天数: 11 天

    [LV.3]偶尔看看II

    发表于 2021-9-13 16:00:17 | 显示全部楼层
    谢谢大神教导,很详细
  • TA的每日心情
    开心
    2021-3-21 23:40
  • 签到天数: 11 天

    [LV.3]偶尔看看II

    发表于 2021-1-26 20:53:48 来自手机 | 显示全部楼层
    哈哈,看了这个帖子受益良多。

    该用户从未签到

    发表于 2020-9-16 15:01:31 | 显示全部楼层
    学习了,明白mdx mdd啥关系了

    该用户从未签到

    发表于 2020-5-21 08:11:04 | 显示全部楼层
    mdxbuilder制作的词典,再转回txt,用getdict不行。
  • TA的每日心情
    开心
    2020-2-19 11:35
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    发表于 2020-4-8 10:04:19 | 显示全部楼层
    写的真JB乱 不会讲 还讲呢吗原理。。。直接弄几个例子吧 低水平sb
  • TA的每日心情
    慵懒
    2020-3-18 04:37
  • 签到天数: 29 天

    [LV.4]偶尔看看III

    发表于 2020-3-12 00:10:20 | 显示全部楼层
    帮助巨大,感谢楼主。。。
    好友营 该用户已被删除
    发表于 2008-10-19 11:12:47 | 显示全部楼层
    请问用teleport pro 怎样设置批量下载啊?不会是
    5 v2 K; r% R9 j+ [: L% Thttp://baike.baidu.com/view/1.htm
    * g3 j1 g7 u6 P9 m9 S3 qhttp://baike.baidu.com/view/2.htm* v+ u7 E' S/ H) }- u9 ~6 `5 X
    http://baike.baidu.com/view/3.htm
    / L2 u. a% _6 H1 Z" j......
    ( g. I8 b. t1 Z5 V. ]http://baike.baidu.com/view/8000.htm
    3 a2 g7 `) w8 ]3 o这样输入吧?:L
  • TA的每日心情
    开心
    2018-10-17 09:01
  • 签到天数: 18 天

    [LV.4]偶尔看看III

     楼主| 发表于 2008-10-21 08:36:05 | 显示全部楼层
    teleport pro 不能用于下载百度百科,主要是下载依靠超链接的网站。
  • TA的每日心情
    开心
    2018-10-17 09:01
  • 签到天数: 18 天

    [LV.4]偶尔看看III

     楼主| 发表于 2008-10-21 08:59:11 | 显示全部楼层
    teleport pro的使用方法+ W6 ]! E  t. }1 E

    6 e' H+ P! ~! }3 K" Ehttp://www.hongen.com/pc/pcketan ... elport/telp0201.htm5 n  N7 C9 j+ N
    ! C: q) g0 w9 k" g
    http://www.pconline.com.cn/pcedu/soft/wl/brower/10202/35426.html9 f( G& ]: C  l0 s3 D7 h7 _

    % y1 N. o# [  d4 f: ]; G! z推荐Teleport Pro V1.54 汉化版
    6 s9 h) |% g* G5 [4 y; i0 O7 g* `, H) N/ }2 r( u. q
    大多数情况下地址编号没规律,这时就要使用我们的法宝了——Teleport pro,这是我见过的最强的离线浏览器,下面详细介绍一下它的使用。
    & i  s0 R& m& q! S! F4 q3 S+ \3 f: x' D9 I% r3 }4 H, H( }- h
    第一步:新项目向导,一定要选图中的那一栏。/ F0 I) u, T' E! j; n0 X
    & N! ^. Z: H; O+ O3 Q* M
    第二步:粘贴网址,这里的网址是图片所在文件夹的地址,这个也要你自己想办法找哦,下面的最大链接数看具体情况而定,如果想让文件夹找得很准一般设为1。
    2 K1 F( W$ j6 j- r. P& }
    ) i- A- K  q$ j' s# i( X9 w4 `4 V4 J/ m第三步:添加所找文件的类型,勾上。
      R' U. S- f' c6 p) L/ p
    + \; Q1 B# h9 [7 Z! @第四步:编辑。这一步是一定不能少的,它可以让你的下载效率倍增,你可以控制下载文件的大小和类型,要注意的是“最小文件长度”一般不能太小,否则会把缩略图也一起下载的。
    + K) m: n; P% ^: M+ p! O
    - B& x' o! u9 f0 k) U第五步:选择保存地点,一切OK!

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2008-10-22 16:49:18 | 显示全部楼层
    顶顶! U& o, T; b9 ~3 c- f3 }7 C2 E
    虽然看不懂:loveliness:

    该用户从未签到

    发表于 2008-11-4 20:22:41 | 显示全部楼层
    不错 学习了!

    该用户从未签到

    发表于 2008-11-24 00:26:33 | 显示全部楼层
    差不多都知道,呵呵

    该用户从未签到

    发表于 2008-12-8 13:12:54 | 显示全部楼层

    回复 1楼 ldlcau 的帖子

    :loveliness: :loveliness: 虽然看不懂.thanks

    该用户从未签到

    发表于 2008-12-27 22:40:54 | 显示全部楼层
    学习了,谢谢!

    该用户从未签到

    发表于 2009-1-4 16:59:57 | 显示全部楼层
    :) 谢谢!

    该用户从未签到

    发表于 2009-1-20 08:17:28 | 显示全部楼层
    关于那个“MDICT文本处理软件”的介绍,没看懂怎么回事。
    ) t4 ?6 ~: I& H; q5 [( L1 S0 }- _' p7 L$ o* E
    维基转换工具 Wiki2Txt V1.1,这个有链接吗,是怎么用的,和“维基百科转mdx源文件制作工具 ”有啥区别?如果没有后者好用最好能注明。9 p1 ]' X  G) p; B2 K/ e4 v
    9 O, u* ?- m1 y( R7 V+ U( A3 G
    “mdxbuilder处理的原始文档大小在4G以下“, 我处理过一个5G多的维基源文件,都还好啊。不晓得极限是多少G?
    5 h5 n5 k: g" }" W* R; X5 C
    # f  Y. G0 o* @' i9 xultraedit的宏可否对一批文件进行批处理吗?目前只知道可以对一批文件进行批量替换。: @/ h. D& i; V# c' a( i7 A8 I$ T' v

    : [6 d( x# d8 D“词条内部跳转方法 <a href="entry://#1">目录一</a>   (一定要有<a name=1></a>相对应) ”, 内链只是跳到那个词的位置,不知道可否高亮显示啊。另外如何链接到诸如https://pdawiki.com/的网页?9 J/ |+ W# k/ X- o. Y, H4 L

    3 Q( \: ?7 Y+ x, `[ 本帖最后由 tony4d 于 2009-1-20 08:38 编辑 ]
  • TA的每日心情
    开心
    2018-10-17 09:01
  • 签到天数: 18 天

    [LV.4]偶尔看看III

     楼主| 发表于 2009-1-21 11:54:44 | 显示全部楼层
    原帖由 tony4d 于 2009-1-20 08:17 发表 7 w8 d: T9 ]  u
    关于那个“MDICT文本处理软件”的介绍,没看懂怎么回事。
    $ _1 @% A7 Q: w/ j; a
    5 }2 I2 L4 G1 y/ ]! e9 Q0 ^维基转换工具 Wiki2Txt V1.1,这个有链接吗,是怎么用的,和“维基百科转mdx源文件制作工具 ”有啥区别?如果没有后者好用最好能注明。3 G  O; C! P6 {; J8 x, ]

    , d9 ~7 ^; w  a; c“mdxbuilder处 ...

    " H5 {0 Y+ W2 r5 w1 r/ B( y: @* w/ b2 i$ ^! F$ J
    Wiki2Txt 连接暂时没找到,应该是和维基百科转mdx源文件制作工具类似.3 l+ w( X8 x+ d) ~0 d% D: M

    : B6 W+ ]6 z$ _mdxbuilder处理的原始文档大小极限我没有测试过,可以联系下RAYMAN
    0 R4 \1 I5 O1 Q
    & w9 T, ~1 [, ]1 q7 J高亮显示可以使用htm语法,请到网上查找相关内容.0 e7 a! I  v& t" c4 V( Q

    & p0 w/ A1 _/ H. W& C. |链接到诸如https://pdawiki.com/的网页% E8 T+ h: Y% j9 E- ]
    <a href=https://pdawiki.com/>https://pdawiki.com </a>
  • TA的每日心情
    开心
    2018-10-17 09:01
  • 签到天数: 18 天

    [LV.4]偶尔看看III

     楼主| 发表于 2009-1-21 11:57:52 | 显示全部楼层
    MDICT文本处理软件 是将处理好的一组txt文本文件转换合并为mdx原文件的工具.txt文本文件的标题作为词条名称.
    7 H" K1 ^, P. Q% g
    & o+ i1 q0 P9 |2 o! Q合并好的文件可以直接用mdxbuilder转换为mdx

    该用户从未签到

    发表于 2009-1-21 16:04:19 | 显示全部楼层
    原帖由 ldlcau 于 2009-1-21 11:54 发表
    ' v& Q% r( m5 l, T" I: V3 N. _( @/ x! D: L7 I+ h& h
    ( {1 v$ v" J) U  C" J
    高亮显示可以使用htm语法,请到网上查找相关内容.
    % D) }, x% Z4 @" v
    ! V' n1 Y" w6 U. o2 D- f1 d* N% m  P9 i链接到诸如http ...

    1 K4 c; `/ L& z+ }
    1 [; ?$ u% g: u- F9 s页内链接怎么用高亮,可以举个例子吗?
    # K% K# C- F; g4 Z! v链接网站是知道,可是点击之后没法打开那个网址啊。2 C; J1 M: F4 p
    谢谢

    该用户从未签到

    发表于 2009-2-4 16:41:31 | 显示全部楼层
    楼主,你是否可以重新上传一下Collins英英词典,rayfile的链接过期了下载不下来。谢谢

    该用户从未签到

    发表于 2009-2-5 11:27:38 | 显示全部楼层
    原帖由 tony4d 于 2009-1-21 16:04 发表
      X# ?% R3 A3 w& l; m6 n( q
    ) k0 ~1 P; H0 S% t* {" c1 s  T9 ]" s" S: C' y9 O3 z0 N
    页内链接怎么用高亮,可以举个例子吗?
    ' t$ G& ^1 x/ y% K: U链接网站是知道,可是点击之后没法打开那个网址啊。
    ( E7 M! t6 h0 x# [6 _2 u9 X谢谢
    8 D/ P  |  _' K
    高亮就是改变文字底色,用控制颜色来实现就可以了。
    " s6 t9 P6 i; M& w  _外部链接现在不支持,可以考虑以后把这个功能加进去。
  • TA的每日心情
    开心
    2018-10-17 09:01
  • 签到天数: 18 天

    [LV.4]偶尔看看III

     楼主| 发表于 2009-2-5 14:53:49 | 显示全部楼层
    原帖由 eter 于 2009-2-4 16:41 发表 . x' m: \3 X0 H7 }: z4 L" h2 e
    楼主,你是否可以重新上传一下Collins英英词典,rayfile的链接过期了下载不下来。谢谢
    7 J* q- F. I* N8 L

    / N! |. l& b, U5 d) p- Yhttps://pdawiki.com/forum/thread-901-1-1.html
  • TA的每日心情
    开心
    2018-10-17 09:01
  • 签到天数: 18 天

    [LV.4]偶尔看看III

     楼主| 发表于 2009-2-5 15:27:04 | 显示全部楼层
    外部链接* u9 `8 P. l* V  t2 O+ n8 H& ?
    pc版按住shift然后点击链接可以在外部窗口打开

    该用户从未签到

    发表于 2009-3-18 22:50:40 | 显示全部楼层

    该用户从未签到

    发表于 2009-4-8 13:12:06 | 显示全部楼层
    babylon 词库用什么工具可以转换呀? 很想转一些,里面有很有有用的词典.
  • TA的每日心情
    开心
    2022-10-10 09:12
  • 签到天数: 202 天

    [LV.7]常住居民III

    发表于 2009-4-9 23:16:44 | 显示全部楼层
    跳转时,<a href="entry://key">key</a>,不能用大写字母A,即不能用<A href="entry://key">key</A>,否则无法跳转

    该用户从未签到

    发表于 2009-4-12 01:35:07 | 显示全部楼层
    很想看懂这个帖子,自己做做词库,可是看了很多遍,还是看不懂。下载了mdxbuilder,里面带了个example文件,如下:
    - ~  S) B: H" r  x1 \( Q) P+ GAbc
    ) Z5 Y% b; D, d* `) n/ M/ X`1`Abc&#96;s`2`<p>`3`(hol,hJl; houl)+ u0 Z# ^# Q3 ^( e- J, M& C* z, `# m
    </>
    1 u: b/ `; y) r" ]# \! G2 @2 REnglish
    " ^% _6 e9 Q8 D' REnglish test
    ; U9 {' c1 x. V3 f& S# v5 ~</>8 E7 F. j- E/ {# V/ g/ D! F
    中文
    ) S8 \% ~4 h$ x& m, g" w中文测试; d8 h4 K+ j4 d* _1 x
    </>
    * `2 F7 P" I0 U0 I4 [
    ! M+ I& W5 A9 o; [
    ) G5 e& o$ _! M/ [在上面的内容中,Abc是词条名称,好理解。1 g5 p$ M. u. H, F) ]" a) Z3 V
    可是第二行啊 `1`Abc&#96;s`2`<p>`3`(hol,hJl; houl),这是个什么东西啊?实在看不懂。
      l0 B& q/ w, L% P再往后走也还好理解

    该用户从未签到

    发表于 2009-4-12 01:53:19 | 显示全部楼层
    我用mdxbuilder把它自带的example.txt转换成mdx,然后用mdict去读,结果报错。"unable to open mdx file:invalid style sheet"看来自带的例子文件有问题?
  • TA的每日心情
    开心
    2022-10-10 09:12
  • 签到天数: 202 天

    [LV.7]常住居民III

    发表于 2009-4-12 12:05:51 | 显示全部楼层
    原帖由 roadfjl 于 2009-4-12 01:53 发表
    , h7 z, `8 |) ~! B3 V& ?我用mdxbuilder把它自带的example.txt转换成mdx,然后用mdict去读,结果报错。"unable to open mdx file:invalid style sheet"看来自带的例子文件有问题?
    ! C3 z" g- W3 l0 z1 w& L
    example.txt转换成mdx可以打开,你注意两个问题:1.目标文件最好将后缀.mdx打上,2.encoding一定要选UTF-8(Unicode)。你再试试

    该用户从未签到

    发表于 2009-4-16 07:57:11 | 显示全部楼层

    好啊

    :) 顶
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-2 02:21 , Processed in 0.036119 second(s), 31 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表