掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1135|回复: 14

[求助] 关于制作词典时的词条数量问题

[复制链接]

该用户从未签到

发表于 2014-1-1 17:34:45 | 显示全部楼层 |阅读模式
本帖最后由 fedor 于 2014-1-1 21:43 编辑
' A1 ~' C" c/ \( s* |- a/ h3 e, j5 d/ P
各位好,今天做了个词典,发现有个问题,一直没有搞明白。
( h) r9 ^& m5 W8 L词典原始数据在Excel表格中,显示的词条数是1426个,用星际译王词典编辑器制作词库显示词条也是为1426个,在文本编辑器中显示为4278个,也是正常的。但用MdxBuilder制作词库时显示的词条数是1420个,为什么缺少一些词条呢?
0 x# Q' ~. N5 ~* o- p# s        

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2014-1-1 20:51:16 | 显示全部楼层
你用文本编辑器数一下</>, 这是固定的

该用户从未签到

 楼主| 发表于 2014-1-1 21:35:45 | 显示全部楼层
Hugh 发表于 2014-1-1 20:51
( q8 x5 X& f" a: k你用文本编辑器数一下, 这是固定的
  o  V( j$ h9 s9 x, G# A% Y, X
数过</>的,也是1426个啊

该用户从未签到

发表于 2014-1-1 21:37:35 | 显示全部楼层

2 V9 C% _) J* f7 bMdxBuilder给出的词条数目不一定准确,我还遇到过实际几万个,但是报数1个的情况。可以用GoldenDict加载那个mdx看看实际的词条数。

该用户从未签到

 楼主| 发表于 2014-1-1 21:50:47 | 显示全部楼层
Oeasy 发表于 2014-1-1 21:37 " w) y/ m- k% b9 ?1 z0 J
MdxBuilder给出的词条数目不一定准确,我还遇到过实际几万个,但是报数1个的情况。可以用GoldenDict加载那 ...
$ m0 d* j9 z- M: k; V
谢谢回复,用GoldenDic加载了,显示为也是1420个。我制作过好几十部词典了,词条数目都是没问题的,今天头一次遇到,怎么都搞不明白了。5 S8 z3 p$ u- C7 Z

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2014-1-1 21:59:46 | 显示全部楼层
fedor 发表于 2014-1-1 21:50 $ k% k/ |% R- _. Z% _0 V
谢谢回复,用GoldenDic加载了,显示为也是1420个。我制作过好几十部词典了,词条数目都是没问题的,今天头 ...
+ q5 T: Y( j4 ]9 k4 j( B6 U9 Q

; p& s3 j5 S: F: L; S' O5 k" F+ }你用GetDict.exe把1420条的mdx转为mdx源文件txt,看看</>够不够数。6 d$ B. s9 @% s. K! z8 I
2 G! T" u- I- e. ?1 Y: Q! K
如果从1420条的mdx转出的txt,</>只有1420个了,那就用DoText(https://pdawiki.com/forum/thread-11430-1-1.html)提取这个残mdx源文件的headwords,和最早的1426条的headword list对比下。

该用户从未签到

 楼主| 发表于 2014-1-1 22:59:17 | 显示全部楼层
本帖最后由 fedor 于 2014-1-1 23:31 编辑
/ I& k% K0 l6 |3 m+ l& }3 J
Oeasy 发表于 2014-1-1 21:59   X3 U5 {6 L0 }6 y3 c) Q
你用GetDict.exe把1420条的mdx转为mdx源文件txt,看看够不够数。( Y5 A) t2 m1 q( O- b
$ Z0 }  u6 G3 y/ M
如果从1420条的mdx转出的txt,只有 ...

6 y- K3 w8 N$ M' U5 T) b* G3 S6 K! n
# l! ~3 V4 T$ R按你给的方法测试了一下,发现问题了。! X4 @; [: _2 U
源文件的词条数是1426个,这个是绝对没有问题的,但是用MdxBuilder转换后生成mdx文件,再用GetDict.exe将这个mdx文件转成txt,词条数目是1420,之后进行比对,少了6个词条。, d7 m8 l' {8 \1 F
词条数目确实应该是1426,难道转换器MdxBuilder的问题?为什么转换后会丢失词条呢?- k2 m8 t7 [$ U7 Y0 ]- n) }5 p

: N7 F! c7 N) }! M5 {
# m8 ~: K: M  t1 w' i% p5 j2 l% |9 o( A! l, x' y
我将两个文件进行对比,找出来其中6个缺失的词条,单独将其删除,按道理来说,剩余的词条应该是1420。用MdxBuilder进行转换mdx,又出来了怪事,显示词条为1414个了,用Goldendict加载也是显示1414个了,又是少了6个词条。到底是怎能回事呢?怎么一转换就丢呢?4 Y2 |7 i; k; Y3 ?

+ ^. c0 m7 r+ Q/ ^# _2 }; P单独删除的那6个词条,我单独用MdxBuilder进行转mdx,显示结果6个词条,说明源文件都是正常没问题啊。

该用户从未签到

发表于 2014-1-2 00:06:45 | 显示全部楼层
呃  这个 这个  围观一下

该用户从未签到

发表于 2014-1-2 07:28:02 | 显示全部楼层
fedor 发表于 2014-1-1 22:59
- m% y' Q! x# ]6 e6 l6 q按你给的方法测试了一下,发现问题了。
+ Y" f7 N: \& B源文件的词条数是1426个,这个是绝对没有问题的,但是用MdxBui ...

( R& B/ y) n7 I2 t" g8 Z+ W* t0 {
' Z/ L. ~) C. h7 a1 ~丢失的那6个词条也有可能没有真正丢失。把1420条的mdx转为txt,试着全文搜索那6个词条,看看还在不在。6 K! w) Q  G( ?
那6个词条有什么特别的吗?是不是位于源txt的起始位置?7 @4 y; M9 Q2 {
方便的话,可以把你的源文件发上来,让大家(主要是Rayman,他有空的话)到事发现场勘察下,这才能解决潜在的问题。

该用户从未签到

发表于 2014-1-2 09:20:26 | 显示全部楼层
1. 试试不要勾选"Strip keyword"。怀疑是有些条目关键字在去掉特殊符号后长度变成0了。; V# B3 }) h& `* l! \5 x$ ]
2. 还有种可能就是有隐藏的回车换行符,导致关键字被判断为空。可以在UltraEdit里先执行一次Unix换行转为DOS换行。然后再检查一下是否存在"</>\r\n\r\n"

该用户从未签到

 楼主| 发表于 2014-1-2 10:14:02 | 显示全部楼层
本帖最后由 fedor 于 2014-1-2 10:19 编辑 ' o: ?8 l" Z- D( M
Oeasy 发表于 2014-1-2 07:28 $ `+ C8 q$ t5 u8 n/ z
丢失的那6个词条也有可能没有真正丢失。把1420条的mdx转为txt,试着全文搜索那6个词条,看看还在不在。 ...
2 d" Z: x& {* g; g& S

& q8 i: o. C$ i$ D2 R5 C' m6 O. y5 x词条是真正的丢失,全文搜索找不到的。4 m" f( \. o  E  x. {  ]
那6个词条没什么特别的,所处位置没有规律。找出这个6个词条并删除后,在转换MDX,还是丢失另外6个词条,而这次丢失的6个原来转换时是没有丢失的。% X" K$ c0 \1 J  F
我又找出我从前制作的词典源文件,词条数是61738,其制作过程、方法与这个是一样的,转换出mdx词条结果显示还是61738,呵呵,就这个小词典出鬼了,搞不定了啊。
) s4 O5 V* v% ?2 _+ o) ~- w, @+ j1 J% Y! @& u1 |1 z
已经求助rayman老大了,将txt源文件发给给他了,希望能够抽时间帮助分析一下。

该用户从未签到

 楼主| 发表于 2014-1-2 10:20:45 | 显示全部楼层
rayman 发表于 2014-1-2 09:20
7 X0 t/ ]. W! Q4 o) p: L5 u1. 试试不要勾选"Strip keyword"。怀疑是有些条目关键字在去掉特殊符号后长度变成0了。
9 Y( I$ A: a' b# k8 E$ N: g6 y" a2. 还有种可能就是 ...
2 }$ B2 [. Q9 _0 Z' d6 Q7 v
搞不定啊老大,已经源文件txt发送给你了,抽时间帮忙看看怎么回事?

该用户从未签到

 楼主| 发表于 2014-1-2 15:13:40 | 显示全部楼层
fedor 发表于 2014-1-2 10:20 $ J, D+ Q) M; i
搞不定啊老大,已经源文件txt发送给你了,抽时间帮忙看看怎么回事?
6 b1 c# R, P# }* E" t4 D
非常感谢raeman老大的热心,及时帮助我解决了问题。已经搞定了。6 h) T& V* P5 [, {$ z. E& Z
非常感谢!!!

该用户从未签到

发表于 2014-1-2 16:07:02 | 显示全部楼层
原因是什么呢?

该用户从未签到

 楼主| 发表于 2014-1-2 18:22:25 | 显示全部楼层
ok927 发表于 2014-1-2 16:07
$ ?6 V& y9 @7 O) N6 d6 l原因是什么呢?
3 E2 S- s% c* S
老大说的第二个原因
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

小黑屋|手机版|Archiver|PDAWIKI |网站地图

GMT+8, 2024-6-17 05:22 , Processed in 0.043833 second(s), 10 queries , MemCache On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表