掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1121|回复: 14

[求助] 关于制作词典时的词条数量问题

[复制链接]

该用户从未签到

发表于 2014-1-1 17:34:45 | 显示全部楼层 |阅读模式
本帖最后由 fedor 于 2014-1-1 21:43 编辑
' l7 D; b3 z. a0 e/ I# O2 p1 U
3 S3 r9 k* D, `5 i+ }8 P各位好,今天做了个词典,发现有个问题,一直没有搞明白。
& m$ t9 d7 o& h, Y词典原始数据在Excel表格中,显示的词条数是1426个,用星际译王词典编辑器制作词库显示词条也是为1426个,在文本编辑器中显示为4278个,也是正常的。但用MdxBuilder制作词库时显示的词条数是1420个,为什么缺少一些词条呢?) e5 x4 o+ r$ U7 u' N" @7 b9 O, J" i
        

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2014-1-1 20:51:16 | 显示全部楼层
你用文本编辑器数一下</>, 这是固定的

该用户从未签到

 楼主| 发表于 2014-1-1 21:35:45 | 显示全部楼层
Hugh 发表于 2014-1-1 20:51
8 _/ B. o9 D. v- f你用文本编辑器数一下, 这是固定的
, X5 B# W. W% K" E6 ^# t
数过</>的,也是1426个啊

该用户从未签到

发表于 2014-1-1 21:37:35 | 显示全部楼层
) k* _. V& p6 `# p  I& U
MdxBuilder给出的词条数目不一定准确,我还遇到过实际几万个,但是报数1个的情况。可以用GoldenDict加载那个mdx看看实际的词条数。

该用户从未签到

 楼主| 发表于 2014-1-1 21:50:47 | 显示全部楼层
Oeasy 发表于 2014-1-1 21:37 7 `3 j- \3 F0 G+ \7 Z6 n
MdxBuilder给出的词条数目不一定准确,我还遇到过实际几万个,但是报数1个的情况。可以用GoldenDict加载那 ...
2 C9 h, z# r7 o3 u, [7 R
谢谢回复,用GoldenDic加载了,显示为也是1420个。我制作过好几十部词典了,词条数目都是没问题的,今天头一次遇到,怎么都搞不明白了。
6 W( O, k- z" M+ @6 f6 f

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2014-1-1 21:59:46 | 显示全部楼层
fedor 发表于 2014-1-1 21:50 % X/ R& d2 i5 d2 s
谢谢回复,用GoldenDic加载了,显示为也是1420个。我制作过好几十部词典了,词条数目都是没问题的,今天头 ...

: `# y9 T. ]2 _8 P. A, D, H! K* k2 ^0 o8 w
你用GetDict.exe把1420条的mdx转为mdx源文件txt,看看</>够不够数。0 S$ b/ R3 m& [- U6 [3 ?
( r& `# U8 b( d
如果从1420条的mdx转出的txt,</>只有1420个了,那就用DoText(https://pdawiki.com/forum/thread-11430-1-1.html)提取这个残mdx源文件的headwords,和最早的1426条的headword list对比下。

该用户从未签到

 楼主| 发表于 2014-1-1 22:59:17 | 显示全部楼层
本帖最后由 fedor 于 2014-1-1 23:31 编辑 # Z% M9 B4 B6 d/ }: ^: o/ R
Oeasy 发表于 2014-1-1 21:59
0 T+ r: m7 _) D: {你用GetDict.exe把1420条的mdx转为mdx源文件txt,看看够不够数。
( O0 f/ }) z2 O2 a' T7 [7 t; {/ |/ J+ p
如果从1420条的mdx转出的txt,只有 ...

( W3 }& \; r: b2 F4 j, C' _
$ T) I3 k4 Y. Y按你给的方法测试了一下,发现问题了。
- O% v$ h. O& |# P2 m1 k源文件的词条数是1426个,这个是绝对没有问题的,但是用MdxBuilder转换后生成mdx文件,再用GetDict.exe将这个mdx文件转成txt,词条数目是1420,之后进行比对,少了6个词条。
% q" h* g# ?, d6 `词条数目确实应该是1426,难道转换器MdxBuilder的问题?为什么转换后会丢失词条呢?
5 W! y( V4 T# l' B0 Z' g; ?. I7 m. j1 V) F8 E
* I/ D* z0 j0 n. [
( v, ]2 P' ?! d7 h$ h
我将两个文件进行对比,找出来其中6个缺失的词条,单独将其删除,按道理来说,剩余的词条应该是1420。用MdxBuilder进行转换mdx,又出来了怪事,显示词条为1414个了,用Goldendict加载也是显示1414个了,又是少了6个词条。到底是怎能回事呢?怎么一转换就丢呢?
: y- ~0 d, h7 ~3 e; X/ _! K/ I
单独删除的那6个词条,我单独用MdxBuilder进行转mdx,显示结果6个词条,说明源文件都是正常没问题啊。

该用户从未签到

发表于 2014-1-2 00:06:45 | 显示全部楼层
呃  这个 这个  围观一下

该用户从未签到

发表于 2014-1-2 07:28:02 | 显示全部楼层
fedor 发表于 2014-1-1 22:59
* K4 I( ?3 S; }9 h按你给的方法测试了一下,发现问题了。
; k: q; P! j. w2 R源文件的词条数是1426个,这个是绝对没有问题的,但是用MdxBui ...
- f$ l* B0 I2 I3 [

" a0 \, k7 h7 u& c0 U9 O6 X丢失的那6个词条也有可能没有真正丢失。把1420条的mdx转为txt,试着全文搜索那6个词条,看看还在不在。1 b' l) u9 N! I# _9 |5 U
那6个词条有什么特别的吗?是不是位于源txt的起始位置?
, ?- x8 M& Y0 {! _' i方便的话,可以把你的源文件发上来,让大家(主要是Rayman,他有空的话)到事发现场勘察下,这才能解决潜在的问题。

该用户从未签到

发表于 2014-1-2 09:20:26 | 显示全部楼层
1. 试试不要勾选"Strip keyword"。怀疑是有些条目关键字在去掉特殊符号后长度变成0了。
+ W5 F0 E  b( f; M2. 还有种可能就是有隐藏的回车换行符,导致关键字被判断为空。可以在UltraEdit里先执行一次Unix换行转为DOS换行。然后再检查一下是否存在"</>\r\n\r\n"

该用户从未签到

 楼主| 发表于 2014-1-2 10:14:02 | 显示全部楼层
本帖最后由 fedor 于 2014-1-2 10:19 编辑 7 w, D& g% L$ f9 \! F
Oeasy 发表于 2014-1-2 07:28
  e+ q' e* b" V8 B. p# n# \0 i" \丢失的那6个词条也有可能没有真正丢失。把1420条的mdx转为txt,试着全文搜索那6个词条,看看还在不在。 ...

3 h7 g  Q" v: c/ X& e7 b8 M
$ u7 Q# t1 m" i词条是真正的丢失,全文搜索找不到的。
- W, ]( a! y4 y9 v/ d) I0 X* K* l那6个词条没什么特别的,所处位置没有规律。找出这个6个词条并删除后,在转换MDX,还是丢失另外6个词条,而这次丢失的6个原来转换时是没有丢失的。- i% G. g. {* Y9 Z9 \4 z2 @( U3 {
我又找出我从前制作的词典源文件,词条数是61738,其制作过程、方法与这个是一样的,转换出mdx词条结果显示还是61738,呵呵,就这个小词典出鬼了,搞不定了啊。
. F5 a2 P" H  k) {* B" E# ]1 D! X0 [- d- r: d
已经求助rayman老大了,将txt源文件发给给他了,希望能够抽时间帮助分析一下。

该用户从未签到

 楼主| 发表于 2014-1-2 10:20:45 | 显示全部楼层
rayman 发表于 2014-1-2 09:20 ; {( R& }1 z5 y. S: G) M
1. 试试不要勾选"Strip keyword"。怀疑是有些条目关键字在去掉特殊符号后长度变成0了。+ O) W7 [. t3 K) v* a0 a
2. 还有种可能就是 ...
8 ]+ V2 }/ U) b9 m: w
搞不定啊老大,已经源文件txt发送给你了,抽时间帮忙看看怎么回事?

该用户从未签到

 楼主| 发表于 2014-1-2 15:13:40 | 显示全部楼层
fedor 发表于 2014-1-2 10:20
1 T5 t+ C% ]; k4 [8 a9 o搞不定啊老大,已经源文件txt发送给你了,抽时间帮忙看看怎么回事?
7 e+ i5 n' ^. q3 @) n
非常感谢raeman老大的热心,及时帮助我解决了问题。已经搞定了。
& U, B! r4 G- y7 ?' Y9 o' w非常感谢!!!

该用户从未签到

发表于 2014-1-2 16:07:02 | 显示全部楼层
原因是什么呢?

该用户从未签到

 楼主| 发表于 2014-1-2 18:22:25 | 显示全部楼层
ok927 发表于 2014-1-2 16:07   }! M) t( T1 V* a* F, ?: A6 F& j9 h
原因是什么呢?

& m9 V9 y8 a: N( ^; P6 t老大说的第二个原因
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

小黑屋|手机版|Archiver|PDAWIKI |网站地图

GMT+8, 2024-5-2 12:41 , Processed in 0.080902 second(s), 10 queries , MemCache On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表