掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1125|回复: 14

[求助] 关于制作词典时的词条数量问题

[复制链接]

该用户从未签到

发表于 2014-1-1 17:34:45 | 显示全部楼层 |阅读模式
本帖最后由 fedor 于 2014-1-1 21:43 编辑
* E5 m6 r6 E0 U" M) Y  U
3 B3 E7 @$ o8 l3 n0 A; f: S% p2 H各位好,今天做了个词典,发现有个问题,一直没有搞明白。
5 R/ J. e' @( j7 ]0 N5 [  B词典原始数据在Excel表格中,显示的词条数是1426个,用星际译王词典编辑器制作词库显示词条也是为1426个,在文本编辑器中显示为4278个,也是正常的。但用MdxBuilder制作词库时显示的词条数是1420个,为什么缺少一些词条呢?
' E4 o4 {, A: c: H        

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2014-1-1 20:51:16 | 显示全部楼层
你用文本编辑器数一下</>, 这是固定的

该用户从未签到

 楼主| 发表于 2014-1-1 21:35:45 | 显示全部楼层
Hugh 发表于 2014-1-1 20:51
2 M+ }" k& O( Q% D你用文本编辑器数一下, 这是固定的

! c6 b: J" w# i- m" w4 o! v, O# R数过</>的,也是1426个啊

该用户从未签到

发表于 2014-1-1 21:37:35 | 显示全部楼层

, G0 B3 b# @4 \( k" eMdxBuilder给出的词条数目不一定准确,我还遇到过实际几万个,但是报数1个的情况。可以用GoldenDict加载那个mdx看看实际的词条数。

该用户从未签到

 楼主| 发表于 2014-1-1 21:50:47 | 显示全部楼层
Oeasy 发表于 2014-1-1 21:37 / U# h' t6 d3 g/ Q$ I. }) A! p
MdxBuilder给出的词条数目不一定准确,我还遇到过实际几万个,但是报数1个的情况。可以用GoldenDict加载那 ...
8 o# L5 v) V1 ?% J6 P
谢谢回复,用GoldenDic加载了,显示为也是1420个。我制作过好几十部词典了,词条数目都是没问题的,今天头一次遇到,怎么都搞不明白了。
+ B, e; q- y8 @3 I) H7 x( I1 a1 }, ?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2014-1-1 21:59:46 | 显示全部楼层
fedor 发表于 2014-1-1 21:50
2 c: E+ W' e& L谢谢回复,用GoldenDic加载了,显示为也是1420个。我制作过好几十部词典了,词条数目都是没问题的,今天头 ...
" |4 u. Z5 Q9 }* [! ?$ [
6 Y9 \/ A0 X9 F' y+ [( R4 x$ W
你用GetDict.exe把1420条的mdx转为mdx源文件txt,看看</>够不够数。
& v/ m  T/ ]9 p7 ?8 Y. h3 |4 y
( K* I  U! f6 c8 w. c如果从1420条的mdx转出的txt,</>只有1420个了,那就用DoText(https://pdawiki.com/forum/thread-11430-1-1.html)提取这个残mdx源文件的headwords,和最早的1426条的headword list对比下。

该用户从未签到

 楼主| 发表于 2014-1-1 22:59:17 | 显示全部楼层
本帖最后由 fedor 于 2014-1-1 23:31 编辑
: X: @8 r! S3 Z2 G
Oeasy 发表于 2014-1-1 21:59
! @$ D  K+ o: n& S4 r4 y你用GetDict.exe把1420条的mdx转为mdx源文件txt,看看够不够数。, }5 }& u2 G5 D  \
& m  P9 T+ |# q2 }: h" Z
如果从1420条的mdx转出的txt,只有 ...

, b8 r4 [8 V! d4 m
" E! |8 C( W: i1 W% t按你给的方法测试了一下,发现问题了。
2 F# p! H& ~- i" o5 _2 l5 J8 p0 u; c; M源文件的词条数是1426个,这个是绝对没有问题的,但是用MdxBuilder转换后生成mdx文件,再用GetDict.exe将这个mdx文件转成txt,词条数目是1420,之后进行比对,少了6个词条。
& t, {% G4 c  e6 F0 x词条数目确实应该是1426,难道转换器MdxBuilder的问题?为什么转换后会丢失词条呢?; K9 n4 Y6 O. B$ r9 p; o8 d$ F
( p& f% ~, b. Y! t

; y2 B$ C* N" E$ M/ e& e7 v2 t- v/ W: F
我将两个文件进行对比,找出来其中6个缺失的词条,单独将其删除,按道理来说,剩余的词条应该是1420。用MdxBuilder进行转换mdx,又出来了怪事,显示词条为1414个了,用Goldendict加载也是显示1414个了,又是少了6个词条。到底是怎能回事呢?怎么一转换就丢呢?6 B0 g) T2 T) X
4 v- z& s8 a1 D& r( ?, O: W
单独删除的那6个词条,我单独用MdxBuilder进行转mdx,显示结果6个词条,说明源文件都是正常没问题啊。

该用户从未签到

发表于 2014-1-2 00:06:45 | 显示全部楼层
呃  这个 这个  围观一下

该用户从未签到

发表于 2014-1-2 07:28:02 | 显示全部楼层
fedor 发表于 2014-1-1 22:59 ) H' N( A  B4 J" W
按你给的方法测试了一下,发现问题了。# N+ p/ E' ^( p, K  @& {
源文件的词条数是1426个,这个是绝对没有问题的,但是用MdxBui ...
" L7 S0 a  ]2 X8 _. t% L: Y. l
! A" e  q8 p1 R. w* }5 i8 ?/ D
丢失的那6个词条也有可能没有真正丢失。把1420条的mdx转为txt,试着全文搜索那6个词条,看看还在不在。# c8 H3 Q7 T6 B+ K2 q
那6个词条有什么特别的吗?是不是位于源txt的起始位置?
; p; e( t; N, B1 x, ]) A2 \方便的话,可以把你的源文件发上来,让大家(主要是Rayman,他有空的话)到事发现场勘察下,这才能解决潜在的问题。

该用户从未签到

发表于 2014-1-2 09:20:26 | 显示全部楼层
1. 试试不要勾选"Strip keyword"。怀疑是有些条目关键字在去掉特殊符号后长度变成0了。# O+ @- k" K0 X2 x4 I2 u, i9 R! d
2. 还有种可能就是有隐藏的回车换行符,导致关键字被判断为空。可以在UltraEdit里先执行一次Unix换行转为DOS换行。然后再检查一下是否存在"</>\r\n\r\n"

该用户从未签到

 楼主| 发表于 2014-1-2 10:14:02 | 显示全部楼层
本帖最后由 fedor 于 2014-1-2 10:19 编辑
; U' c& Z3 ^6 T3 P3 Q0 N
Oeasy 发表于 2014-1-2 07:28
9 w! R6 ^  L/ S8 x0 z# Q丢失的那6个词条也有可能没有真正丢失。把1420条的mdx转为txt,试着全文搜索那6个词条,看看还在不在。 ...
4 F/ P2 `# j; P( c

) Y+ e' R( J6 h' C词条是真正的丢失,全文搜索找不到的。
/ z8 A! v* [0 ~5 F( b, ^/ [8 q那6个词条没什么特别的,所处位置没有规律。找出这个6个词条并删除后,在转换MDX,还是丢失另外6个词条,而这次丢失的6个原来转换时是没有丢失的。
7 }; m) B0 D; r, Q# Q' s: V我又找出我从前制作的词典源文件,词条数是61738,其制作过程、方法与这个是一样的,转换出mdx词条结果显示还是61738,呵呵,就这个小词典出鬼了,搞不定了啊。& [1 n0 @0 `% {# `5 X
* }3 Z1 Y8 x! |. v* W7 p8 L* A
已经求助rayman老大了,将txt源文件发给给他了,希望能够抽时间帮助分析一下。

该用户从未签到

 楼主| 发表于 2014-1-2 10:20:45 | 显示全部楼层
rayman 发表于 2014-1-2 09:20 + X9 X" n7 w5 ^, c
1. 试试不要勾选"Strip keyword"。怀疑是有些条目关键字在去掉特殊符号后长度变成0了。
& n" Y& G2 |0 |1 Z2. 还有种可能就是 ...
: S3 x+ [$ r. q* S4 c, [
搞不定啊老大,已经源文件txt发送给你了,抽时间帮忙看看怎么回事?

该用户从未签到

 楼主| 发表于 2014-1-2 15:13:40 | 显示全部楼层
fedor 发表于 2014-1-2 10:20 9 T+ P0 f" H$ r" Q* D
搞不定啊老大,已经源文件txt发送给你了,抽时间帮忙看看怎么回事?

/ f7 l! n/ d6 ~3 j. J, K( ?非常感谢raeman老大的热心,及时帮助我解决了问题。已经搞定了。
5 l( h, A* I7 e7 N, H非常感谢!!!

该用户从未签到

发表于 2014-1-2 16:07:02 | 显示全部楼层
原因是什么呢?

该用户从未签到

 楼主| 发表于 2014-1-2 18:22:25 | 显示全部楼层
ok927 发表于 2014-1-2 16:07 : W- G  b( M' ^* p( c
原因是什么呢?

; M6 j! O6 C3 F: W1 a! Z; y# ?! R5 n老大说的第二个原因
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

小黑屋|手机版|Archiver|PDAWIKI |网站地图

GMT+8, 2024-5-18 12:46 , Processed in 0.046790 second(s), 10 queries , MemCache On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表