掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 3298|回复: 12

[求助] [错误] mdxbuilder总是提示:Content is longer then 8388608 at position:...

[复制链接]
  • TA的每日心情
    郁闷
    2019-9-21 08:52
  • 签到天数: 250 天

    [LV.8]以坛为家I

    发表于 2018-11-8 15:35:04 | 显示全部楼层 |阅读模式
    今天尝试排版汉典,结果打包的时候总是提示错误。$ N" _+ S. b, e2 K$ ~% e2 S
    & L* e/ Y+ S3 N# P
    即使是 MdxExport.exe导出的原始txt文件-不修改,仍然提示这个错误,使用的大文件的mdxbuilder版本也是不行。看到这个帖子中提示的类似的错误,但是txt文件中并没有类似的格式错误。。。
    % p! D# Q# P9 s$ `
    6 Z7 M, ]4 E6 G* c+ r
    - M5 d+ s% y' J2 o; `" T4 N
    有没有遇到的呢?  B# J: i3 z( m8 v) L
    3 V! o7 y* `9 e& z; f  \& D
    1 `- y; Y2 @' j  F
    Begining loading source file...0 Q8 r' R3 g& k
    Content is longer then 8388608 at position: 0 of the source file, c% O: ~+ A4 z! P+ W/ E6 Y
    Failed to load source file, process cancelled, R' w3 |% ?2 s
    如下图:
    " e: G" C& }2 [0 U' o# |) s! D1 M  I( ^+ s# b& b

    0 R* g7 ?; M* Y- n7 `6 q1 K6 L1 e  u  P3 N4 T7 c& c" x. W) q) J4 F

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    郁闷
    2019-9-21 08:52
  • 签到天数: 250 天

    [LV.8]以坛为家I

     楼主| 发表于 2018-11-8 16:44:59 | 显示全部楼层
    流星冲击 发表于 2018-11-8 16:11
    ) V6 f- w' ]1 H- b4 R" ?提供测试方案:* o! G% K- ]$ U
    提取:用MdxExport3.5或者python版readMdict生成txt。
    6 g9 A6 H6 d" y, p& D: j写入前:复制原始txt的全文内容到一个新 ...

    ! X/ k  e! f: {# h) J% R, g1 V; h+ G厉害,使用MdxExport3.5 打开mdx文件时,就发现问题了。——mdx竟然时用UTF-16压缩的。——平时使用mdxbuilder都是默认选择utf-8。
    6 Z8 F* s7 V. ?% a/ l----------------------
    2 \* ]/ Z5 P* f! ~3 X/ U3 ]) ]另存txt文件为utf-8   ---  搞定!!!; \1 E* d: q. N8 A) p# X$ H* [
    -----------
    ' w* @: E$ ]7 I) g% m6 B! E+ m谢谢
  • TA的每日心情
    奋斗
    2018-11-10 00:38
  • 签到天数: 346 天

    [LV.8]以坛为家I

    发表于 2018-11-8 15:42:51 | 显示全部楼层
    如果不是源文件格式错误的话,尝试着用低版本的mdxbuilder,最新的好像方方面面的自成一套.原有的拆包打包的都是基于旧版本的mdxbilder
  • TA的每日心情
    慵懒
    2023-1-18 13:13
  • 签到天数: 539 天

    [LV.9]以坛为家II

    发表于 2018-11-8 15:43:13 | 显示全部楼层
    lgmcw有完美的python生成mdx脚本,你找找看他
  • TA的每日心情
    开心
    2019-3-26 21:36
  • 签到天数: 178 天

    [LV.7]常住居民III

    发表于 2018-11-8 16:11:50 | 显示全部楼层
    本帖最后由 流星冲击 于 2018-11-8 16:57 编辑
    3 K) Z5 v1 M. m, [: l1 O2 ~
    6 j4 x9 }  t; R0 {0 U/ D提供测试方案:
    ( c9 d" U$ S7 }1 T提取:用MdxExport3.5或者python版readMdict生成txt。) i3 z  E& w+ D7 a6 H
    写入前:复制原始txt的全文内容到一个新建的空白文件再另存为,最后才写入。这一步是确保编码没问题。
    , H+ H  l# g* q- P4 M0 E: P) l6 e写入:词条自动排序用mdxbuilder 3.0 beta2,词条自定义排序用python版writeMdict。
  • TA的每日心情
    郁闷
    2019-9-21 08:52
  • 签到天数: 250 天

    [LV.8]以坛为家I

     楼主| 发表于 2018-11-8 16:18:27 | 显示全部楼层
    greatszh 发表于 2018-11-8 15:423 d& s% S9 S* H$ f. ~' z: h
    如果不是源文件格式错误的话,尝试着用低版本的mdxbuilder,最新的好像方方面面的自成一套.原有的拆包打包的 ...
    , j! Z( t/ L& Y: r& G3 m, C: z
    尝试了2.1  3.0(含大文件版本)  4.0  版本,都是出错。。。
    5 k! c, a7 ]) v0 |, D: {( L6 k$ T5 o0 R+ ~
    ) K  G) ^" c1 K+ G
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2018-11-9 01:11:12 | 显示全部楼层
    流星冲击 发表于 2018-11-8 16:11: Q/ p' t: Z" |5 a8 i. b) M
    提供测试方案:; `# V3 G2 v2 K5 ^7 B! r. Y
    提取:用MdxExport3.5或者python版readMdict生成txt。
    ' b5 k7 e) E0 Y: N写入前:复制原始txt的全文内容到一个新 ...
    " b- {  N2 i6 ]) `% K% f
    謝謝流星 兄 總是能及時的指點迷津排憂解難
  • TA的每日心情
    奋斗
    2020-6-15 09:00
  • 签到天数: 34 天

    [LV.5]常住居民I

    发表于 2019-9-19 20:27:04 | 显示全部楼层
    Content is longer then 8388608 at position: 0 of the source file。/ d( f$ w2 [. H3 T2 p
    我也出现了这个问题,兄弟,你是怎么解决的。
  • TA的每日心情

    昨天 02:38
  • 签到天数: 1423 天

    [LV.10]以坛为家III

    发表于 2020-6-9 14:33:25 | 显示全部楼层
    删除空格
    & N) s, N2 I6 [; U1 D1 FEmeditor:- \% s3 k9 h( K  i+ g

    ( y! a* v) f6 j) N) [! M6 t
    •Default Menu: Edit > Convert Selection > Remove Empty Lines
  • TA的每日心情
    郁闷
    2022-11-17 14:05
  • 签到天数: 58 天

    [LV.5]常住居民I

    发表于 2021-4-6 21:52:41 | 显示全部楼层
    我今天也碰到这个问题了,原因是词条内容行太长,最长的词条内容行有190万字节长,后来把词条内容行长缩到40多万字节以下就可以转了

    该用户从未签到

    发表于 2022-8-28 17:05:30 | 显示全部楼层
    wyzh97 发表于 2018-11-8 16:44
    * B5 O# E) Z+ R; c厉害,使用MdxExport3.5 打开mdx文件时,就发现问题了。——mdx竟然时用UTF-16压缩的。——平时使用mdxbu ...

    4 P: q3 Z) l, p我也遇到到了这个问题,虽然你的问题和我的不一样,但还是受到了启发,多谢!我出这个问题是因为文件不是Windows CR LF换行,不知道为什么存成了Unix形式的换行

    该用户从未签到

    发表于 2025-1-29 11:14:39 | 显示全部楼层
    MdxBuilder 中编码设成 UTF-16(Unicode),就能顺利把《汉典》从txt变成mdx
      a. J, q5 K7 Ahttps://www.cnblogs.com/fnlingnzb-learner/p/6163205.html

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2025-1-29 11:22:09 | 显示全部楼层
    wyzh97 发表于 2018-11-8 16:44
      T3 U# v0 t7 ^7 U厉害,使用MdxExport3.5 打开mdx文件时,就发现问题了。——mdx竟然时用UTF-16压缩的。——平时使用mdxbu ...
    7 Q" N& L$ }) y0 C/ R% u
    在MdxBuilder 中编码设成 UTF-16(Unicode) 错误就没有了, P* ]" N+ z; `, E: I+ k
    https://www.cnblogs.com/fnlingnzb-learner/p/6163205.html5 F" j8 ~6 u7 t1 {. s
    ……
    9 X, i" ~4 a  V* I* ]/ {0 K反过来 UTF-8 也不完美,也存在一些问题:
    8 Z1 H  F# R0 v( m文化上的不平衡——对于欧美地区一些以英语为母语的国家 UTF-8 简直是太棒了,因为它和 ASCII 一样,一个字符只占一个字节,没有任何额外的存储负担;但是对于中日韩等国家来说,UTF-8 实在是太冗余,一个字符竟然要占用 3多个字节,存储和传输的效率不但没有提升,反而下降了。所以欧美人民常常毫不犹豫的采用 UTF-8,而我们却老是要犹豫一会儿……
    # \  \, b- K0 K, _0 ]; c
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-3 10:22 , Processed in 0.022057 second(s), 23 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表