掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 3319|回复: 12

[求助] [错误] mdxbuilder总是提示:Content is longer then 8388608 at position:...

[复制链接]
  • TA的每日心情
    郁闷
    2019-9-21 08:52
  • 签到天数: 250 天

    [LV.8]以坛为家I

    发表于 2018-11-8 15:35:04 | 显示全部楼层 |阅读模式
    今天尝试排版汉典,结果打包的时候总是提示错误。
    - F  a+ s/ A. D7 I( w. u2 x5 j3 k+ v0 J6 z+ b/ e1 V7 y
    即使是 MdxExport.exe导出的原始txt文件-不修改,仍然提示这个错误,使用的大文件的mdxbuilder版本也是不行。看到这个帖子中提示的类似的错误,但是txt文件中并没有类似的格式错误。。。
    0 I3 D; X  t1 Z, T7 }' @
    ' P) G& m1 D, `2 |5 l( G

    " \* P1 F  E( g( d$ }有没有遇到的呢?
    ' G  ^3 a# g5 R4 L9 Q( I
    4 P6 @9 C0 f1 b; r/ I& Q0 X& r+ x9 \, `8 B
    Begining loading source file...5 R) W$ D: _4 \) S/ l% l* x5 C' |" u
    Content is longer then 8388608 at position: 0 of the source file
    * K* {: B$ G7 T1 R0 ?Failed to load source file, process cancelled2 z8 b3 _! T6 j9 ^
    如下图:
    7 E/ t1 U) I4 d1 A" b7 I0 Z# `% f
    ) `: K  Y4 ~/ {- V- q; N
    3 E$ O! M, p9 z

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    郁闷
    2019-9-21 08:52
  • 签到天数: 250 天

    [LV.8]以坛为家I

     楼主| 发表于 2018-11-8 16:44:59 | 显示全部楼层
    流星冲击 发表于 2018-11-8 16:11
    $ A/ ~  n0 J$ g) V& _提供测试方案:
    2 h5 t' v+ X7 n1 i' P/ O. J) p1 g. w0 V提取:用MdxExport3.5或者python版readMdict生成txt。& l: |7 d6 `3 U/ v# s* y
    写入前:复制原始txt的全文内容到一个新 ...

    ' r- C& K8 A: S8 ^- i9 r厉害,使用MdxExport3.5 打开mdx文件时,就发现问题了。——mdx竟然时用UTF-16压缩的。——平时使用mdxbuilder都是默认选择utf-8。* V  I! o9 J( ^, ^
    ----------------------& E2 v+ K' d/ W* z" d$ C$ W+ k
    另存txt文件为utf-8   ---  搞定!!!+ }* s4 E0 K! q) P
    -----------9 r4 w$ M1 ]* h/ N% J
    谢谢
  • TA的每日心情
    奋斗
    2018-11-10 00:38
  • 签到天数: 346 天

    [LV.8]以坛为家I

    发表于 2018-11-8 15:42:51 | 显示全部楼层
    如果不是源文件格式错误的话,尝试着用低版本的mdxbuilder,最新的好像方方面面的自成一套.原有的拆包打包的都是基于旧版本的mdxbilder
  • TA的每日心情
    慵懒
    2023-1-18 13:13
  • 签到天数: 539 天

    [LV.9]以坛为家II

    发表于 2018-11-8 15:43:13 | 显示全部楼层
    lgmcw有完美的python生成mdx脚本,你找找看他
  • TA的每日心情
    开心
    2019-3-26 21:36
  • 签到天数: 178 天

    [LV.7]常住居民III

    发表于 2018-11-8 16:11:50 | 显示全部楼层
    本帖最后由 流星冲击 于 2018-11-8 16:57 编辑
    4 i5 t( `8 q/ [$ D5 X+ p0 t! n7 n. O: \# H4 p/ R- |- z0 T* M/ |+ D% R
    提供测试方案:
    ! @" n  T0 N- W3 Y5 j提取:用MdxExport3.5或者python版readMdict生成txt。1 A2 M1 l4 V  q# f9 s& }3 a
    写入前:复制原始txt的全文内容到一个新建的空白文件再另存为,最后才写入。这一步是确保编码没问题。: q3 \7 ]8 H/ X* i  M, m( l
    写入:词条自动排序用mdxbuilder 3.0 beta2,词条自定义排序用python版writeMdict。
  • TA的每日心情
    郁闷
    2019-9-21 08:52
  • 签到天数: 250 天

    [LV.8]以坛为家I

     楼主| 发表于 2018-11-8 16:18:27 | 显示全部楼层
    greatszh 发表于 2018-11-8 15:42
    ( S2 h4 _6 M/ ~1 c$ J如果不是源文件格式错误的话,尝试着用低版本的mdxbuilder,最新的好像方方面面的自成一套.原有的拆包打包的 ...
    2 c6 U0 p2 T- l: H% v: k0 C
    尝试了2.1  3.0(含大文件版本)  4.0  版本,都是出错。。。
    - q6 }' g% }9 ~7 U. X1 U, h$ T  D2 S  A& ]5 _0 y
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2018-11-9 01:11:12 | 显示全部楼层
    流星冲击 发表于 2018-11-8 16:113 o9 n+ d) S- {( s3 q
    提供测试方案:* V+ _! r1 [# [# X$ A
    提取:用MdxExport3.5或者python版readMdict生成txt。6 C% ?  ~" ~( l/ `' m5 ^' @
    写入前:复制原始txt的全文内容到一个新 ...
    % Z9 ^+ ^3 \, x
    謝謝流星 兄 總是能及時的指點迷津排憂解難
  • TA的每日心情
    奋斗
    2020-6-15 09:00
  • 签到天数: 34 天

    [LV.5]常住居民I

    发表于 2019-9-19 20:27:04 | 显示全部楼层
    Content is longer then 8388608 at position: 0 of the source file。) o. t2 c& L/ ]7 ?5 C3 R
    我也出现了这个问题,兄弟,你是怎么解决的。
  • TA的每日心情
    无聊
    前天 16:14
  • 签到天数: 1425 天

    [LV.10]以坛为家III

    发表于 2020-6-9 14:33:25 | 显示全部楼层
    删除空格
    9 e( Z( _, }( Q. D3 i& sEmeditor:
    ! g+ b. \: @5 K0 H& v; P. r* d  A0 X2 B8 l4 K
    •Default Menu: Edit > Convert Selection > Remove Empty Lines
  • TA的每日心情
    郁闷
    2022-11-17 14:05
  • 签到天数: 58 天

    [LV.5]常住居民I

    发表于 2021-4-6 21:52:41 | 显示全部楼层
    我今天也碰到这个问题了,原因是词条内容行太长,最长的词条内容行有190万字节长,后来把词条内容行长缩到40多万字节以下就可以转了

    该用户从未签到

    发表于 2022-8-28 17:05:30 | 显示全部楼层
    wyzh97 发表于 2018-11-8 16:44' ]8 D9 p8 p; u5 w
    厉害,使用MdxExport3.5 打开mdx文件时,就发现问题了。——mdx竟然时用UTF-16压缩的。——平时使用mdxbu ...
    ( ^# v, n% l# ~& G1 F8 f
    我也遇到到了这个问题,虽然你的问题和我的不一样,但还是受到了启发,多谢!我出这个问题是因为文件不是Windows CR LF换行,不知道为什么存成了Unix形式的换行

    该用户从未签到

    发表于 2025-1-29 11:14:39 | 显示全部楼层
    MdxBuilder 中编码设成 UTF-16(Unicode),就能顺利把《汉典》从txt变成mdx$ _; g/ x9 g/ D% G( @
    https://www.cnblogs.com/fnlingnzb-learner/p/6163205.html

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2025-1-29 11:22:09 | 显示全部楼层
    wyzh97 发表于 2018-11-8 16:44* q  ]* t$ R6 I5 }& G
    厉害,使用MdxExport3.5 打开mdx文件时,就发现问题了。——mdx竟然时用UTF-16压缩的。——平时使用mdxbu ...
    3 _. d, i$ ^5 O: R' N5 ?
    在MdxBuilder 中编码设成 UTF-16(Unicode) 错误就没有了  g% i6 p& o5 d4 t; h* {
    https://www.cnblogs.com/fnlingnzb-learner/p/6163205.html4 {8 q; ^; _8 y
    ……
      F# Z# ?4 x3 [5 ?反过来 UTF-8 也不完美,也存在一些问题:% @0 x( h; s6 q5 n0 n
    文化上的不平衡——对于欧美地区一些以英语为母语的国家 UTF-8 简直是太棒了,因为它和 ASCII 一样,一个字符只占一个字节,没有任何额外的存储负担;但是对于中日韩等国家来说,UTF-8 实在是太冗余,一个字符竟然要占用 3多个字节,存储和传输的效率不但没有提升,反而下降了。所以欧美人民常常毫不犹豫的采用 UTF-8,而我们却老是要犹豫一会儿……) B3 {6 c: y/ Y9 U3 M% @1 I
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-8 03:51 , Processed in 0.022363 second(s), 23 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表