掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

123
返回列表 发新帖
楼主: tsiank

[工具] (20220909更新)图片版mdx源文件生成工具

[复制链接]
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    发表于 2019-11-24 17:30:08 | 显示全部楼层
    请教:所生成的txt中,有部分并非标准的html标签,这样不会有问题?
  • TA的每日心情
    开心
    2019-6-28 11:53
  • 签到天数: 28 天

    [LV.4]偶尔看看III

    发表于 2019-12-7 22:02:11 | 显示全部楼层
    請問能增加一個欄位放mp3嗎?有些圖解字典有附音頻,希望能更方便製作發音的圖片字典,謝謝~~, |! L& y8 b# d& v- e
  • TA的每日心情
    无聊
    2024-2-29 22:50
  • 签到天数: 221 天

    [LV.7]常住居民III

    发表于 2019-12-10 18:27:53 | 显示全部楼层
    这个工具还是要用户手动输入词条的。请问我可以用什么其他工具辅助,把扫描版pdf中的词条提取出来?
  • TA的每日心情
    无聊
    2023-2-17 11:35
  • 签到天数: 284 天

    [LV.8]以坛为家I

    发表于 2020-4-4 12:45:45 | 显示全部楼层
    本帖最后由 lwx228 于 2020-4-4 14:48 编辑 ) Y5 \+ Y( ]+ m2 _
    ljrdxs 发表于 2019-12-10 18:27
    8 Z3 G5 g! H; y) q这个工具还是要用户手动输入词条的。请问我可以用什么其他工具辅助,把扫描版pdf中的词条提取出来? ...
    " m5 e9 ]% e/ O0 S: P6 s
    如果书籍排版有规律的、( [3 R8 ~  ?$ @$ Z; o1 X
    用ABBYY就能自动提取符合它算法的& Z, ?4 b) u7 S6 L
    例如完全自动生成的" N$ q6 I' W+ L1 o  {& Y: W6 H

    ' ?' C1 n, F6 m

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    无聊
    2024-2-29 22:50
  • 签到天数: 221 天

    [LV.7]常住居民III

    发表于 2020-4-4 15:35:52 | 显示全部楼层
    lwx228 发表于 2020-4-4 12:45
    ' p7 z2 }3 V4 o) [如果书籍排版有规律的、
    ' n0 d. B5 m+ J/ O用ABBYY就能自动提取符合它算法的
    % \$ Q2 ?% x( }- T. s* m例如完全自动生成的
    0 k3 S9 ?9 J2 F1 m
    这个要求pdf不是扫描版而是文字版吧?
  • TA的每日心情
    无聊
    2023-2-17 11:35
  • 签到天数: 284 天

    [LV.8]以坛为家I

    发表于 2020-4-4 16:11:31 | 显示全部楼层
    ljrdxs 发表于 2020-4-4 15:35& z& @. S- O: w" s4 K
    这个要求pdf不是扫描版而是文字版吧?

    1 x4 ~' a! A6 F$ F5 x5 B1 s- _看来你是没用过ABBYY的、试试吧
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2021-2-7 02:36:59 | 显示全部楼层
    本帖最后由 喬治兄 于 2021-2-7 02:41 编辑 3 i+ k- O  [* `6 w1 C5 ~9 @2 z

    . s- R2 N* t! }$ Vtsiank 兄:
    7 S! R# i, {) s, B新的版本 VBA 一打開就有錯誤訊息, W/ T, J; F; M; l
    是否只能於 Excel 2010 以上才能使用
    ! ?% I. ?! t2 Y% U( UExcel 2007 錯誤訊息如下 :4 {  [! U4 b0 B8 g
    6 l% U. ]+ u% ?# ]
    編譯錯誤:+ k8 D: F: N5 E' K" }  r! R% G
    必須是: :Sub 或 Function
    ; k3 \6 F0 u  h- j( n
    ( Y) d7 }( ]9 Z" y0 L% z" x<a href="https://sm.ms/image/5C4TocHRB6x2OXF" target="_blank"><img src="https://i.loli.net/2021/02/07/5C4TocHRB6x2OXF.png" ></a>
    5 S6 A& y8 S) O& g, C0 @: o' _% Y( ?
    https://sm.ms/image/5C4TocHRB6x2OXF1 _6 K" _- `& X5 K8 j% h: T
    " c2 X& N9 C$ t# k

    该用户从未签到

     楼主| 发表于 2021-2-9 20:46:06 | 显示全部楼层
    喬治兄 发表于 2021-2-7 02:36
    ' X, U/ u: b- |0 ptsiank 兄:; K8 ?7 e# }5 ]8 G( v7 T
    新的版本 VBA 一打開就有錯誤訊息% l2 ?. d; K* `' ]
    是否只能於 Excel 2010 以上才能使用
    " W- ?' [/ M. e  p/ w; y/ y0 b' r
    你的excel版本是32位的吧?请从原贴下载0209版试试:https://www.pdawiki.com/forum/fo ... id=33574&extra=
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2021-2-10 07:16:27 | 显示全部楼层
    tsiank 发表于 2021-2-9 20:46
    ' H# R/ a8 |7 }' T3 s- _( u+ I你的excel版本是32位的吧?请从原贴下载0209版试试:https://www.pdawiki.com/forum/forum.php?mod=viewt ...
    " }+ Z% p9 d' K6 O: i* h
    Tsiank 兄,謝謝您,你說的沒錯,確實是32位元,已跑出來了,大概理解你的想法,我猜你是否想把輸入變的處理更簡易,就是每欄的首字和尾字......,是有點過於簡化, l! c9 r! V( ]) d! K; }8 W1 ?
    有些粗略定位的想法,不知是否可行* q" ?6 Y$ `  R  @
    過完年,若是有想到較好的架構再請仁兄看看可否自動化

    该用户从未签到

     楼主| 发表于 2021-2-10 07:29:16 | 显示全部楼层
    喬治兄 发表于 2021-2-10 07:16
    ' \5 W, t. l, E& B, r+ g5 M" hTsiank 兄,謝謝您,你說的沒錯,確實是32位元,已跑出來了,大概理解你的想法,我猜你是否想把輸入變的 ...

    ( f/ p; F  B3 Y6 h$ z是全部字头呀,并不是首字尾字,上面的只是例子
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2021-2-10 07:34:34 | 显示全部楼层
    本帖最后由 喬治兄 于 2021-2-10 08:33 编辑 # E5 L5 e- _' Q1 m: @
    tsiank 发表于 2021-2-10 07:29  I. W! U5 O3 N
    是全部字头呀,并不是首字尾字,上面的只是例子

    ) s; s& a- |8 A; r& c4 L4 g6 ~4 t. l- W5 q
    嗯嗯,好的,理解了!,謝謝您) ~& O" q& o) G5 A" d9 _
    7 F8 l: g2 d! r
    [求助] 請賜教 css & html
    2 t1 d( v$ a4 T. Bhttps://www.pdawiki.com/forum/fo ... id=42901&extra=6 k. k7 `; k' K
    4 s& {& y; O; |3 c4 a$ e  e
    目前想到的一個模型,但感覺,不太完善,或許還有其它更好的方法的排版來配合計算出來的位置順便粗略定位,等過完年再來思考看看
    : R0 K0 o- e5 N- R0 e$ m( Z, j! C2 O0 D8 S' Q9 ^  Z
    <div style="background-color:lightblue;width:93vw;">B</div>. D2 \4 o6 H: F8 T
    2 M9 D+ ~6 w' Z' h% r0 ?  E  K' D- {
    B==><img class="pic" src="xxx.png">, _# P+ Q, p, ~6 n8 h. @) q0 n
  • TA的每日心情
    无聊
    2022-7-21 15:56
  • 签到天数: 216 天

    [LV.7]常住居民III

    发表于 2021-2-10 13:39:44 | 显示全部楼层
    本帖最后由 wjl 于 2021-2-10 13:44 编辑
    2 M  D5 U, ?* j9 r8 \0 ?: h
    ; E0 P) m2 l8 P  N# o# z新版能够出结果了,不过似乎仍未处理图片文件名中的栏位编号问题。分栏切分图片的文件名一般是前缀+分隔符+页码+分隔符+栏号+扩展名(如YY_0001.1.png,YY_0001-1.png等)
    ) Q) |7 s# C1 I3 q9 m4 g( b4 B9 d! g8 L3 K
    词头        页码(按顺序排列)        栏位(可以不填写)
    ! z7 u% v  A/ G# L阿那贝律        1        1) h. G0 v7 o& X
    暗典        1        12 J! b0 R4 q& a* e
    暗韵        1        1' A6 F% Z5 P- s& t3 U, f- M$ ^
    按断副词        1        2
    1 K9 G7 y( ?+ n( {% j+ [/ R
    按断句        1        2$ }2 X& ^- z7 u" Z" N9 P
    按断式        2        16 e; b3 ?# `3 X$ b+ D0 a, U
    按断语气        2        22 |% C4 f" w5 T- W
    按断助词        2        2  S& L8 Y2 W; y& _
    9 n) k% N5 v, a, |* B4 E

    3 q" O" j5 h7 `1 x: W, K! A暗韵/ P  G. e. L: b. k
    <link rel="stylesheet" type="text/css" href="YY.css"/><pagetitle><a class="goto" href="entry://YY_0001"><mark>0001</mark></a><pggap> </pggap><a class="goto" href="entry://YY_0002">0002</a><pggap> </pggap><a class="goto" href="entry://YY_0003">0003</a><pggap> </pggap><a class="goto" href="entry://YY_0004">0004</a><pggap> </pggap><a class="goto" href="entry://YY_0005">0005</a><pggap> </pggap><a class="goto" href="entry://YY_0006">0006</a><pggap> </pggap><a class="goto" href="entry://YY_0007">0007</a><pggap> </pggap><a class="goto" href="entry://YY_0008">0008</a><pggap> </pggap><a class="goto" href="entry://YY_0009">0009</a><pggap> </pggap><a class="goto" href="entry://YY_0010">0010</a></pagetitle><hwlt><colm><a href="entry://阿那贝律">阿那贝律</a>  , <a href="entry://暗典">暗典</a>  , <a href="entry://暗韵"><mark2>暗韵</mark2></a> </colm> <colgap> </colgap> <colm2><a href="entry://按断副词">按断副词</a>  , <a href="entry://按断句">按断句</a> </colm2></hwlt><img class="pic" src="YY_0001.1.png"><pagetitle><a class="goto" href="entry://YY_0001"><mark>0001</mark></a><pggap> </pggap><a class="goto" href="entry://YY_0002">0002</a><pggap> </pggap><a class="goto" href="entry://YY_0003">0003</a><pggap> </pggap><a class="goto" href="entry://YY_0004">0004</a><pggap> </pggap><a class="goto" href="entry://YY_0005">0005</a><pggap> </pggap><a class="goto" href="entry://YY_0006">0006</a><pggap> </pggap><a class="goto" href="entry://YY_0007">0007</a><pggap> </pggap><a class="goto" href="entry://YY_0008">0008</a><pggap> </pggap><a class="goto" href="entry://YY_0009">0009</a><pggap> </pggap><a class="goto" href="entry://YY_0010">0010</a></pagetitle>
    8 y' m& z2 V4 K, o" z  W</>& q! L+ n5 c! R: e4 B
    按断副词9 A# D0 H$ Z" W. k" {" D3 }$ F
    <link rel="stylesheet" type="text/css" href="YY.css"/><pagetitle><a class="goto" href="entry://YY_0001"><mark>0001</mark></a><pggap> </pggap><a class="goto" href="entry://YY_0002">0002</a><pggap> </pggap><a class="goto" href="entry://YY_0003">0003</a><pggap> </pggap><a class="goto" href="entry://YY_0004">0004</a><pggap> </pggap><a class="goto" href="entry://YY_0005">0005</a><pggap> </pggap><a class="goto" href="entry://YY_0006">0006</a><pggap> </pggap><a class="goto" href="entry://YY_0007">0007</a><pggap> </pggap><a class="goto" href="entry://YY_0008">0008</a><pggap> </pggap><a class="goto" href="entry://YY_0009">0009</a><pggap> </pggap><a class="goto" href="entry://YY_0010">0010</a></pagetitle><hwlt><colm><a href="entry://阿那贝律">阿那贝律</a>  , <a href="entry://暗典">暗典</a>  , <a href="entry://暗韵">暗韵</a> </colm> <colgap> </colgap> <colm2><a href="entry://按断副词"><mark2>按断副词</mark2></a>  , <a href="entry://按断句">按断句</a> </colm2></hwlt><img class="pic" src="YY_0001.1.png"><pagetitle><a class="goto" href="entry://YY_0001"><mark>0001</mark></a><pggap> </pggap><a class="goto" href="entry://YY_0002">0002</a><pggap> </pggap><a class="goto" href="entry://YY_0003">0003</a><pggap> </pggap><a class="goto" href="entry://YY_0004">0004</a><pggap> </pggap><a class="goto" href="entry://YY_0005">0005</a><pggap> </pggap><a class="goto" href="entry://YY_0006">0006</a><pggap> </pggap><a class="goto" href="entry://YY_0007">0007</a><pggap> </pggap><a class="goto" href="entry://YY_0008">0008</a><pggap> </pggap><a class="goto" href="entry://YY_0009">0009</a><pggap> </pggap><a class="goto" href="entry://YY_0010">0010</a></pagetitle>
    ! x: X) v8 \  g
    3 B" H* S- X9 A; V. ?9 N4 L5 y页码只链接了一张图片,不知道是不是应该将多张(栏位数)图片水平并排显示出来,跟实际页面类似
    . i3 k* a3 ~1 d0 e. Z* t# I
    : S. X! w& C3 f! [0 @YY_0733
    1 v( N  Y: S. @2 x<link rel="stylesheet" type="text/css" href="YY.css"/><pagetitle><a class="goto" href="entry://YY_0724">0724</a><pggap> </pggap><a class="goto" href="entry://YY_0725">0725</a><pggap> </pggap><a class="goto" href="entry://YY_0726">0726</a><pggap> </pggap><a class="goto" href="entry://YY_0727">0727</a><pggap> </pggap><a class="goto" href="entry://YY_0728">0728</a><pggap> </pggap><a class="goto" href="entry://YY_0729">0729</a><pggap> </pggap><a class="goto" href="entry://YY_0730">0730</a><pggap> </pggap><a class="goto" href="entry://YY_0731">0731</a><pggap> </pggap><a class="goto" href="entry://YY_0732">0732</a><pggap> </pggap><a class="goto" href="entry://YY_0733"><mark>0733</mark></a></pagetitle><hwlt><colm><a href="entry://组合"><mark2>组合</mark2></a>  , <a href="entry://组合词">组合词</a>  , <a href="entry://组合能力">组合能力</a>  , <a href="entry://组合式">组合式</a> </colm> <colgap> </colgap> <colm2><a href="entry://组合性记号">组合性记号</a>  , <a href="entry://纂集派">纂集派</a>  , <a href="entry://尊称">尊称</a> </colm2></hwlt><img class="pic" src="YY_0733.1.png"><pagetitle><a class="goto" href="entry://YY_0724">0724</a><pggap> </pggap><a class="goto" href="entry://YY_0725">0725</a><pggap> </pggap><a class="goto" href="entry://YY_0726">0726</a><pggap> </pggap><a class="goto" href="entry://YY_0727">0727</a><pggap> </pggap><a class="goto" href="entry://YY_0728">0728</a><pggap> </pggap><a class="goto" href="entry://YY_0729">0729</a><pggap> </pggap><a class="goto" href="entry://YY_0730">0730</a><pggap> </pggap><a class="goto" href="entry://YY_0731">0731</a><pggap> </pggap><a class="goto" href="entry://YY_0732">0732</a><pggap> </pggap><a class="goto" href="entry://YY_0733"><mark>0733</mark></a></pagetitle>8 W! `; z4 I* U3 x
    </>! R% l& E/ e) ^1 f2 |

    ( U) B3 i* ]/ x# E) @6 r! n3 l6 r如果页码不连续,则默认以上一页最后一个词头为所缺失页词头。
    感觉这一项可以作为可选功能,以便在任选几页生成测试mdx文件时,不会生成过多不必要的页面。

    该用户从未签到

     楼主| 发表于 2021-2-10 14:26:21 | 显示全部楼层
    wjl 发表于 2021-2-10 13:39$ e( B5 p: d) Y# L0 d
    新版能够出结果了,不过似乎仍未处理图片文件名中的栏位编号问题。分栏切分图片的文件名一般是前缀+分隔符+ ...

    ( I. u# }2 D1 \8 g4 Y8 k/ O$ a页面折分的情况还没考虑,一个解决办法是图片还是按顺序命名,第1页左栏为第1页,第1页右栏为第2页,第2页左栏为第3页,这样排下去,词头对应的页码也是这样。
  • TA的每日心情
    奋斗
    2023-9-17 15:16
  • 签到天数: 307 天

    [LV.8]以坛为家I

    发表于 2021-9-7 12:44:04 | 显示全部楼层
    zhongl 发表于 2019-8-18 12:14
    + M  `% _- S4 U6 h$ t9 A2 A支持页码乱排序吗?运行宏时错误9,“下标越界”。
    , [+ B) M8 T' n, r3 ~2 O8 G这代码有问题?把光标停在黄色标志上面,好像说是词头对 ...
    0 ?2 ?+ ?+ M0 n, D4 E; g2 W
    同样遇到此问题,不知如何解决
  • TA的每日心情
    开心
    2021-11-27 10:32
  • 签到天数: 10 天

    [LV.3]偶尔看看II

    发表于 2021-11-9 16:38:57 | 显示全部楼层
    边学习边制作,需要时间,
  • TA的每日心情
    慵懒
    2021-12-3 16:03
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2021-12-3 17:07:11 | 显示全部楼层
    感谢楼主的分享!学习下。有点兴趣
  • TA的每日心情
    开心
    2024-1-24 20:43
  • 签到天数: 749 天

    [LV.9]以坛为家II

    发表于 2022-2-7 13:50:19 | 显示全部楼层
    能否请老师帮我看下是什么原因不能运行?

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2022-9-18 12:25:49 | 显示全部楼层
    这个太赞了,感谢分享
  • TA的每日心情

    2023-7-17 10:55
  • 签到天数: 16 天

    [LV.4]偶尔看看III

    发表于 2023-7-1 20:17:08 | 显示全部楼层
    tsiank大您好,感谢您分享方法!按照您的方法我成功得到了mdx和mdd文件,但是导入到Mdict中却无法显示图片,能否请教您关于这个问题的解决方式吗?
    2 t3 x3 L! I( K& E. Z% {/ }C:\Users\PC\Pictures\Mdict问题
  • TA的每日心情

    2023-7-17 10:55
  • 签到天数: 16 天

    [LV.4]偶尔看看III

    发表于 2023-7-1 20:46:47 | 显示全部楼层
    Tay 发表于 2023-7-1 20:17
    ( m' Q# N" m2 U: y( y  Ktsiank大您好,感谢您分享方法!按照您的方法我成功得到了mdx和mdd文件,但是导入到Mdict中却无法显示图片 ...
    ) u$ n/ ]2 ^. ?; _" X/ S
    两个文件的名称是一致的
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-26 13:58 , Processed in 0.069881 second(s), 7 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表