掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1251|回复: 10

[求助] 請教快速容易的方法轉PDF to mdx

[复制链接]
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2015-12-28 15:26:35 | 显示全部楼层 |阅读模式
    本帖最后由 喬治兄 于 2015-12-28 15:29 编辑 % T* m+ f/ w( c% i% w$ \

    ! l8 l: d) c# f) H% Z" |( q# e昨晚看了一些前輩的方法; l* T/ O% ]( Q' A8 {, K" U# m  F5 Q
    step 1. PDF to html. J2 q* a& M* ]* D; J; C5 }
    step 2. html to source txt
    " K  K: R  T* h* w! a               a.問題是對html和正則語法不是很會
    ' a, u2 F# C4 [) a         b.有看到有人驗證markdown來簡化html語法符號
    ( [% g6 c, r/ P! P/ e         c.問題是markdown簡化html語法符號,但似乎更難判斷和編輯成source txt, 簡化html語法符號後似乎特徵更少更難判斷
    6 p: N" |# m1 d3 |: Y              d.請問是否有更佳簡化之方法用markdown or other tools ?
    # e0 ?- L8 ]+ d- R& C5 T! N              e. Would you please provide some "markdown edit the html examples" to illustrate these steps?
    * t- M# Q# K1 Q5 G/ estep 3.txt to mdx     
    4 L# ^3 y% t. K- e9 m; ^$ W- C0 i. X
    Thank you and good luck     
    " \* j# \# M. t5 N
    ; M$ z, ~8 Z6 C% L6 T# E   

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    开心
    2021-4-30 05:36
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2015-12-28 20:14:58 | 显示全部楼层
    Oeasy 大,我转了一个pdf到ePub格式,您看从这个格式再到mdx是否简单一些,谢谢

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    该用户从未签到

    发表于 2015-12-28 17:46:43 | 显示全部楼层

    # S+ z% c3 Y0 X/ K2 R4 n
    ) j6 J) u( J4 ?, l) E) x" r7 s我以一个制作过上百个 mdx 的过来人说一句。
    9 n' x  o* n& M* m  gPDF 哪怕是文字版的 PDF ,想转完美的 mdx ,想“快速、容易”,基本是不可能的。
    ; g: k+ z0 A% R还不如人工一条条录入或者复制粘贴。
    . v8 P0 L9 A; Z$ W1 I, w& A1 i8 L1 c8 h/ j( j7 R# f% i

    * F, J- ~( |* g; s  |3 `
  • TA的每日心情
    开心
    2021-4-30 05:36
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2015-12-28 18:55:36 | 显示全部楼层
    Oeasy 发表于 2015-12-28 17:46
    $ F) p) a' h8 ~" L5 e我以一个制作过上百个 mdx 的过来人说一句。
    ; C3 U0 q- W, T# s$ dPDF 哪怕是文字版的 PDF ,想转完美的 mdx ,想“快速、 ...
    7 K3 c; P  o8 C. j/ G% Q$ W
    Oeasy 大,有软件可以把文字版pdf转成mobi或者epub格式,这样再转成mdx是不是简单一些
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

     楼主| 发表于 2015-12-28 19:03:07 | 显示全部楼层
    本帖最后由 喬治兄 于 2015-12-28 20:06 编辑 ) e7 L" C* k' w* T
    Oeasy 发表于 2015-12-28 17:46. k: D0 n9 X' f3 z$ Y9 j! q
    我以一个制作过上百个 mdx 的过来人说一句。% X& }" A. h; X' ^! H. o6 H" j
    PDF 哪怕是文字版的 PDF ,想转完美的 mdx ,想“快速、 ...

    ' {2 |& B3 p3 R( s  S7 C4 H
    # z. q8 e1 j& o* V8 FOeasy 版大你好" ]4 _/ R: f$ t4 N2 X% s8 h
             這些日子裏來,小弟每每閱讀您的文章後總有許多想法啟發和莫名的動力觸發自己去完成自己想要的字典,無奈對獲得Source txt 前的過程產物html語法符號正則語法實在難以下嚥,且這非一日之功能所及.
    - R- n* |  F- u' i         小弟目前想到的作法:5 o6 c# a+ |& Z3 @2 B# I) q+ D
    • 1 copy pdf txt to word docx, maintain the word font
    • 2 then copy word docx to excel, still keep the word font
    • 3 use excel vba to screen the Bold font or other specical features in txt then place a symbols  "⊕,◎,○,⊙" before these features.
    • 4 then use ultraedit to organize the txt with these symbols  "⊕,◎,○,⊙" 6 f+ ]" M' T/ @  ^5 V& g% r
    " s- u7 Q2 j2 ^0 V2 m  ?# I5 t( q
           excel vba 現請以前的同事幫忙寫的
    / |  h* Q- |: }- I, i
    ' p( y4 M1 @, [" j6 x* Q       此方法處理pdf是否很笨,Oeasy兄能否再給小弟一些建議
      \0 a$ \5 Z+ _' O

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

     楼主| 发表于 2015-12-28 20:26:40 | 显示全部楼层
    经典与古典 发表于 2015-12-28 20:14
    " E9 G( I  M  u- c, [Oeasy 大,我转了一个pdf到ePub格式,您看从这个格式再到mdx是否简单一些,谢谢

      L- K' y5 r5 `- L  B$ Q. |小弟也研究看看

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

     楼主| 发表于 2015-12-28 20:40:31 | 显示全部楼层
    本帖最后由 喬治兄 于 2015-12-28 20:52 编辑 " f7 k# f4 |2 W1 J% z
    经典与古典 发表于 2015-12-28 20:14
    ( k% i( N$ R6 `/ d( ^) J- DOeasy 大,我转了一个pdf到ePub格式,您看从这个格式再到mdx是否简单一些,谢谢
    % U& c6 n- Y% v0 S+ }# o6 j
    ; M* J0 A) q7 Y& }; s' N
    應該是有錯誤的
    % V, d' K. m! v4 X5 k  C" n3 {7 y2 ~" x$ ^) O* I0 Y
    錯誤應該是在於PDF上你看不到OCR的順序
    3 h- Z. O( N* i, o當你轉成epub or mobi 則當時OCR的順序就會顯示出來9 ]$ _- A: h; V5 D
    除非OCR的順序是按照閱讀的順序轉成epub or mobi 應該就會是正確的

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x
  • TA的每日心情
    开心
    2019-6-16 20:48
  • 签到天数: 221 天

    [LV.7]常住居民III

    发表于 2015-12-30 18:33:58 | 显示全部楼层
    有些pdf拷贝不了文本呀,真很难办。
  • TA的每日心情
    慵懒
    2023-2-4 11:26
  • 签到天数: 579 天

    [LV.9]以坛为家II

    发表于 2016-1-20 23:52:34 | 显示全部楼层
    Oeasy 发表于 2015-12-28 17:464 f) L/ `: S+ G* _) }* N3 x4 s
    我以一个制作过上百个 mdx 的过来人说一句。8 E' o  D% ^% y
    PDF 哪怕是文字版的 PDF ,想转完美的 mdx ,想“快速、 ...
    0 l% K  |8 ^3 I3 [# u% Q
    O大,有没有把图片扫描版的PDF转成mdd的方法啊?

    该用户从未签到

    发表于 2016-1-22 14:20:09 | 显示全部楼层
    865052004 发表于 2016-1-20 23:523 G( q5 _; X9 P' }( h" I2 }3 o/ {. K
    O大,有没有把图片扫描版的PDF转成mdd的方法啊?

    , g: p0 ~6 z* a- X
    1 i- [( O, s7 \+ n0 v可以参考这个帖子by tsiank 图像版mdict字典制作方法 https://www.pdawiki.com/forum/fo ... hread&tid=13451
    . R' [" |: D4 x1 E' r2 ]
    * B/ `8 L2 X3 W7 c8 v. h7 _# ^/ p& Z# B# }8 w, @

    该用户从未签到

    发表于 2016-3-7 11:28:45 | 显示全部楼层
    文字版的PDF可以用word2013或者2016完美打开,之后再转txt,再转mdx是不是更加简单点啊???
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-8 15:11 , Processed in 0.022304 second(s), 23 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表