TA的每日心情 | 开心 2018-8-8 03:13 |
---|
签到天数: 1 天 [LV.1]初来乍到
|
本帖最后由 喬治兄 于 2019-3-21 13:37 编辑 & D2 j- p# C0 z" Z' o4 Z
. J! v. T+ } l! @% m
小弟並無什編程和正則表達式和 html css 等等背景知識
8 X; I6 h/ a2 V! }純就對 excel 有些經驗試著製作, 也就土法煉鋼之法
0 @7 S. J- I: \, ^1 T3 S& g正則表達式和 html css 均是套用
/ l2 R& K7 i1 S" \* S若教程有疏失敬請海涵也請不吝指出錯誤5 }/ D+ t5 u" J# Z- O, y
外研社新英漢詞典 (圖片版) 的製作步驟如下:
* f( |- h% T4 y6 o" |" W# d2 ~1. 要先預估其要製作的辭典的辭彙量,
4 t) ]0 W+ q7 r0 e5 [* C! @ 若能知道正確辭彙量是最好的, 但往往不知道其多少辭彙量$ N2 `5 V. ?0 |# a! l V7 K
可能辭典序言上標示的辭彙量也不一定正確
1 a6 V* g& x: p- T F# m* n 此可利用 Excel 統計 random 的函數產生的 30 個隨機數來挑其頁數
1 a; Z: e W; S, D/ @0 Z6 G2 ?& U 算一下那 30 頁 每頁各多少詞頭, 然後求個平均值在乘上頁數.......就大概是那辭彙量
: e) G! b& Z) q8 A' z 保險一點的話在加上3個標準異差乘上頁數.......這樣辭彙量應能大概都能含概了吧
: H0 F( B9 ^7 Y% d( V, a C 因此關於您要用多少的辭彙量來配那本字典, 您也可選 30~40 萬的 wordlist 來配4~5 萬的辭典
# G# \* k4 m# {# r: @/ _ 問題是整頁都是多一堆辭典沒有的字, 也是同樣多花時間找4 L! n& v/ q6 h7 s* e
p.s. 辭典詞彙量估算匹配 https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=33621&extra=
/ |% j5 A7 I2 t$ [! ~ 已提供試算表 您可自行預估拿捏$ `& q. z$ j( Z _4 |: {
2. 對每頁取其左上角詞頭 OCR後再轉貼到 excel , 第1欄為單字, 第2欄為頁數, 如圖No.1
: l# t2 d6 C. Q3. 如圖 No.2 第1欄是正常的單字, 第2欄 是處理過的單字==>去各種 ' , . - 和空格 全去掉僅留英文字元; t+ ]6 o/ k* u: _2 @* ~9 l! [) p
其原因請參考此帖[讨论] 索引字典詞頭的排列順序4 b* _. P7 R) j7 K' o9 ^2 u
https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=32609&extra=8 X( W8 _; @, X: ~# N- t0 r. g
然後選其4欄對第2欄排序若第3欄的順序有錯則表示是您第2欄的單字處理的還有問題4 L1 q; f/ D/ i2 [0 |1 k
此步驟一定要處理到依第2欄排序,但第3欄的頁數順序是無誤的
4 r0 e6 q& J( `" o! R$ _ 您可排序後自增一欄用後面頁數減前面頁數來看是否是 1 然後查找不是 1 直到
" x* k0 Y1 U$ n" r, {5 v; y 依第2欄排序,但第3欄的頁數順序是無誤的為止) D8 |" K: a! ^$ e4 ~! g
4. 然後選其 2, 3, 4 欄 整個 1~1795列 有資料的區塊在 excel 公式 \ 名稱管理員 ==> 新增一個名稱
( O1 x3 r1 p# n 參考 圖 No.3 , 圖 No.4 如page 的那個名稱5 }+ i6 h% D% }) l- I4 h, p
5. 參考圖 No.5 把您要搭配的 wordlist 考到 另一 sheet 的 A 欄 單字 那欄
( K7 L- L5 a" a( Z* l+ w B 欄 搭配用則是 A 欄處理過的單字 處理的方法==>去各種 ' , . - 和空格 全去掉僅留英文字元. n3 b6 m1 B* P2 o7 X* b
然後再選取 A , B 兩欄依 B 欄為準作排序
6 O( M* ~, M9 ~* a4 e6. 然後就可在 C, D 兩欄輸入vlookup 的公式了 C 欄=>參考圖 No.6
) [2 k: L4 m4 ^* }- o% k' l# S D 欄=>參考圖 No.7
& O) {1 e! N) v6 ]; u3 }, e7. 參考圖 No.8
5 n2 Q) Y# s/ g3 p/ g5 u2 [, X# }) t4 p8. 參考圖 No.9 但因 concatenate 此函數無法輸入" 符號 , 所以考背好整欄後在文字處理器去加工 " 符號好後再 ~1 Y* I* J/ Z; Q
回貼到此欄+ t2 d2 f$ Z! G1 v7 b
9. 把 E,F 兩欄資料複製到文字處理器作正則處理把同一頁的單字拉到同一列上 如圖 No.102 g# i8 g7 S j$ S5 |! h+ q$ N
^p<tab>==> , 0 j3 w# d; |5 l6 P Z
10. 再回貼到 excel 另一 sheet 上 如圖 No.11 變成 A , B 兩欄的資料, [- W: |9 _/ N" v% ^; C
11. 再以 圖 No.11 A , B 兩欄的資料再新增一個名稱 pw 如圖 No.12" H3 |; x* d2 J X3 ^
公式 \ 名稱管理員 ==> 新增一個名稱
# H) E+ R3 V, Z$ q 如此掛在每頁的單詞表已完成剩下僅是在合併翻頁和圖檔.png的合併
- Y7 s- m2 V' E0 |+ N12. 單詞表合併翻頁和圖檔.png 不太好解釋但做起來不難就純粹以 CONCATENATE 函數去把所有想要實現的功能結合掛在頁數的那個編碼號而已
. h) Q% N: C9 }, l# i. Q3 t; m- L8 ^; h 如圖 No.13 ====>結合後的結果(翻頁+單詞表+圖檔.png)在 C 欄
" [5 n4 t5 p/ r) ?. H13. 然後再以圖 No.13 的 B , C 兩欄. Q7 M$ O1 J/ D
公式 \ 名稱管理員 ==> 新增一個名稱 wtp* Z& j+ x" w4 b* Y- L, n. j( d
如圖 No.14
( |; v3 F% g9 y; r2 f% N$ w* ]/ ?14. 再把前面 wordlist 配好頁數的部分考到另一空白 sheet 上 然後刪到剩下單詞和頁數兩欄 No.15 ==>No.16. M/ `$ P) z* P3 } S5 t
15. 如圖 No.17 以頁數的那個編碼號為 lookup value 去拉出 wtp 的那張表對映到每個單字
6 y- p; F, @1 `1 t/ E16. 再把圖 No.17 的 A, C 兩欄考到 文字處理器 上加工正則 highlight 的那部份 圖 No.18, 圖 No.19
' b' c3 [: d$ D& W17. 最後在執行可以讓單詞表內和詞條相同的那個單字 highlight 的正則替代式 圖 No.20
' C1 G$ a3 @0 ~' R* p# h 或參考此帖 8樓 jeanleem6 的正則替代式把 ①改為<mark> , ②改為</mark>1 Q# ~ E( W7 N+ P; P0 N
https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=33536&extra=
5 m% U t# ]4 K8 _( y/ w5 a6 V/ d1 V 此條 正則替代式 請在 Emeditor 上執行 UltraEdit 執行不了 .........原因不明, |; U" f' S9 O0 q$ }; A, p9 @
18. 上傳容量今日已滿明日再補 excel 檔了 檔案15m 共4個............剛傳又滿上傳上限了
$ j" ?( I- W2 [' J# h; U2 C. Q4 t+ ~6 B
19. [工具] (更新)图片版mdx源文件生成工具, d/ u- v# \' W; u4 ~5 \6 B
tsiank 兄 已提供完美秒殺生成工具, https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=33574&extra=&page=1 讚! 讚! 讚!' ^) @+ p* M, N8 L/ B* L0 H# g
; u7 x$ T: \3 Y, r, e) B
. Y' t! }" Z; |# O" o0 \& X, x) M' V6 w. Z. F- |% m6 q3 y* Z
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
评分
-
2
查看全部评分
-
本帖被以下淘专辑推荐:
- · 词典制作|主题: 217, 订阅: 40
- · 词典制作|主题: 111, 订阅: 24
|