TA的每日心情 | 开心 2018-8-8 03:13 |
---|
签到天数: 1 天 [LV.1]初来乍到
|
本帖最后由 喬治兄 于 2020-2-20 08:51 编辑
3 n% J$ e6 `0 v! R
; q5 R' h1 @7 D; I( g- G7 Q 因鑒於圖片辭典作耗時費力且查詢的實用性又大打折扣
1 k6 B, ?" a/ V6 T, N圖片辭典製作完後也往往成為擺設, 因限縮於詞頭搜索實用性也因而大減, 投入和實用性不成比例.../ r H- V1 q0 y
盼各位同好予以建議提供看法和觀點....( M8 A: G/ y) R" U- n- F
) E- y, m+ ]- g; _, w: h
圖片辭典目前缺陷如下:
- S: Y5 e1 c' i( a1. 圖片辭典的 mdx vs. ocr 後的 pdf or djvu 格式檔案.....基本上沒有優勢2 @- L6 o5 U2 |1 `
ocr 後的 pdf or djvu 格式檔案 可全文搜索
' `9 o3 M3 S% M: q# g. }2. 針對目前僅靠詞頭去調出那頁的的圖像或 highlight 位置所獲得的圖像訊息要再查詢或搜尋也相對乏善可陳: j) i. _9 J3 L
詞條內容也無法再查詢或搜尋....圖像所致
0 O0 o$ b$ v; j. V/ F/ u2 x 就算在歐路能以 OCR 取詞卻也無法對其內容搜尋...GoldenDict...亦然7 X% [5 | ?: z( c
3. 光是校對詞頭都已是非常吃重的負荷
* F9 G( v j- A8 j. ], Q" y5 v9 j 然而 OCR 後的全文校對更是不太可能
2 V( H0 {5 u& E/ l4 g( U! W' F1 S# y1 }! q
8 M6 R4 u1 s0 I7 ?有關圖片辭典的製作淺見如下:# G3 E9 H. B+ ]+ P! D" ]
/ l6 [3 c8 z3 ?: B n1. 僅校對詞頭....圖片上列出當頁的導航詞頭
6 l [) ]) D7 E, i 搜索分兩部份:
$ r H) }+ ?+ B# f2 `! Ga. 詞頭==>校對......此可借用 Chigre 兄的工具來達成
6 T9 G) g6 f" U0 qb. 內容==>OCR 不校對9 ~0 f# `# @" O7 l1 S6 g. A
5 q/ J( _& a: Z1 _) ]: ^
2. 結合圖片和 OCR 文字....把 OCR 文字利用起來於全文搜索
7 m9 D+ B2 c9 u8 `3. 把圖片和 OCR 文字并列....縱然 OCR 不一定正確..但可從圖片獲得正確訊息
% Y# M- @: `6 T* J0 p& c3 L0 s 如此禰補 mdx 與 ocr 後的 pdf or djvu 的差距
, c% `% [. B# n% p 如果辭典有 2 or 3 欄, 以顯示 1 欄 50% 的銀幕寬度 另外 50% 銀幕寬度顯示文字來并列
. i% i: q* m' @6 V& n1 t 如此也好對照......highlight 文字列來定位也較為容易些$ {1 ~. T5 f+ U4 h3 g7 D# V& e
<a href="#section1"> 類似此標簽於圖片是無法轉跳定位但文字是可以的
0 a- p ]% F! Q/ f; I% H* p. S4. 因可互相對照圖片和 ocr 文字....或許可供熱心人士後續來校對完善之+ q; }) P, ]6 W0 U
5. 若是純英英相對 OCR 良率高則把 OCR 文字利用起來於全文搜索較易達成
8 d$ D0 {6 o. J$ y- o$ h6 j6. 若能以切圖到每個單字區塊且加上 OCR 文字則最是完美, 但無奈的是此又難度太高.....! @* Y& ~2 u9 M9 P+ H4 H
此 Chigre 兄已完美的達成單字區塊的切圖....唯缺OCR 文字實在令人扼腕.....
+ P, h& d" l4 k# B5 \ 或許折衷一下簡化一點9 A t5 v) z- u4 Z7 f8 h
但若以切欄為單位 + OCR 文字....此應較易達成; p0 X+ Y$ E4 X" | U- j
. p6 E1 ~! m: z. o4 @* e
' t' O5 v* v: Q3 Q4 J" U" x
' C5 Q4 s, W" S5 ?" P0 L
. i) U) ]$ I& o! @' \) U
1 K* {2 C a5 r0 x
|
|