掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1991|回复: 175

[英汉] 【圖片辭典】譯文版牛津英漢雙解詞典 張柏然 2011

[复制链接]
匿名
匿名  发表于 2020-6-29 10:50:46 |阅读模式
本帖最后由 匿名 于 2020-7-17 12:22 编辑   t5 p4 [3 g( V" s6 ^
+ D8 q2 a! h, h4 z$ Y
看見有人求 譯文版牛津英漢雙解詞典 張柏然 pdf. z! {$ g; r9 j3 J% s
譯文版牛津英漢雙解詞典 張柏然 2011_v2# r- s" k8 U: Q$ a
字表是以流星兄的 Oxford American College Dictionary 匹配是全配
6 w& _. b. x( f$ \( v* f再次感謝流星兄的無私且卓越的排版
+ m, K5 ]3 i; m1 m此譯文版牛津英漢雙解詞典圖片非小弟處理的只是代為匹配
* p: R) R$ P2 [4 J此詞典匹配單字增加個百分比做為找定位的大概參考
' P" `6 f" \+ x3 z* |& d參考看看....不一定準...只是大概: `! Y! z% L- F: V1 ^2 v0 `
用每頁單字的順序號去除以那一頁的單字總數 0%~100%
; w9 U! o7 I$ x+ ]50% 為大概的另一欄, 但大部份右欄的第一個單字大概會在 35%~~65%左右
. S+ _8 O; i" ?5 t2 ~" \+ j" t( ?( b3 Q50% ==> 此為假設的 第二欄的第一個單詞之平均值 μ =50 %3 u! u# \# l+ b' n( a, r- K# f: o4 _
但大部份右欄的第一個單字大概會在 35%~~65%左右 ==> 此也是假設粗估值
  N2 W, I# C. c$ w并無法成為完全可依靠判斷標準的範圍值  ]- F/ s  ]2 _2 n# N% `
實際的偏離情況及座落範圍只能靠隨機抽樣計算後才會有較為精確的值可判斷
# x1 j% q+ |4 K5 u1 X- f" J8 K" `8 C
" [$ z' a" L  L2020-0711 補解  或許您依然留有疑慮......您可以下列
4 n6 G2 Y. S4 j6 v) Z$ `' ~解說的三組數據檢驗其可靠度能否成為判斷欄位標準

3 j9 V; C- p, c+ d其準確度和約莫的欄位判斷出錯率是否如同那三組數據
! [, l( N/ c% v1 f& F& t
- `# o! _4 X4 F) s* H, {7 G

9 E1 S; X4 A% C4 B, j" m1 v第二欄的第一個單詞之平均值 μ 只能經由實際隨機抽樣 >=30 頁的樣本後來反推母體座落範圍
) y! n# ~  L/ M9 [7 V
30 頁的樣本就足夠了....再多的樣本對於 (μ and σ) 應該是影響不會超過 1% 甚至 0.01%.....
# \# M6 D+ {' l0 y/ J

2 @% K9 @* g: E& ?

3 y4 q# x& V  F. S, g# I8 m) g! V( M( x0 [
同樣道理用於粗略匹配上也是一樣..........若把可以判讀的部份單字判斷值轉成欄位也就成了....粗略匹配+粗略定位
, E# j2 m  k  E* D+ I雖然無座標定位但你也會知道其大概位置
5 u1 a5 x7 A1 `但下列是以此辭典幾乎全配來解說.....因依然還是有漏一些詞6 U/ g  c' d0 x* L6 y
但不管是全配或是粗略匹配...其分佈的特性不太可能改變...漏配多配其實並不影響其粗略定位的模型
4 s2 J1 y. J& O8 p縱然會不太一樣但其統計的平均值和標準異差的特性一樣會消禰其數據的差異性而給出個概略的範圍值9 Y6 [9 r0 f: I4 C8 ?6 ^1 l2 d2 e

' p9 x7 Y* K+ Q7 Z6 S0 j) w- ?& M( g/ i
3 |1 a  N/ q: I& N% Z! X0 y5 A0 K

1 p* _' R% k4 K0 ^2 t7 A
! B, v7 U) O7 d( R2 y經由實際隨機抽樣 30 頁後來反推母體座落範圍7 U6 T4 n7 \$ Y7 F" q4 N$ c
第二欄的第一個單詞之平均值 μ =56 %
1 f2 T/ G- w3 D2 s3 S& \
標準異差 σ= 8.7%
3 A( F4 B' ~  t1 ?. ~

! ~9 U4 r) g0 l6 A7 E* M, d若以 95% 的準度來估其第二欄的第一個單詞 座落範圍 39%~~74%8 s- K- H6 t8 O$ @

9 L: @; l6 N  w! k# ~2 ^這個範圍和 Excel 用的 μ & σ 所估的會有出入....因分佈不一定是正態分佈! E. n, y6 w0 m0 b' C  q; p% H
因數據經由正態化轉換之後最接近的 Best Fit 是 Bata Distribution , M. N5 F  A$ b
Excel 估的 Normal Distribution 95% confidence 95% value Bata Distribution 95% confidence 90 % value 的範圍值恰巧很接近
* M6 S1 P, k& c/ I2 a所以當然用 Best Fit Bata Distribution
5 _- }2 {3 Y! f4 Z
' g  O3 r$ D7 S: z, p1 T
% w: u( z5 `8 W
$ K( U/ h( y- A! K: f" O8 n. C8 T: a& ^, ~. E3 N) U7 P0 ^
以此法來判斷欄位, 約莫 10次會錯 1
. c5 y1 c# W8 p- m
第一欄  < 39 %................95% 的信心水準  90% 值; k: z9 ?- g4 f; d: Q0 s
第二欄  > 74% ................95% 的信心水準  90% 值
" z, `/ ]; \5 t: {9 a
( m* V# y7 \/ x# q4 v' c
39%+(100%-74%) = 65% ..............約莫 65% 的所列單字可以判斷欄位, 約莫 100次會錯 10
+ ~( p% f- m# {) s  ]* |$ C5 n
: }6 |- w, v/ O( h4 [2715 頁 * 1/10 = 270 頁 約莫 270 頁 依此判斷會出錯7 C- f% Z; l1 N2 h$ a3 ^. {, L6 t
$ v9 p7 ]6 \2 J+ I3 F
- ]- A2 U9 n8 |1 _7 G. I+ `- u! F
. p9 {* `7 G( G# q
或者更加保守點以下列準則 判斷欄位6 f4 K/ M2 t2 E; n% R- J
約莫 100次會錯 5
7 h% Y# z# r4 B) ?
第一欄  < 37.2%...................95% 的信心水準  95% 值
$ j- _) [  z( n: k- k5 w第二欄  > 76.86% ................95% 的信心水準  95% 值
7 B" h! ?" C/ v( Q" W( B
* z* Z! K' i; @1 T% L7 |, ?7 `
37%+(100%-77%)= 60%  ..........約莫 60% 的所列單字可以判斷欄位....約莫 100次會錯 5
; m2 x! {( c! K2 n% {8 `2715 頁 * 1/20 = 135 頁 約莫 135 頁 依此判斷會出錯( U: G& [# t7 o. V
" ~7 }3 N/ t' T4 B& t$ _
! _2 [. \& }, ?5 r6 S6 U4 y! l! m

) q! h* H* v9 ?  w& v" |# U# S或者更加保守點以下列準則 判斷欄位' f0 F# r$ ~/ C" R" P4 y  n, R
約莫 100次會錯 1

4 U7 i7 G; z) Y9 c! A/ v* z第一欄  < 34.07 %................95% 的信心水準  99% 值
/ B1 h& n1 z5 B3 V& p1 {0 }. y% f% h第二欄  > 80.29% ................95% 的信心水準  99% 值
* a8 I. o( g0 V* H

+ f: \; @: k  j34% + (100%-80%) =54%..............約莫 54% 的所列單字可以判斷欄位....約莫 100次會錯 1 ; x: g: g7 e& F* [
2715 頁 * 1/100 = 27 頁 約莫 27 頁 依此判斷會出錯9 x( r  x0 Y, X; K7 S0 G' R

! S* y" g+ `3 W, F ( B+ v! i8 Y2 K% p0 j( @

( ~# X2 W7 i& _) Z4 y) m" V+ L( u- @& a( j2 g+ H9 h
- S9 F! A3 w2 k# U

6 W: `$ O- X0 S* z8 b  _
游客,如果您要查看本帖隐藏内容请回复
$ e  i/ W& z$ {% h

+ Z0 |1 w2 Z! f% W& @! w$ b; w) A3 z3 T% G8 d" u

* i& }  m7 b/ ?$ T% v. @. w8 Z7 H6 O# Z
粗略定位   以下可能並不實用僅是一個想法* k7 h  j% x5 W# [
5 W& g( k3 B; r% z+ Y

7 X& N& L" j. x3 A
) }3 m3 L! @2 j4 o" m) k$ v5 F& v若分成四個區塊則大致上可實現粗略定位
2 y7 I4 l3 X# j2 t& C3 j7 x6 C( h+ G" F若再細分區塊也沒甚意義.....因只有為數不多的 % 比例可以歸納到 單一區塊
7 M: J/ b% y- O4 h, q) D大部分 跨兩個區塊或三個區塊,再細分區塊也起不了細分的作用
) p4 Q; s2 s2 n+ \/ |% J  Y實務上圖面上需在一半處劃線或標記才不至於搞不清楚區塊分隔處
) ?$ [- ^2 W# H粗略定位的....對照表
) p) G+ c5 C* Q: Z) V% G/ R當對照表算好後就可依其替換為區域
! n6 [6 x4 g, w$ a
此表為依 μ (+/-) 2σ 其約 95% 範圍值去擬合 min max 線性迴歸公式後才能再反推而得出的 min max 對照區域表
0 B8 H; N- a- {7 i( C- A2 l所以依然會有約略 5% 錯誤.....但歸納到 4個區域錯誤應該會更少吧......不是很確定....只是假設的猜想) @$ f/ }2 v' N4 f' V; L6 v3 S
1~10% ==> 區塊 1,  97~100% ==> 區塊 4' J7 r7 [  {9 q- r& d# ~
11%~96% 很多單字基本上是跨兩個區塊....少部份更是跨三個區塊
% T- e* V3 k( _# A1 R/ c
8 s9 Z* r: l2 s* W& v36%~46% 跨三個區塊 1,2,3
9 Z1 F( S2 b" a# r- y3 M& V" E62%~71% 跨三個區塊 2,3,4
  F- n0 z5 d' D! `9 j; D
- \# U2 g% J8 {0 k/ R

5 b+ O+ {4 f8 `: {/ t或許因只切成 4 塊充其量也只能判斷到此程度2 U! j4 F6 O* i1 K: I
區域或許可再細分, 但是得降低預估的範圍值, 也就是擺在機率最大處來考量* b) Z( n  X, z9 v* [
可能相對精確些...........有待實驗證明........... ]# e9 W  h$ r( M9 Y8 p' ]
區域 4 ==> 區域 8 ==>精度增加一倍. G# @: ^+ w% `7 D, }$ G0 k) h

, g) \; \" ^1 Z9 Bμ (+/-) 2σ ==>μ (+/-) 1σ ==>μ (+/-) 0.5*σ
- w' V. e$ N$ w& D# J. R! E# ]& J8 w  C9 j' N1 }% q
μ (+/-) 2σ ==>    0.4772*2 ==> 0.9544
2 L: j: P1 v* Lμ (+/-) 1σ ==>    0.3413*2 ==> 0.6826' v. y# E, Z# r, M/ {4 Y
μ (+/-) 0.5*σ==> 0.1915*2 ==> 0.383/ V& v& P+ N1 _/ p) {
* V  O; r: V/ i( B( k* g
μ (+/-) 2σ / μ (+/-) 1σ   ==> 1.3982 ===>顯然遠不如 區域再細分 的兩倍好+ N1 j3 Y7 ~6 R/ g1 o
* B8 p4 h% U: Q- T6 G
以上純屬假設的猜想..........# F2 Y0 ~5 N2 x& x* _5 Z
實際成效是怎樣.................有待實驗證明..........8 d' m# d; m( O* t

  i) w1 c6 K# G( u0 Z$ Z1 l' c" \: H) \% D0 P

% P! G6 R* L8 d$ w$ n8 {8 n* h0 _3 N基本上把線也弄成 % , 線的上下兩個單字% 相加後除以 2 ...平均值1 q* B! u, u; ?. @' P+ m
Excel 表上的紅色數據欄位...線的平均值( y7 K% {+ S' D0 `# f- A
50-mean, 25-mean, 75-mean ...........線的平均值
7 K" n4 d6 D0 P9 g6 a7 h50, 25, 75.................線的比例位置名稱並非有什作用...只是好分辨而以
1 y, d1 v& D3 O
7 [  O$ q% L% u
2 A  ]+ J" e6 \& H9 {2 J: @# m" o* f' r# W( g; Z
          " n9 o* N9 z, P9 K8 }
$ X: ^3 y7 G4 b/ r% d  z
代入 y 值 % 反求 x 的區域值
0 ]' h& c% L( S# ^" g9 Y- k; l3 _3 w2 K8 J
   
; N9 a/ H1 l" _3 [: A    * ?. F1 V- t* U. O2 q- u8 {, m% A

6 `( Z2 P% S% l. S4 V, y7 a: \   P8 U5 v: K0 P1 [& b

4 F9 U! J# L4 L1 A ; @+ n6 e8 O: y# B1 `

9 g3 D  ^1 }# `' I! A5 T0 ]1 C/ ^5 J  q+ r4 T7 C; N# {
區域 x 8,   μ (+/-) 1σ
8 k- ], i" R5 k5 d8 c" ~5 M/ Y5 o% Z
μ (+/-) 1σ ==>    0.3413*2 ==> 0.6826
: k' q4 w+ B1 K' P: M! K0 Y- H% j3 ]2 O# W
比原本的 μ (+/-) 2σ 的範圍窄
. L& Z. n2 a5 Q) S也意謂少了 27.18% 的範圍面積的框列,失誤率也相對增加但定位也相對精確, d! t, q" J8 m
因為資料分佈的實際範圍是不變的
, Z' ?+ x8 c$ f7 G  f0 ~8 I若遇如此情況沒找到,則再往外圍擴一區塊找
- y/ V4 z6 i0 p4 s, ]5 D; {* a
8 W6 ^. G( z" |' O5 k+ k8 Y0 o( c區域再細分, 等於只是增加刻度與精確度無關, 座落區域準一點而已1 @! {# \, R% H+ h. m8 k: U
標準異差大表示數據的離散度也大較無法集中於一個區域.這是無法避免也
- p& d! y9 m$ d2 L* O- f是無法改善的5 y- G; Z0 m7 j3 r" J3 [

- C( `; T$ b+ d$ m" M. ?* `  + k. C  D! \' U* ^  b4 C+ Z
$ ^% e, I/ y* y( n$ z0 v  m" h1 h

( i8 u' `4 f1 X; ^8 _              
- R3 T( ~7 i; R+ T8 k# U( b! Y8 T
' m8 Q6 @2 k1 s- D1 y, L) `. @5 k  S  }1 V9 x! C
5 q' N$ K& p6 j7 D  d% O: i! m% A
下列不管是占了 1 個區域或 2 ,3 個區域 都只是 資料範圍面積 68.26%! x; \7 B% j& [. W6 r0 d
但是這也是機率最大的區塊........資料分佈範圍不會因為增加一倍細分區域而改變分佈範圍的寬度
+ L4 F; W, e7 i$ G* `7 ~1 T2 y" Q, k  W0 p  ^
" d$ D9 @1 V' I  r! U3 s7 [$ u; T
          
: K7 E# P  ~8 L' G1 U9 J2 t. G9 h( T+ K3 X1 u( r! ~) O7 j4 ]

* w+ a2 {: ]' I  M4 d: ^6 K2 n$ a. W; e% k$ X
$ ^6 G% t: I# A8 Z
處理的方法還有很多,這只是個粗糙的用 30 頁 的 每頁 6 個數據來推估母體的分佈情況
8 {: f4 a: R1 o# K而衍生的處理方法7 M' \# T% Z& p# K0 b  H
然而隨著不同的定義法可能會衍生更精確的推估# w( C* J  q4 s2 C9 s- |4 [
! }2 o- z0 {7 F; V4 g

6 {5 o# w9 S3 i& c8 O2 D- k, [! z

, A. N% \% r0 B+ U; F& h% a$ }$ B' c/ [. i, O$ m

$ y# f/ [5 z" Q6 X; a0 x' _, U% R' V
# y; j6 x& Z% i: F9 I
1 W, O. x3 n' c; L. H: e% h5 B: E6 C+ f; r  |. @8 F7 e
1 Z8 s- C0 k4 D0 _1 |

. ~5 z& y1 e* k$ L' l. r# G$ C( l$ u2 v* D9 |( P

; L/ y% q" p% ?" D6 \
+ R. N' y* |! @5 I
1 C) t5 {" r% d6 H0 B  x
  • TA的每日心情

    2020-7-26 12:29
  • 签到天数: 190 天

    [LV.7]常住居民III

    发表于 2020-6-29 12:21:44 | 显示全部楼层
    本帖最后由 richard2017 于 2020-6-29 13:55 编辑
    1 B- `  C$ v# e: c' p) n+ `/ S! i) j' R% f  m
    图片在goldendict无法显示,请问如何解决

    点评

    改版GD没有这个问题https://nonwill.github.io/post/goldendict/  发表于 2020-6-30 01:06
    偶数页显示不了,单数页可以显示。  发表于 2020-6-29 17:29
  • TA的每日心情
    开心
    2019-7-9 15:21
  • 签到天数: 263 天

    [LV.8]以坛为家I

    发表于 2020-6-29 19:36:22 | 显示全部楼层
    VimVim 发表于 2020-6-29 11:584 _% `0 _; O( i3 F6 n2 ^
    感谢分享,学习图片词典制作
    2 m6 I" ?/ m: z
    单双页都能显示的。要用nowill的GD,我用的是2020年5月19日那版。官版的确实显示不全。
    ; s& p; s) E7 H另外,想请教一下,这个图片版,要如何设置才能放大显示比例?原来在别处管用的放大方法在这里不灵了。谢谢!
  • TA的每日心情
    慵懒
    昨天 08:12
  • 签到天数: 269 天

    [LV.8]以坛为家I

    发表于 2020-6-29 10:59:43 | 显示全部楼层
    多谢分享哈,终于盼到了
  • TA的每日心情

    昨天 06:46
  • 签到天数: 789 天

    [LV.10]以坛为家III

    发表于 2020-6-29 11:03:45 | 显示全部楼层
    感谢分享!虽然英语不行但还是支持一下。
  • TA的每日心情
    开心
    昨天 08:41
  • 签到天数: 314 天

    [LV.8]以坛为家I

    发表于 2020-6-29 11:12:24 | 显示全部楼层
    很棒的观感,多谢。
  • TA的每日心情
    开心
    昨天 01:46
  • 签到天数: 892 天

    [LV.10]以坛为家III

    发表于 2020-6-29 11:18:53 | 显示全部楼层
    好东西,感谢楼主愿意分享
  • TA的每日心情
    开心
    昨天 07:09
  • 签到天数: 693 天

    [LV.9]以坛为家II

    发表于 2020-6-29 11:34:17 | 显示全部楼层
    谢谢,下来看看

    该用户从未签到

    发表于 2020-6-29 11:39:35 | 显示全部楼层
    感谢楼主分享!
  • TA的每日心情
    奋斗
    昨天 06:34
  • 签到天数: 560 天

    [LV.9]以坛为家II

    发表于 2020-6-29 11:41:02 | 显示全部楼层
    这个很是厉害
  • TA的每日心情
    擦汗
    2019-8-11 08:28
  • 签到天数: 10 天

    [LV.3]偶尔看看II

    发表于 2020-6-29 11:49:03 | 显示全部楼层
    因为图片版一直不会弄,下了看看,谢谢。
  • TA的每日心情
    擦汗
    2020-7-2 14:04
  • 签到天数: 364 天

    [LV.8]以坛为家I

    发表于 2020-6-29 11:58:39 | 显示全部楼层
    佳作难得,十分感谢!
    ) j/ {9 ]/ E1 U
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    发表于 2020-6-29 11:58:51 | 显示全部楼层
    感谢分享,学习图片词典制作
  • TA的每日心情
    开心
    昨天 03:44
  • 签到天数: 160 天

    [LV.7]常住居民III

    发表于 2020-6-29 12:08:20 | 显示全部楼层
    感谢楼主慷慨分享!
  • TA的每日心情
    开心
    昨天 08:12
  • 签到天数: 363 天

    [LV.8]以坛为家I

    发表于 2020-6-29 12:11:20 | 显示全部楼层
    感谢楼主分享
  • TA的每日心情
    慵懒
    2018-9-28 00:22
  • 签到天数: 273 天

    [LV.8]以坛为家I

    发表于 2020-6-29 12:23:45 | 显示全部楼层
    图片就是太大,就这点。
  • TA的每日心情
    慵懒
    5 天前
  • 签到天数: 149 天

    [LV.7]常住居民III

    发表于 2020-6-29 12:26:35 | 显示全部楼层
    多谢分享,终于有这本的资源了!!
  • TA的每日心情
    开心
    前天 09:03
  • 签到天数: 519 天

    [LV.9]以坛为家II

    发表于 2020-6-29 12:35:47 | 显示全部楼层
    谢谢分享   下载看看
  • TA的每日心情
    开心
    昨天 09:07
  • 签到天数: 1026 天

    [LV.10]以坛为家III

    发表于 2020-6-29 12:40:38 | 显示全部楼层
    感谢楼主无私地分享
  • TA的每日心情
    奋斗
    半小时前
  • 签到天数: 258 天

    [LV.8]以坛为家I

    发表于 2020-6-29 12:43:43 | 显示全部楼层
    感谢分享!支持一下。
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    顶部qrcode底部
    关注公众号送论坛充值码
    关注微信公众平台
    关注微信公众号 pdawiki,获取邀请码,看文抢积分,抽奖得浮云! Follow our Wechat official account "pdawiki", get invitation codes, and play the lottery to earn points (积分)!

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2020-8-12 01:22 , Processed in 0.048363 second(s), 11 queries , MemCache On.

    Powered by Discuz! X3.4

    © 2001-2017 Comsenz Inc.

    快速回复 返回顶部 返回列表