TA的每日心情 | 开心 2018-8-8 03:13 |
---|
签到天数: 1 天 [LV.1]初来乍到
|
本帖最后由 喬治兄 于 2019-5-30 14:48 编辑 / {3 i; |0 O5 [0 A2 @ S5 Z2 R
5 I7 X. f2 d% a* c: H6 W- n! m
問題如下:* z, S# c- b! O/ [. n5 z2 Q
想從兩三個或多個 wordlists 隨機抽出一定數量的單字
6 t8 t2 d4 d* t8 [- t( Q& z但又具有機率高點的不遺漏又能兼顧較偏的單字(隨機抽取)
' h/ j- w& y9 W) ^% U1 x6 P( W$ C
想到一法似乎可行, 盼有興趣的同好指導之.............謝謝感恩
- r$ H @ i4 G k$ ~. D6 r模型如 Excel 附件 按 F9 可隨機選取
5 k$ }3 Y5 P+ f* \" L. v9 a缺點:
# P+ H7 S. z6 d0 |當數量大時反應不及好像跑不動 5 w" \! j/ @% e* N
您可以放多點字彙於B 欄
" b6 B+ F$ p$ u2 A/ T1 H* A5 i其他欄位按每一欄的公式考背既可
1 B) k9 ], y: c+ ^ j% E- G; Y+ s1 d5 N$ t( s' v
. @ D9 O* o) g& L8 K7 j4 ^# K) t/ W, f; i, i9 Q% a" o
! X. k* r1 W2 X. q9 ]
大概說明:
/ a* ]+ d4 ^6 {( F% bB 欄 為字表(為兩三個字典的字表)2 I6 `- p7 J! n* H o
F 欄, K 欄 為想抽取的字條* Y0 E7 {. f; p; G' E" m+ Q0 o
若 B 欄有十萬(包含重複) ==> 字表若有重複字條則隨機抽出的機率也增加
, e7 o6 H" a3 `/ b p: Q( bF 欄, K 欄 可為任意數3 B# C* X5 o' B8 q, g
+ x# A" c8 e) W
PS. 因是以 Random 的函數產生此屬於 uniform distribution 的分配) g- Q, ~/ h2 J# X' _( y
或許應以 binomial distribution 的分配來抽取應該會正確一點
2 Q3 s- A/ Z+ _6 h( p 原因是此為計數值而非計量值0 F) j+ f, |& ? z6 V, M
0 l1 e. f: R3 e2 _, T
大概想法:
( B& W" X! W) p- A1. 是延續 辭典詞彙量估算匹配 https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=33621&extra=3 L4 n* h% L6 V* V
2. 想從幾個字表抽取出一定數量的單字來匹配
& |& J0 r1 O* E- w& T0 L: `" N+ c& D3. 若隨機抽出 30 組再整在一起去重應該是匹配度能達到一定的吻合度9 e5 C- ~% d% f6 h7 g3 b* w
( ~- s& F6 ?1 X: y
期盼有懂 VBA or Python 能搞一個自動化隨機抽取一個自定量的單字數.....謝謝7 c8 O3 e; D# y7 w+ w
& c e) ?. K# GSampling.zip 同4樓解釋的檔案
5 P' r+ W8 R; P) e) x |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?免费注册
x
|