掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 2039|回复: 14

[讨论] 索引字典詞頭的排列順序

[复制链接]
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2019-1-18 15:11:28 | 显示全部楼层 |阅读模式
    本帖最后由 喬治兄 于 2019-1-18 21:15 编辑 . E8 T) x1 W' v  q6 f
    , C/ H  ]+ H, Z# x& |: |: O
    不知這樣分類對嗎, 若有不妥請管理員移動....謝謝+ S) J9 Q5 p/ i
    您若有制作索引字典# @* ^& s* @% [
    以辭量較大的 wordlist 去匹配字典上每一頁的第一個字和最後一個字為基準頁碼時
    . {0 j% v. g/ R( ]7 B& `( V可能需注意一下, 以 Excel vlookup function 去匹配相對的頁碼時
    ! |5 a4 P9 Y& g+ L您的wordlist 可能需處理一下以免 vlookup 匹配到錯誤的頁碼. m) h7 u! j$ i$ D
    情況在於一般紙質典詞的 headwords 排列的順序規則如下
    4 ^8 |/ X& A, z( ]/ l7 Y/ {( Y0 n* W$ [( {- |/ {  M/ I) Y
    varying hare ==>varyinghare# P. k$ _* }& S- y3 c. b: L' l
    panic–stricken ==>panicstricken
    $ I* z5 U2 Y4 Y- K# d2 _8 t9 [一般字典是以去空格和連接號來排序的: b. j3 p9 o  ^  y4 V- ~
    所以需以紅色粗體字那樣來排序* z+ s% o/ o  S6 d% A# d0 m: K
    則其順序會和紙質典詞的 headwords 排列順序一樣+ V3 U. }8 o3 F5 _: O0 J' H
    若以籃色字體那樣的來排序則順序會和紙質典詞的 headwords 順序有所些微差異而導致跳頁
    0 h) f. x/ y; g) W; }8 @# |貧道已試過蠻多次的,您可試試答案是否也是和貧道說的一樣( K+ Y9 Y; I, I# |# t% I, O

    7 g$ S* n* u7 |: L3 }0 x
    # ^, ]" K, r& M- K9 LPS. 補充: 感謝 tsiank 兄提醒
      f+ R5 m! H6 L: F0 H还有带éè等字符的也要处理一下
    : ]+ i% M: j' T) |& n
    排序時都排到最后去
    , A* E# w, }4 ~
    èéêëìíîú
    ē9 Z6 E1 X2 h* {- f7 H
    類似這類的字元那就需替換成一般的英文字元再排序' v5 V7 z# M8 z( v9 d4 N4 c& u
    再看排序後的位置是否正確
    + F" c4 i% L( [& h0 g  _3 \" ]若不符在字典的順序還需調整" A) E4 o# X" D. j" w
    3 M9 e+ `7 Q; c3 S1 W/ a" G
    9 K6 Y) S9 o1 m( e  i

    评分

    1

    查看全部评分

    该用户从未签到

    发表于 2019-1-18 21:07:40 | 显示全部楼层
    一般我都先正则替换掉所有普通英文字符和数字、空格  U9 a# S7 n  j/ Z( \
    然后剩下的特殊字符根据情况替换为相应的英文字符或者替换为空: I0 r, y, l* F/ X9 ]
    1. [a-z] [0-9] 空格 统统正则替换为空
    " P; Y. s+ y7 u* t. }" B& a2. (\S)替换为 \1\n  删除重复行
    8 L" B5 {. U4 }" F" m3 m/ |; m3. 替换特殊字符为普通字符

    评分

    1

    查看全部评分

  • TA的每日心情
    郁闷
    2018-5-17 09:15
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2019-1-18 21:05:00 | 显示全部楼层
    只要有排好序的词头,我就能把mdx按这词头排序好。" t: y6 Y4 C2 I) s8 i, j: q
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

     楼主| 发表于 2019-1-18 21:15:28 | 显示全部楼层
    chigre3 发表于 2019-1-18 21:07: B2 F% W# _& b! v8 d2 z. s
    一般我都先正则替换掉所有普通英文字符和数字、空格
    # i# V8 ?8 t+ ?) b然后剩下的特殊字符根据情况替换为相应的英文字符或者 ...

    9 h2 X8 H3 g6 g, N3 rchigre3 兄:
    ( q3 d$ I! l9 r9 B. h3 I% w: f這樣的字元情況,.....在下沒處理過
    ' {. D5 J' G7 |% r, v6 B只是 tsiank 兄提醒,覺得可能是這樣處理吧" p& r  j/ y  G' k4 o
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

     楼主| 发表于 2019-1-18 21:18:32 | 显示全部楼层
    y8888 发表于 2019-1-18 21:05; u# o- J" a! I" j( |
    只要有排好序的词头,我就能把mdx按这词头排序好。

    : p$ H8 C/ I: s% z' z1 i不是很懂 y8888 兄的意思
    " \, U9 G8 r/ b( K: v3 w/ K9 Q0 H是另外做個字表嗎
    $ f$ a( |0 ^5 v1 \& a
  • TA的每日心情
    郁闷
    2018-5-17 09:15
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2019-1-19 07:45:54 | 显示全部楼层
    喬治兄 发表于 2019-1-18 21:18
      h+ Q0 E* w& r6 ?; Y不是很懂 y8888 兄的意思
    3 k' p2 j, w9 g1 q是另外做個字表嗎
    2 Y6 Z. p! D) j/ ~7 E
    可能我也没有看清你的意思。你意思用电子字典按纸版词序对应起来?我意思若有纸版词头,则MDX我可以按纸版的排序对应出来。
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

     楼主| 发表于 2019-1-19 12:16:58 | 显示全部楼层
    y8888 发表于 2019-1-19 07:454 y% x4 y/ m8 p' L
    可能我也没有看清你的意思。你意思用电子字典按纸版词序对应起来?我意思若有纸版词头,则MDX我可以按纸 ...

    - J, U7 @# f! x" U6 X2 U6 @y8888 兄:
    5 s, m8 G! D% F) {. w$ Q我的意思是利用辭典頁面上的第一個字和最後一個字來作為區間! B, s! J1 y& N* Y9 p/ D. F; f
    然後用vlookup去匹配在此區間的其他單字) w8 w0 |: g7 |6 p) M+ [
    所以wordlist 的順序一定要和辭典的順序一樣
    - z: K$ _7 }: k9 G9 y4 G不然有的在此區間的字會跳到別的區間3 }8 g* C7 a$ |1 a
  • TA的每日心情
    郁闷
    2018-5-17 09:15
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2019-1-20 17:31:50 | 显示全部楼层
    估计你这方式不很精准。C大给我一份韦氏的词头我则按词头排序好了。其实你想实实现的效果与我说的是一回事。

    该用户从未签到

    发表于 2019-1-20 17:45:29 | 显示全部楼层
    这个不能解决短语的问题1 p$ s" U$ y8 _4 ~$ n9 @' y3 j

    ( e- ~3 d9 O4 @, k- Z9 ]# mW3(英汉辞海)把「no go」放到[go」下面,你怎么排都没用: E; O. ~% q9 j- c+ ~* p

    / P+ j' d+ J7 }3 `& |短语只能手动来

    评分

    1

    查看全部评分

  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

     楼主| 发表于 2019-1-22 09:54:50 | 显示全部楼层
    本帖最后由 喬治兄 于 2019-1-22 10:39 编辑 8 c! Z8 p* D* _9 O, a6 N& ]6 _6 B
    y8888 发表于 2019-1-20 17:31" [: E& J/ g/ A3 g3 ^2 h
    估计你这方式不很精准。C大给我一份韦氏的词头我则按词头排序好了。其实你想实实现的效果与我说的是一回事 ...

    + r8 j# }+ ]/ g: u4 f( R
    : f+ S# _0 ?& [7 Q4 k8 g' my8888 兄:
    $ z7 Y( Y$ e; V( P2 J若辭典的排列規則如小弟所述且並無 klwo2 兄 所遇到的狀況
    ( j, O/ S+ [: i  |' Z  \) s: Z. e則必然在此區間
    2 [/ K* a% t$ o) D0 UOxford, Longman 都是如此排列規則
    0 F$ w. C6 r! m8 b3 F) i0 B1 R# p, k0 i2 l$ z1 |6 H/ N
    . [" J1 A9 ^3 A, q8 X/ g1 g
    其實小弟此文的真意是
    2 W5 y4 j1 E7 a' }3 X1. 當您可能沒有此字典的wordlist 時想配其區間的字
    + J+ x$ u' E" D4 n* ]2. 當然不可能會精確因為不是此書的字表, 但是能確保匹配在其區間" j0 G, {: }0 T4 A* x6 o
    3. 按其字典的排列匹配在其區間==>只剩多配和少配的問題此取決您的 wordlist 辭彙量及密合度了2 u. Q/ v2 }% D( |. G: p

    9 @1 \! Z5 N; z& Q& [1 C
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

     楼主| 发表于 2019-1-22 10:02:01 | 显示全部楼层
    本帖最后由 喬治兄 于 2019-1-22 10:24 编辑 3 U5 X+ u# `' E( I; M$ l# P5 C
    klwo2 发表于 2019-1-20 17:45' _: |/ A9 D+ I! d
    这个不能解决短语的问题
    1 Q/ P: H8 j  J& x2 Z3 U( h- s  A( M/ F! m5 X, p( g" u1 W
    W3(英汉辞海)把「no go」放到[go」下面,你怎么排都没用

    ( L) e- _/ U0 f! N: V- G3 d
      I3 Y7 y' s6 f' |' W! s3 vklwo2 兄:
    & C2 P9 l7 _, B/ ~謝謝提醒,把短语給忘了...哈!哈!哈哈哈' C0 v% H' D! V
    這樣的狀況短语只能要先抽出額外處理3 f3 C5 B2 j( Y+ Y! L

    + c# p6 V3 |& v% e9 i% W6 w還是 klwo2 兄經驗老道呀
    0 ^* X8 O& s: ]/ Z+ k一瞄就能看到此文缺失....太感謝了
    + l0 K( Q8 O) M9 e; u& _" t讚呀!# u9 x: ~) t# z; f5 `( P
  • TA的每日心情
    擦汗
    2020-7-3 13:51
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    发表于 2021-2-26 18:51:40 | 显示全部楼层
    chigre3 发表于 2019-1-18 21:07
    * K$ w& R$ ?7 V% b6 s. N9 P一般我都先正则替换掉所有普通英文字符和数字、空格1 z6 u3 a0 u) @6 V0 H
    然后剩下的特殊字符根据情况替换为相应的英文字符或者 ...
    ! z  G. ^0 y+ d8 D; ~# A3 K" k& ?/ A
    为什么要“先正则替换掉所有普通英文字符和数字、空格”? 这些难道不是需要的吗?
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

     楼主| 发表于 2021-2-26 20:17:14 | 显示全部楼层
    本帖最后由 喬治兄 于 2021-2-26 20:20 编辑 : V9 S- l# T$ H2 W1 v, `
    starmars 发表于 2021-2-26 18:51
    1 f- {6 C- G  l$ q( G0 |为什么要“先正则替换掉所有普通英文字符和数字、空格”? 这些难道不是需要的吗? ...

    , _! k$ P+ t1 J+ S9 [: B+ [% R6 \/ t% v: Z# E0 ~
    starmars 兄:
    - B* D# \" z- \/ G$ T/ q8 I) v道理很簡單這樣才能知道有多少特殊字元要處理
    # Q7 v( Y2 y5 U/ w6 W若是這些特殊字元并不影響排序的順序,其實也可以不需要作替換處理. F) ^# E" F1 L9 c
  • TA的每日心情
    擦汗
    2020-7-3 13:51
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    发表于 2021-2-26 20:31:07 | 显示全部楼层
    喬治兄 发表于 2021-2-26 20:17; h) P% J8 M1 ?; K/ o0 Z
    starmars 兄:
    , s' p. [) B" r6 H/ L9 l3 f/ O道理很簡單這樣才能知道有多少特殊字元要處理" {( w4 r/ x1 |4 h% h$ u
    若是這些特殊字元并不影響排序的順序,其實也 ...

    5 V8 U' H  w( z: i, i, g# R原来先正则替换掉所有普通英文字符和数字、空格,是为了只留下特别字符看得更清楚啊!我还以为是在说普通英文字符和数字、空格都是做图片词典可以丢弃不用了呢。
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

     楼主| 发表于 2021-2-26 20:46:50 | 显示全部楼层
    本帖最后由 喬治兄 于 2021-2-26 20:55 编辑 ) t0 F% X1 h2 P" W5 \, O  m5 I) Y
    starmars 发表于 2021-2-26 20:317 K3 M# {" d# H& K, r+ I+ x
    原来先正则替换掉所有普通英文字符和数字、空格,是为了只留下特别字符看得更清楚啊!我还以为是在说普通 ...
    9 i* w/ D/ s' b8 l6 F8 j5 u$ w

    ( Z0 i, E" L/ ~$ ]starmars 兄,Chigre 兄的作法是正規的處理方法,我猜他應該是把一些法文或西文的字符替代成英文字符後排序,但根据個人經驗,沒去替換好像也是不影響順序,你可以找幾個試試,基本上我是都沒去處理,只處理幾個我所提的字元
    - H  Q5 h! q2 `. @( x& F+ T* B# i8 f3 _4 M, z( P
    '  ,   .  -   / 和 空格# l. e& e) n+ |1 [

    1 S1 B6 W5 r( D5 V/ Z% H& s( ) ==> 看詞典情況 可能只去括號, 也可能去掉括號+括號內的內容
    ( s4 P) `' q. a" W1 t; x0 b
    $ [& @( n8 a* z" s8 [0 x# ~/ `&==>and/ Q( z, _  m( |& V( G: z
    St. ==> saint ( 看詞典情況 )
    2 t2 S* W! p. G6 b. d+ f' n' B
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-5-2 01:43 , Processed in 0.060531 second(s), 10 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表