掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

12
返回列表 发新帖
楼主: enjoy了哦

[讨论] 朗文当代高级词典第五版(英英版)词库提取

[复制链接]
  • TA的每日心情
    开心
    2021-1-4 22:53
  • 签到天数: 5 天

    [LV.2]偶尔看看I

    发表于 2019-3-19 22:16:56 | 显示全部楼层
    超级赞,超级赞
  • TA的每日心情
    擦汗
    2020-6-6 16:10
  • 签到天数: 164 天

    [LV.7]常住居民III

    发表于 2019-3-20 14:11:59 | 显示全部楼层
    楼主大神 膜拜中。 % B% a* Q% Q" k; h6 @/ c) g9 z3 S6 V0 Y
    0 U& `8 n1 ?) l7 R" Z" J2 B8 u3 Q
    楼主所言 : 通过Python的 Base64 模块将上述pdata数据转换成二进制gzip文件2 I& S( P9 X6 i
    具体怎么操作的楼主可以指教以下吗?  请问是什么工具呢,有现成的吗 ?   祝楼主永远健康
  • TA的每日心情
    开心
    2023-3-10 21:15
  • 签到天数: 1329 天

    [LV.10]以坛为家III

     楼主| 发表于 2019-3-21 09:14:04 | 显示全部楼层
    本帖最后由 enjoy了哦 于 2019-3-21 09:53 编辑
    ) @/ X9 {& f/ Y0 H
    haoduodianying 发表于 2019-3-20 14:11& ~8 y: m; X6 W. y5 p
    楼主大神 膜拜中。
    1 d  C% |1 p7 w) h" w0 ~( D, m3 N& s" l! l, L
    楼主所言 : 通过Python的 Base64 模块将上述pdata数据转换成二进制gzip文件
    & d, a( H  M% ^- H/ [$ M
    思路:0 J  b  r/ o* M+ i. T
    1. 首先将pdata数据写入一个字符串str中,
    5 D% z3 F9 @. X2 z' A! A, ^2. (载入base64模块后)调用base64.b64decode(str),将结果赋值给另一个变量binary_data。
    4 o5 y4 M0 ^6 ~6 y3. 以二进制写入模式创建一个文件,例如data.gz。5 H& n' M; @' M
    4. 将binary_data写入data.gz中。; R# Q  ^, x3 R& |5 b9 g
    5. 关闭该文件data.gz。) B. v2 }6 i) G
      e% p: b3 G) U/ ], o
    上Python代码:
    ! Z4 [8 F( R. F% m/ W' w& Y+ c
    1. import base644 U: i8 Y1 `  V! ]' ~' b" w3 [, |! B

    2. + f( P1 \5 o9 D9 n% o8 N
    3. str = '此处填入pdata数据'4 b' X. N, D  k
    4. binary_data = base64.b64decode(str)
      - V9 `- i8 g) O  u
    5. f = open('data.gz','wb')
      * E. d& x1 l0 Y8 l5 N4 L; Q$ N- w
    6. f.write(binary_data)
      " c( P4 h0 B' B' F! r4 Z- n
    7. f.close()
    复制代码
    * k% Y. G3 q+ E1 T1 d  r

    ! ?( N& j: a4 U6 P- H然后就可以打开data.gz观察解码出的数据。
    - o8 o" q- A) J0 N* a; R0 R; l" F9 r# G
    0 C$ @* z" F. v" p5 k& |  h
    如果是Python 3.2 及以上,还可以更方便一些:
    ) W" o) U! D1 `* u0 R) v' y7 X) D
    1. import base64
      ' |+ L- B8 ^- d3 R0 \
    2. import gzip4 T+ U# p* @- O; c5 q0 g

    3. 6 q/ {6 H3 o7 j6 X2 I$ W. X1 k
    4. str = '此处填入pdata数据'3 W0 P8 r; E6 v+ ?- v: T7 s
    5. binary_data = base64.b64decode(str)1 T- U$ Y+ {! o! w  z& v) j0 o% c8 e
    6. dict_content = gzip.decompress(binary_data)
    复制代码

    1 T5 \5 h5 C4 n* x0 j5 D3 b  b这里的dict_content就是最终的结果,也就是词典的数据。
    $ \. `7 L- e4 J! U
  • TA的每日心情
    开心
    2019-7-7 12:52
  • 签到天数: 41 天

    [LV.5]常住居民I

    发表于 2019-3-21 12:42:56 | 显示全部楼层
    失敬失敬,技术大佬来了
  • TA的每日心情
    擦汗
    2020-6-6 16:10
  • 签到天数: 164 天

    [LV.7]常住居民III

    发表于 2019-3-22 07:00:06 | 显示全部楼层
    试了一下,果然是会者不难啊。 好用 谢谢大神 祝永远健康
  • TA的每日心情
    无聊
    2025-8-10 17:10
  • 签到天数: 339 天

    [LV.8]以坛为家I

    发表于 2019-4-17 11:53:38 | 显示全部楼层
    怎么下载呀
  • TA的每日心情
    开心
    2019-4-28 06:59
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2019-5-2 08:32:55 来自手机 | 显示全部楼层
    虽然看不懂楼主在说什么,但明显能感到楼主不是一般的人

    该用户从未签到

    发表于 2019-5-3 08:41:01 | 显示全部楼层
    有思路的文章,真的好。
  • TA的每日心情
    奋斗
    2020-1-19 11:03
  • 签到天数: 67 天

    [LV.6]常住居民II

    发表于 2019-5-26 22:36:39 | 显示全部楼层
    楼主厉害,收藏学习
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2026-6-5 04:34 , Processed in 0.019129 second(s), 16 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表