掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

12
返回列表 发新帖
楼主: enjoy了哦

[讨论] 朗文当代高级词典第五版(英英版)词库提取

[复制链接]
  • TA的每日心情
    开心
    2021-1-4 22:53
  • 签到天数: 5 天

    [LV.2]偶尔看看I

    发表于 2019-3-19 22:16:56 | 显示全部楼层
    超级赞,超级赞
  • TA的每日心情
    擦汗
    2020-6-6 16:10
  • 签到天数: 164 天

    [LV.7]常住居民III

    发表于 2019-3-20 14:11:59 | 显示全部楼层
    楼主大神 膜拜中。
    0 D. a; e$ b" e# J
    ! u5 a& f9 b; g' e( x  L楼主所言 : 通过Python的 Base64 模块将上述pdata数据转换成二进制gzip文件, X$ D/ G  t1 [) X5 {9 k6 ]6 i
    具体怎么操作的楼主可以指教以下吗?  请问是什么工具呢,有现成的吗 ?   祝楼主永远健康
  • TA的每日心情
    开心
    2023-3-10 21:15
  • 签到天数: 1329 天

    [LV.10]以坛为家III

     楼主| 发表于 2019-3-21 09:14:04 | 显示全部楼层
    本帖最后由 enjoy了哦 于 2019-3-21 09:53 编辑 ' @' A7 E- O9 s' s4 ^9 z" K) L5 A4 R( E
    haoduodianying 发表于 2019-3-20 14:113 D3 M3 W1 y4 M' k  ?3 u4 Y
    楼主大神 膜拜中。
    ' a8 S% g5 y; b$ C$ x# `. l9 M
    % o6 q( ]% _& J2 R楼主所言 : 通过Python的 Base64 模块将上述pdata数据转换成二进制gzip文件

    : g7 Z6 E9 |' k, k; z思路:
    % w% i' \; }" M6 ]  X2 U: _: k1. 首先将pdata数据写入一个字符串str中,
    ( U2 M$ Q* u5 _8 W2. (载入base64模块后)调用base64.b64decode(str),将结果赋值给另一个变量binary_data。: B. S9 M5 z2 |8 u, C/ W0 L, v
    3. 以二进制写入模式创建一个文件,例如data.gz。3 f/ i8 e8 ?# y3 J
    4. 将binary_data写入data.gz中。
    : N9 P" r5 f0 e7 i2 ^; h2 q5. 关闭该文件data.gz。
      H4 a5 b, w; n/ {2 q. T$ P1 S' X9 j
    上Python代码:& L6 P8 m# I% j" F2 L
    1. import base64
      & d2 G7 U+ A' m, d- y! o1 O/ w; u
    2. 8 z" n. P' e" o6 D" Z) L8 |
    3. str = '此处填入pdata数据'2 u1 O9 j4 G" k; O0 a, ]$ }
    4. binary_data = base64.b64decode(str)
      / `7 p1 P7 k6 M
    5. f = open('data.gz','wb')
      4 M5 s% L5 c& m% I: l9 ?, D
    6. f.write(binary_data)- ?9 O3 p, @! @" @/ f
    7. f.close()
    复制代码
    + v9 s  Q4 B9 `* ?

    ! |  Y- \7 \5 K) ^然后就可以打开data.gz观察解码出的数据。
    $ ~2 e/ t/ C2 ]* d; p6 T2 [& {) O0 G' i, v; m1 Z

    % f! ^5 _1 d* I' l如果是Python 3.2 及以上,还可以更方便一些:
    . I5 Y9 l* Q2 I
    1. import base64" U% i+ k& f& j( y
    2. import gzip
        p' }$ U- H* L& P6 }
    3. 6 [- T4 d1 d5 t) S
    4. str = '此处填入pdata数据'( x  V$ x8 I& J5 v, p
    5. binary_data = base64.b64decode(str)0 `& H. v" a3 i
    6. dict_content = gzip.decompress(binary_data)
    复制代码
    / ]' H$ w2 U% z$ k3 q% _
    这里的dict_content就是最终的结果,也就是词典的数据。
    * y- Q! J/ H& N2 J, f1 e
  • TA的每日心情
    开心
    2019-7-7 12:52
  • 签到天数: 41 天

    [LV.5]常住居民I

    发表于 2019-3-21 12:42:56 | 显示全部楼层
    失敬失敬,技术大佬来了
  • TA的每日心情
    擦汗
    2020-6-6 16:10
  • 签到天数: 164 天

    [LV.7]常住居民III

    发表于 2019-3-22 07:00:06 | 显示全部楼层
    试了一下,果然是会者不难啊。 好用 谢谢大神 祝永远健康
  • TA的每日心情
    奋斗
    2023-12-27 14:56
  • 签到天数: 336 天

    [LV.8]以坛为家I

    发表于 2019-4-17 11:53:38 | 显示全部楼层
    怎么下载呀
  • TA的每日心情
    开心
    2019-4-28 06:59
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2019-5-2 08:32:55 来自手机 | 显示全部楼层
    虽然看不懂楼主在说什么,但明显能感到楼主不是一般的人

    该用户从未签到

    发表于 2019-5-3 08:41:01 | 显示全部楼层
    有思路的文章,真的好。
  • TA的每日心情
    奋斗
    2020-1-19 11:03
  • 签到天数: 67 天

    [LV.6]常住居民II

    发表于 2019-5-26 22:36:39 | 显示全部楼层
    楼主厉害,收藏学习
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-27 10:54 , Processed in 0.041816 second(s), 5 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表