掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

12
返回列表 发新帖
楼主: enjoy了哦

[讨论] 朗文当代高级词典第五版(英英版)词库提取

[复制链接]
  • TA的每日心情
    开心
    2021-1-4 22:53
  • 签到天数: 5 天

    [LV.2]偶尔看看I

    发表于 2019-3-19 22:16:56 | 显示全部楼层
    超级赞,超级赞
  • TA的每日心情
    擦汗
    2020-6-6 16:10
  • 签到天数: 164 天

    [LV.7]常住居民III

    发表于 2019-3-20 14:11:59 | 显示全部楼层
    楼主大神 膜拜中。 8 B+ F) L, {% l5 q8 w; e1 K$ s8 j0 A
    - e. {7 W% e  a% x* G9 ?
    楼主所言 : 通过Python的 Base64 模块将上述pdata数据转换成二进制gzip文件
    0 ?: n7 s; d: ]: E$ Q$ e6 j具体怎么操作的楼主可以指教以下吗?  请问是什么工具呢,有现成的吗 ?   祝楼主永远健康
  • TA的每日心情
    开心
    2023-3-10 21:15
  • 签到天数: 1329 天

    [LV.10]以坛为家III

     楼主| 发表于 2019-3-21 09:14:04 | 显示全部楼层
    本帖最后由 enjoy了哦 于 2019-3-21 09:53 编辑
      o6 X" B9 k; t0 d5 S9 I1 c4 I) G
    haoduodianying 发表于 2019-3-20 14:11
    * ^: i& o* P* @8 v7 Z楼主大神 膜拜中。 9 d) x2 Y9 e* i, T- h

    8 ^, A# I) S  z. o楼主所言 : 通过Python的 Base64 模块将上述pdata数据转换成二进制gzip文件
      P  U6 \/ k6 R
    思路:# D0 f% O0 I2 o
    1. 首先将pdata数据写入一个字符串str中,
    % q4 k5 |( c. C/ c6 Q" {2 d1 h2. (载入base64模块后)调用base64.b64decode(str),将结果赋值给另一个变量binary_data。
    , ~0 u1 a% N8 X, U8 C" D3. 以二进制写入模式创建一个文件,例如data.gz。
    4 N% ?; P6 q( ?9 o- c' s4. 将binary_data写入data.gz中。
    5 Y% t  G8 e6 k$ W8 E5 g: q; H5. 关闭该文件data.gz。, Q- D7 o# O, M
    8 l1 k% S# ?# m4 a- r/ o- F! g5 S' C7 W
    上Python代码:& {. B1 h3 d. c! N
    1. import base64" Y1 |! L: V5 g+ U( J

    2. ; ^" r8 F. Q# i% P
    3. str = '此处填入pdata数据'  U- t% i4 q& j6 W9 A
    4. binary_data = base64.b64decode(str)% O$ q) ^: B* T5 k& R
    5. f = open('data.gz','wb')
      ' w' v$ ~7 y0 `: p# ?% F
    6. f.write(binary_data)% {/ t$ B  X" j* p: i$ S4 l5 b
    7. f.close()
    复制代码

    ) G$ ^# N% ?# K& `3 j* C0 W
    5 X2 i- y( N' K8 g$ R, ]然后就可以打开data.gz观察解码出的数据。
    ) |. m8 I1 X- ]# O& P
    . A+ e/ Q' r% |5 o- S
    5 f! w2 J# |- z, V, a如果是Python 3.2 及以上,还可以更方便一些:/ m0 a: S. H, r: w: z
    1. import base64
      6 N0 _' D+ \9 @
    2. import gzip3 C6 M' `* L" Y+ C
    3. * ]5 M+ A5 g; g4 s) R
    4. str = '此处填入pdata数据'
      7 s3 E4 h0 h# P$ A
    5. binary_data = base64.b64decode(str)
      $ @& Y/ R9 I0 O2 W# x# ?
    6. dict_content = gzip.decompress(binary_data)
    复制代码
      r2 J  X* G! I4 ^- e" }
    这里的dict_content就是最终的结果,也就是词典的数据。! G6 E8 k1 l) B' q7 e
  • TA的每日心情
    开心
    2019-7-7 12:52
  • 签到天数: 41 天

    [LV.5]常住居民I

    发表于 2019-3-21 12:42:56 | 显示全部楼层
    失敬失敬,技术大佬来了
  • TA的每日心情
    擦汗
    2020-6-6 16:10
  • 签到天数: 164 天

    [LV.7]常住居民III

    发表于 2019-3-22 07:00:06 | 显示全部楼层
    试了一下,果然是会者不难啊。 好用 谢谢大神 祝永远健康
  • TA的每日心情
    擦汗
    2024-10-9 21:46
  • 签到天数: 338 天

    [LV.8]以坛为家I

    发表于 2019-4-17 11:53:38 | 显示全部楼层
    怎么下载呀
  • TA的每日心情
    开心
    2019-4-28 06:59
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2019-5-2 08:32:55 来自手机 | 显示全部楼层
    虽然看不懂楼主在说什么,但明显能感到楼主不是一般的人

    该用户从未签到

    发表于 2019-5-3 08:41:01 | 显示全部楼层
    有思路的文章,真的好。
  • TA的每日心情
    奋斗
    2020-1-19 11:03
  • 签到天数: 67 天

    [LV.6]常住居民II

    发表于 2019-5-26 22:36:39 | 显示全部楼层
    楼主厉害,收藏学习
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-7-10 09:56 , Processed in 0.019536 second(s), 16 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表