掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

12
返回列表 发新帖
楼主: enjoy了哦

[讨论] 朗文当代高级词典第五版(英英版)词库提取

[复制链接]
  • TA的每日心情
    开心
    2021-1-4 22:53
  • 签到天数: 5 天

    [LV.2]偶尔看看I

    发表于 2019-3-19 22:16:56 | 显示全部楼层
    超级赞,超级赞
  • TA的每日心情
    擦汗
    2020-6-6 16:10
  • 签到天数: 164 天

    [LV.7]常住居民III

    发表于 2019-3-20 14:11:59 | 显示全部楼层
    楼主大神 膜拜中。
    % @/ l5 D4 t; j3 d. A
    % H$ j9 ?6 Y6 i楼主所言 : 通过Python的 Base64 模块将上述pdata数据转换成二进制gzip文件& C2 U7 U0 ^* N7 \# Y
    具体怎么操作的楼主可以指教以下吗?  请问是什么工具呢,有现成的吗 ?   祝楼主永远健康
  • TA的每日心情
    开心
    2023-3-10 21:15
  • 签到天数: 1329 天

    [LV.10]以坛为家III

     楼主| 发表于 2019-3-21 09:14:04 | 显示全部楼层
    本帖最后由 enjoy了哦 于 2019-3-21 09:53 编辑
    % {" k1 E5 Z1 P/ x5 I$ q# V
    haoduodianying 发表于 2019-3-20 14:11* S* z0 W' g8 ~8 F/ J/ w
    楼主大神 膜拜中。
    0 }, Z! m9 g: h' _9 _* _1 l$ G9 r9 s# L; X" Z
    楼主所言 : 通过Python的 Base64 模块将上述pdata数据转换成二进制gzip文件
    : X# o* s; h; j" d3 s
    思路:
    8 U, F* M9 Z" J! _/ R1. 首先将pdata数据写入一个字符串str中,  Y+ k6 g, z) _& P8 K
    2. (载入base64模块后)调用base64.b64decode(str),将结果赋值给另一个变量binary_data。
    6 i, a* e3 l" n, u3. 以二进制写入模式创建一个文件,例如data.gz。
    4 v5 S! U. A/ h* }8 r4. 将binary_data写入data.gz中。: S/ O3 _$ f* e) F) w8 e
    5. 关闭该文件data.gz。
    6 z* u; p8 u$ d7 Y' `5 v
    4 T' Z. L* J9 h上Python代码:9 M( `( @* B, s/ T% j$ Q- [* \8 ?+ K
    1. import base64
      $ L- _* H2 r4 b( \5 K  _: u+ \! I3 N% P

    2. $ D& p5 r* h! \" w% W2 W
    3. str = '此处填入pdata数据'
      0 m2 ~- n7 s& }2 N
    4. binary_data = base64.b64decode(str)
      % j' R& c  X2 @& w4 o
    5. f = open('data.gz','wb')6 N$ B/ O0 q9 ~! g1 u8 ]) v) G( J
    6. f.write(binary_data)6 b8 h8 \# o1 u2 h9 ~$ p
    7. f.close()
    复制代码

    + j" G* D0 T) W3 k8 x# Y  a; R& a0 B; H
    然后就可以打开data.gz观察解码出的数据。* L, g8 h* H5 P" p% u
    & [# p. }5 _( c' F" a* C9 _$ |! G

    0 E: s% a& [- `8 o如果是Python 3.2 及以上,还可以更方便一些:
    6 y% @0 [6 {6 v3 L2 R2 v1 T) e
    1. import base64
      4 S; w  U6 X% A
    2. import gzip
      . C6 A3 q* {- ?/ b8 K
    3. * K4 ]6 x) K. M0 P; X9 V, U8 k; n4 a
    4. str = '此处填入pdata数据'/ x% _5 r% p# |2 U, Z7 {; i; S
    5. binary_data = base64.b64decode(str)6 [# `# }9 i* u5 e* z8 T
    6. dict_content = gzip.decompress(binary_data)
    复制代码

    / a3 ^# W, c. G* P& K0 V这里的dict_content就是最终的结果,也就是词典的数据。' i; E* `% z! o# Z1 A
  • TA的每日心情
    开心
    2019-7-7 12:52
  • 签到天数: 41 天

    [LV.5]常住居民I

    发表于 2019-3-21 12:42:56 | 显示全部楼层
    失敬失敬,技术大佬来了
  • TA的每日心情
    擦汗
    2020-6-6 16:10
  • 签到天数: 164 天

    [LV.7]常住居民III

    发表于 2019-3-22 07:00:06 | 显示全部楼层
    试了一下,果然是会者不难啊。 好用 谢谢大神 祝永远健康
  • TA的每日心情
    擦汗
    2024-10-9 21:46
  • 签到天数: 338 天

    [LV.8]以坛为家I

    发表于 2019-4-17 11:53:38 | 显示全部楼层
    怎么下载呀
  • TA的每日心情
    开心
    2019-4-28 06:59
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2019-5-2 08:32:55 来自手机 | 显示全部楼层
    虽然看不懂楼主在说什么,但明显能感到楼主不是一般的人

    该用户从未签到

    发表于 2019-5-3 08:41:01 | 显示全部楼层
    有思路的文章,真的好。
  • TA的每日心情
    奋斗
    2020-1-19 11:03
  • 签到天数: 67 天

    [LV.6]常住居民II

    发表于 2019-5-26 22:36:39 | 显示全部楼层
    楼主厉害,收藏学习
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-7-10 12:51 , Processed in 0.020153 second(s), 16 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表