掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

12
返回列表 发新帖
楼主: enjoy了哦

[讨论] 朗文当代高级词典第五版(英英版)词库提取

[复制链接]
  • TA的每日心情
    开心
    2021-1-4 22:53
  • 签到天数: 5 天

    [LV.2]偶尔看看I

    发表于 2019-3-19 22:16:56 | 显示全部楼层
    超级赞,超级赞
  • TA的每日心情
    擦汗
    2020-6-6 16:10
  • 签到天数: 164 天

    [LV.7]常住居民III

    发表于 2019-3-20 14:11:59 | 显示全部楼层
    楼主大神 膜拜中。 # p" J' s9 Q5 E

    + S& `6 T- `/ a' _楼主所言 : 通过Python的 Base64 模块将上述pdata数据转换成二进制gzip文件4 I1 d- y# ~2 W& Z* m0 B
    具体怎么操作的楼主可以指教以下吗?  请问是什么工具呢,有现成的吗 ?   祝楼主永远健康
  • TA的每日心情
    开心
    2023-3-10 21:15
  • 签到天数: 1329 天

    [LV.10]以坛为家III

     楼主| 发表于 2019-3-21 09:14:04 | 显示全部楼层
    本帖最后由 enjoy了哦 于 2019-3-21 09:53 编辑
    5 s  f" f( M- `; x) u: e
    haoduodianying 发表于 2019-3-20 14:11" j+ B* j. k" {0 P% h
    楼主大神 膜拜中。 - C& R0 C. ?8 j
    ; x3 c8 |0 B' g. d  H3 Q7 ]
    楼主所言 : 通过Python的 Base64 模块将上述pdata数据转换成二进制gzip文件

    9 ^4 n5 R; L8 m思路:. Q; A1 y; o" `" N
    1. 首先将pdata数据写入一个字符串str中,# Z) F1 Y; r! I& ?4 d% p5 W
    2. (载入base64模块后)调用base64.b64decode(str),将结果赋值给另一个变量binary_data。
    1 W6 I( n4 v' C- _  c3. 以二进制写入模式创建一个文件,例如data.gz。
    2 A: M& W  J/ _) H1 i/ w4. 将binary_data写入data.gz中。
    ) b+ @' @" c: }# p/ e1 d5. 关闭该文件data.gz。
    ' ?; ]& z( U9 r3 R) B1 F' L
    ( o6 {; e# |# v9 e. {, R" \上Python代码:
    , e  }# l" ~& Z
    1. import base64
      , h2 z+ P( W' b8 u
    2. 7 _! @7 B! J. u+ X6 H: R
    3. str = '此处填入pdata数据'
      & p) X( q" Q. u* L2 {; t3 c4 ]
    4. binary_data = base64.b64decode(str)
      ' W8 d8 }9 ]1 G1 n2 B# u
    5. f = open('data.gz','wb')
      4 C5 a6 z( j8 }( a' M' c
    6. f.write(binary_data)
      $ \' O7 ^  L; O3 Q8 j
    7. f.close()
    复制代码
    6 R7 Z) R$ R8 v: V: D6 K3 E
    1 z  v  H, v0 E2 U: p
    然后就可以打开data.gz观察解码出的数据。1 C; ?  I' C% _9 z

    + ~( M0 ]  w% W
      K( b2 S; r, H  Z/ s如果是Python 3.2 及以上,还可以更方便一些:
    . i* J- Z5 C2 X- h
    1. import base64
      9 }# {( u3 C( e: \" p8 |/ J: C
    2. import gzip
      ' ?! v# W! L* w/ e' F/ n

    3. / p0 o" ~$ @2 m, C
    4. str = '此处填入pdata数据'# G) q+ H- D6 e' Q$ }; N( `
    5. binary_data = base64.b64decode(str)
      $ z& T7 {# i# _
    6. dict_content = gzip.decompress(binary_data)
    复制代码

    2 G0 W8 O9 h3 Q3 y; i% k3 i& o4 O% ^这里的dict_content就是最终的结果,也就是词典的数据。; A: ]9 O8 v% X6 S! _& R
  • TA的每日心情
    开心
    2019-7-7 12:52
  • 签到天数: 41 天

    [LV.5]常住居民I

    发表于 2019-3-21 12:42:56 | 显示全部楼层
    失敬失敬,技术大佬来了
  • TA的每日心情
    擦汗
    2020-6-6 16:10
  • 签到天数: 164 天

    [LV.7]常住居民III

    发表于 2019-3-22 07:00:06 | 显示全部楼层
    试了一下,果然是会者不难啊。 好用 谢谢大神 祝永远健康
  • TA的每日心情
    奋斗
    2023-12-27 14:56
  • 签到天数: 336 天

    [LV.8]以坛为家I

    发表于 2019-4-17 11:53:38 | 显示全部楼层
    怎么下载呀
  • TA的每日心情
    开心
    2019-4-28 06:59
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2019-5-2 08:32:55 来自手机 | 显示全部楼层
    虽然看不懂楼主在说什么,但明显能感到楼主不是一般的人

    该用户从未签到

    发表于 2019-5-3 08:41:01 | 显示全部楼层
    有思路的文章,真的好。
  • TA的每日心情
    奋斗
    2020-1-19 11:03
  • 签到天数: 67 天

    [LV.6]常住居民II

    发表于 2019-5-26 22:36:39 | 显示全部楼层
    楼主厉害,收藏学习
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-3-28 22:37 , Processed in 0.033754 second(s), 5 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表