掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

12
返回列表 发新帖
楼主: enjoy了哦

[讨论] 朗文当代高级词典第五版(英英版)词库提取

[复制链接]
  • TA的每日心情
    开心
    2021-1-4 22:53
  • 签到天数: 5 天

    [LV.2]偶尔看看I

    发表于 2019-3-19 22:16:56 | 显示全部楼层
    超级赞,超级赞
  • TA的每日心情
    擦汗
    2020-6-6 16:10
  • 签到天数: 164 天

    [LV.7]常住居民III

    发表于 2019-3-20 14:11:59 | 显示全部楼层
    楼主大神 膜拜中。 6 Z4 E- ~; j' Q. v$ h, ?8 v

    5 g# i9 v  n; P4 H$ {楼主所言 : 通过Python的 Base64 模块将上述pdata数据转换成二进制gzip文件
    , d  ]' h+ c" Z: l6 X4 ?, G具体怎么操作的楼主可以指教以下吗?  请问是什么工具呢,有现成的吗 ?   祝楼主永远健康
  • TA的每日心情
    开心
    2023-3-10 21:15
  • 签到天数: 1329 天

    [LV.10]以坛为家III

     楼主| 发表于 2019-3-21 09:14:04 | 显示全部楼层
    本帖最后由 enjoy了哦 于 2019-3-21 09:53 编辑 ) e/ L$ C, H& t7 S
    haoduodianying 发表于 2019-3-20 14:11
    2 P4 i7 l2 q' A楼主大神 膜拜中。 5 a, f  E; ?1 h5 T+ B

    9 F" _* _: m7 B9 I! f, p楼主所言 : 通过Python的 Base64 模块将上述pdata数据转换成二进制gzip文件

    9 P2 y0 g* [- B. n/ y) a思路:- R% h, t4 t) U4 q/ c3 C
    1. 首先将pdata数据写入一个字符串str中,
    . c. |( o) w' l2. (载入base64模块后)调用base64.b64decode(str),将结果赋值给另一个变量binary_data。
    ' }, g4 g0 h1 r. F  c3. 以二进制写入模式创建一个文件,例如data.gz。
    6 {. b3 ?8 |  @2 D) A; B4. 将binary_data写入data.gz中。$ |: T: Z) [/ ]9 ^1 ~& y* r* c
    5. 关闭该文件data.gz。% t* {9 m* W0 r" B+ ^
    3 q9 F) c) |/ I; m$ D& G: T0 W* o0 @  U
    上Python代码:- n# }# x. z# ~0 ^; G; Q6 Y' f
    1. import base640 |1 g2 ]3 {* t* S4 b
    2. " u: F% p1 s; H+ D/ x4 R
    3. str = '此处填入pdata数据'- i( g7 T. @$ R4 e5 _( l; b
    4. binary_data = base64.b64decode(str)6 a& F- ?! Q% D7 n+ Q
    5. f = open('data.gz','wb')/ C( z# G- l) w' v8 ^
    6. f.write(binary_data)
      ' [$ z/ B' o) E( p  ~4 ^* p
    7. f.close()
    复制代码

    ( T% R) X+ h2 U  |  {  M# K/ J
    , J/ D; H7 @6 ]7 l! X. c然后就可以打开data.gz观察解码出的数据。
    . I4 D: @% h2 g+ Q6 I# i
    % J7 b# {9 Y  _7 i" V0 J- f6 ]
    9 S" V% W- m" Y, `如果是Python 3.2 及以上,还可以更方便一些:
    4 g) z; M# z/ J( T" v& Y: g3 x
    1. import base64
      ( M$ ~. U; |8 U, G1 o
    2. import gzip9 s% Z- J  O: Z. P

    3. * T' ^5 R) y4 u& `1 M6 F
    4. str = '此处填入pdata数据'
      8 J) y" o; j+ _  k
    5. binary_data = base64.b64decode(str)& Q4 h# o. ^9 G* S
    6. dict_content = gzip.decompress(binary_data)
    复制代码
    ) k: I" z! D, w
    这里的dict_content就是最终的结果,也就是词典的数据。
    ! W* F' @. L) E0 G
  • TA的每日心情
    开心
    2019-7-7 12:52
  • 签到天数: 41 天

    [LV.5]常住居民I

    发表于 2019-3-21 12:42:56 | 显示全部楼层
    失敬失敬,技术大佬来了
  • TA的每日心情
    擦汗
    2020-6-6 16:10
  • 签到天数: 164 天

    [LV.7]常住居民III

    发表于 2019-3-22 07:00:06 | 显示全部楼层
    试了一下,果然是会者不难啊。 好用 谢谢大神 祝永远健康
  • TA的每日心情
    擦汗
    2024-10-9 21:46
  • 签到天数: 338 天

    [LV.8]以坛为家I

    发表于 2019-4-17 11:53:38 | 显示全部楼层
    怎么下载呀
  • TA的每日心情
    开心
    2019-4-28 06:59
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2019-5-2 08:32:55 来自手机 | 显示全部楼层
    虽然看不懂楼主在说什么,但明显能感到楼主不是一般的人

    该用户从未签到

    发表于 2019-5-3 08:41:01 | 显示全部楼层
    有思路的文章,真的好。
  • TA的每日心情
    奋斗
    2020-1-19 11:03
  • 签到天数: 67 天

    [LV.6]常住居民II

    发表于 2019-5-26 22:36:39 | 显示全部楼层
    楼主厉害,收藏学习
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-25 05:40 , Processed in 0.018797 second(s), 16 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表