掌上百科 - PDAWIKI

用户名  找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 3762|回复: 19

[索引] Python 专贴[...]

  [复制链接]

该用户从未签到

发表于 2017-11-16 20:06:08 | 显示全部楼层 |阅读模式
本帖最后由 Oeasy 于 2017-11-17 10:08 编辑 2 q+ V9 }, {4 `
, E+ w2 ~7 U2 P6 C0 ?6 x+ l
# q' d9 y6 s. M6 w/ N
大家有遇到** Python 方面的问题,不妨跟帖,说不定……
- A( e9 A; N) }! n0 X# ~; w9 M: Q6 R6 W1 R$ h( t: \& e
PDAWIKI 和 Python 的基情所在:! ~  E" N. v: O1 f9 s
- [索引] GitHub 等地和词典有关的 http://www.pdawiki.com/forum/thread-16586-1-1.html
/ G0 |# U$ U; l; `9 R, P' E# {
) b1 t; |0 a/ l0 i感谢诸位的分享。
0 J/ A0 X  [; ~5 Z% v- r3 |5 n# i
9 x5 v" z& j: A::
! n% @  O5 t3 Y- readmdict.py https://bitbucket.org/xwang/mdict-analysis
9 m9 e7 b4 G1 o0 U3 T! Z- n# ]( g7 r, w- writemdict.py https://github.com/skywind3000/writemdict
2 y' C7 m6 t/ c3 t3 J' x
$ X2 H" g  `* D2 s3 b1 \! z5 c! U1 E- 最新版 writemdict 生成大型mdx 解决 MdxBuilder 词条多崩溃问题 https://www.pdawiki.com/forum/thread-20577-1-1.html
, X- I9 n% m7 R" T( t, X  q    - https://github.com/skywind3000/writemdict6 }- L1 @) c9 e, ?& v, G4 ^2 t  |' o

0 f! s" K9 _& u9 O. N9 Z0 y0 y3 d7 q( N7 E  j4 O( r
::光盘提取
9 Z+ F; x3 O8 G5 Z1 b* V- https://github.com/superfan89/IDMSKconv 注意,只能提取某些光盘。
& f* Q7 |, j2 ?2 M, A8 _& R* A( i
# e* a9 D; |/ O- g, M! L$ ~- pyglossary http://t.cn/RzcE4RQ {晕。。。英文也屏蔽,转了短链接}' V& C# ]' O$ @/ F  |9 V+ k) N  }
  - [索引] bgl 转 mdx / txt 的一点经验[20170919] http://www.pdawiki.com/forum/thread-21725-1-1.html  }, w* v# J. _- u, O* i

% _! v7 D/ E2 m' Q2 }5 i+ x::爬虫:7 B$ O* s/ ?# m0 L  n7 s
- http://www.pdawiki.com/forum/space-uid-176917.html https://github.com/OZv?tab=repositories% I; A1 @1 k: Q* Y8 s  C3 n9 c
- CALD http://www.pdawiki.com/forum/for ... &fromuid=147948( b2 T8 ^/ ]- ~* \. P8 f

0 g5 _+ S0 ^. L; u1 }+ w::
3 }! x* T5 g- Q- https://github.com/PurlingNayuki/UniversalDictTools-DictUtils0 v2 L1 y1 }& o' d& v( w9 g
2 m6 S' H; c2 b3 K% z: ^1 w9 O& R
- CC-CEDICT 制作脚本 http://www.pdawiki.com/forum/thread-14040-1-1.html
$ X' {! Y( {7 l) G) p- FOLDOC 制作脚本 http://www.pdawiki.com/forum/thread-16004-1-1.html
/ Z8 ]$ H* F1 B- 金山词霸提取脚本 http://www.pdawiki.com/forum/thread-7100-1-1.html 注意,只能提取某些版本的某些词典
5 G/ r! o! [) w, H; g$ h2 ?% r- 有道词典提取脚本 http://www.pdawiki.com/forum/thread-7022-1-1.html 注意,只能提取 n 年前有道词典的离线数据
1 F4 j; x( V$ @: b$ C$ ~- w# e. z* ]( I" S" ~- A
- [索引] 写了个小脚本自动做 / 短语拆分 http://www.pdawiki.com/forum/thread-18376-1-1.html. l$ t9 N- m: C% z8 e; L0 e
' D" ^! ^2 H7 [. W# z% q  U- h" ^
:: GoldenDict 外部程序
  z, v  M4 y& x- Z1 Y4 g( |, R0 z9 L* \! A& ]
- [GoldenDict] GoldenDict 调用外部程序制作词典 (2017/10/17) http://www.pdawiki.com/forum/thread-21878-1-1.html
. K6 L  O: C# q& ~4 L* o/ w1 M0 P2 w% U4 g
- [作品展示] GoldenDict + Python 调用有道翻译[...] http://www.pdawiki.com/forum/thread-21988-1-1.html3 V2 c# X# a: Q" |# p* R% \# W0 Z; e# @
- [作品展示] [完成] 商务版 蓝登书屋 韦氏英汉大学词典 图片版 http://www.pdawiki.com/forum/thread-22021-1-1.html& E8 e% N6 P. ^7 G( O
3 x! n, V5 n" }. i- x$ O6 A
- [作品展示] GoldenDict + Python 调用谷歌翻译[...]  http://www.pdawiki.com/forum/thread-22027-1-1.html* N5 M# h8 }4 p2 p

0 ]1 ?$ a. T' F6 H- [索引] zz 终端查词 http://www.pdawiki.com/forum/thread-22032-1-1.html
( \0 o/ p6 G3 o2 D- [索引] zz Online dictionary based on the console,基于控制台的在线词典 http://www.pdawiki.com/forum/thread-22031-1-1.html8 e4 S# C$ I0 |
- [索引] zz python-translate(Python 命**行词典) http://www.pdawiki.com/forum/thread-22028-1-1.html* S! d# q, o. ~
: V& H' `3 V# d; t% l6 c
- [索引] zz 使用Python开发跨平台的单词助记程序 http://www.pdawiki.com/forum/thread-21978-1-1.html
, j2 [# p. q1 d' o3 j$ `9 G4 |; ^
. v: d' Z( G8 y2 D- 文字版 PDF 转 HTML https://github.com/coolwanglu/pdf2htmlEX
1 k5 K3 Z/ z! z8 z7 E% p2 \% U
! h4 z: y9 m8 P; v- @: e  s3 S" M

评分

5

查看全部评分

本帖被以下淘专辑推荐:

  • · 工具|主题: 61, 订阅: 27

该用户从未签到

发表于 2017-11-17 13:59:08 | 显示全部楼层
本帖最后由 henices 于 2017-11-17 14:00 编辑
* ]8 P0 N, w+ d0 c" n* T' w+ b
Oeasy 发表于 2017-11-17 10:05$ i! \! Y7 }/ M& d+ i
我突然想到,是不是可以利用 Python 在 GoldenDict 上实现我的夙愿?
% s4 D" H. X6 X. n% t: ~, X# }! Y1 S6 L$ r; T
- [GoldenDict] 如何实现重复播放查 ...
* g! T8 E6 }1 M  w( ?
/ e5 W- B5 {+ J6 H/ x8 B3 z
cvlc --play-and-exit "http://dict.youdao.com/dictvoice?type=1&audio=hello"
, Q  S' d/ ]& n* Q% scvlc --loop "http://dict.youdao.com/dictvoice?type=1&audio=hello"

该用户从未签到

 楼主| 发表于 2017-11-16 20:23:22 | 显示全部楼层
! D4 a- t7 \8 t7 S
: k/ X. B& |) J- ~
假设我是某大词典的编纂者,我可以编几个脚本,定期把各大在线**词典的词头爬一遍,和自己现有词典的词头对比一下,把别人收录了自己尚未收录的给加进去……
! U5 r8 ~, x8 Q% q- N; |: z  k. [& a4 l2 o- y

% t( N$ z" j% W4 F5 v

该用户从未签到

 楼主| 发表于 2017-11-16 20:33:25 | 显示全部楼层
) B" E  c4 |2 q4 J3 l
利用这个 https://github.com/xpgeng/advanced_freeq 可以实现
: P7 W$ A8 D( F- i2 k+ z::A Python script to generate word frequency report of English text, pdf, epub, mobi.+ S$ M& c! q# E/ q
- 有人这么背过单词吗?找本书,先list生词,背完后去看书。 http://www.pdawiki.com/forum/thread-20773-1-1.html
! b" D2 \% f1 O% D/ E+ b9 W0 x3 ~# y& W, B8 ?0 ~: C
9 q8 o' Y0 F4 I% Y" I

$ J6 g' V$ d- a1 o2 ]8 L2 {

该用户从未签到

 楼主| 发表于 2017-11-16 20:57:51 | 显示全部楼层
5 Y  t. S4 V" y/ j) I
- 基于Python自然语言处理工具包在语料库研究中的运用 http://kns.cnki.net/KCMS/detail/ ... ename=KMYJ201505012# ?- Z( @4 U1 u( v) D, d
6 }/ M1 x0 q: ~, u$ z0 `5 q! Z
- 基于语料库的非**专业学生写作词汇衔接手段研究 http://kns.cnki.net/KCMS/detail/ ... ename=2010129315.nh
1 A5 L2 Y% V3 ^; T; o- X5 m- 基于**口语语料库的新通用词词表效度研究 http://kns.cnki.net/KCMS/detail/ ... ename=1015909971.nh7 z4 s' j# ?1 C6 b8 C8 {% o
. E, s$ }0 r' h

1 z5 G" W/ `- y

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

评分

1

查看全部评分

  • TA的每日心情
    开心
    2023-2-22 17:39
  • 签到天数: 1752 天

    [LV.Master]伴坛终老

    发表于 2017-11-17 05:45:13 | 显示全部楼层
    感谢O大的整理和分享!自己也算是经常逛论坛了,居然没发现论坛有这么多好东西。O大有心了!

    该用户从未签到

     楼主| 发表于 2017-11-17 10:05:35 | 显示全部楼层
    9 ]0 A7 z) o5 i/ ~$ `# ]# v" x0 N
    我突然想到,是不是可以利用 Python 在 GoldenDict 上实现我的夙愿?2 J8 J5 e* @5 o
    6 E. S1 T; r$ C' Q9 [& H5 S; e
    - [GoldenDict] 如何实现重复播放查询词或者播放所有音频?  http://www.pdawiki.com/forum/thread-21905-1-1.html6 \" _2 H* s2 E3 ?5 @3 O4 N

      w- H8 F! Z9 ^, j4 ]  n5 C8 y
    / ~; S& |' Z% i4 E, c

    该用户从未签到

     楼主| 发表于 2017-11-17 17:14:06 | 显示全部楼层
    本帖最后由 Oeasy 于 2017-11-17 17:15 编辑
    % ?5 J+ ~1 E3 G7 C7 Y
    henices 发表于 2017-11-17 13:59
    7 G  n1 E& H2 o, \5 H. L# icvlc --play-and-exit "http://dict.youdao.com/dictvoice?type=1&audio=hello"' L5 }& t- \9 W2 ?4 f" ~
    cvlc --loop "http://dic ...

    2 w8 X' M; ]* y8 l
    9 J2 D) K" w, u( B9 ?8 P. v
    0 l8 f1 u! G, I6 a  Cool!
    0 j- i7 u9 v/ d/ B# Y' }- P& ^7 p. c4 s# p
    留俩简单代码,备案。, G9 @) c6 Q$ ?) I6 Z! q+ {

    % Y$ k' F* V8 Q  m; \  }6 iWindows 下,会用默认的播放器,播放  us_stencil1.wav 文件。% s4 d5 ~7 |* ]

    ' Z3 o! `- u5 ]! s) m
    1. import webbrowser
      - m0 |$ y+ ?4 }6 m

    2. 4 D. l& O' B: M9 t9 `
    3. wav_file = r"D:\us_stencil1.wav"
      % \" a, ~4 ^$ [( n
    4. webbrowser.open(wav_file)
      8 V, a  F: l! Y
    复制代码
    ) `( m9 G, |( q+ |# B; D
    / i& [( `8 b8 @+ h- _" K4 L! j
    # N! ?+ j+ V8 K; H& s
    1 X4 |8 d4 `  G. r8 v
    1. import os
      , g/ V+ a5 O+ N4 U8 `7 H1 [  Z& G

    2. : j- l. b0 x1 G' m# s
    3. wav_file = r"D:\us_stencil1.wav"6 Q2 O$ r) k- ~& K  B: J
    4. os.startfile(wav_file)
    复制代码

      N  b6 x/ ?: s1 Z  Q' w5 X' P' k5 k- @+ j
    ! p5 }, F, R( E, I' a

    5 x4 m8 |% V. R% N0 ^0 Z9 y

    该用户从未签到

     楼主| 发表于 2017-11-17 17:15:52 | 显示全部楼层
    3 D& ^7 M3 x3 o& F( o
    这个很有意思,感兴趣的朋友可以试试。+ I' A7 }7 B) z- c9 o5 a/ ]( N
    http://www.pdawiki.com/forum/for ... &fromuid=147948
    7 h7 {4 S9 `: \' Q7 x  j: }9 I! h; B+ U3 R
    3 Q6 W. P; e! X0 [/ ~: u

    该用户从未签到

     楼主| 发表于 2017-12-26 23:35:26 | 显示全部楼层

    , Q# u9 e5 a+ S4 r: p4 X  e- FoolNLTK https://github.com/rockyzhengwu/FoolNLTK; R5 Y! _1 O8 d- L! ~. Q

    2 F9 @$ K# _4 p3 h
    : `4 e2 S7 l: F5 d7 [
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2018-1-4 23:07:39 | 显示全部楼层
    本帖最后由 喬治兄 于 2018-11-13 10:41 编辑 5 y$ E2 z/ }) l/ H; @! c3 r
    ( N% T$ z9 N* e- R, Z: g
    文字版 PDF 转 HTML https://github.com/coolwanglu/pdf2htmlEX- m5 , q% y- r, [. z# b1 N/ Y* H
    The code seems not working.....5 N4 d  ^: ~4 W' l0 z
    2 o4 {& B' O3 e! Y8 z: {
  • TA的每日心情
    开心
    2023-1-18 23:24
  • 签到天数: 211 天

    [LV.7]常住居民III

    发表于 2018-11-6 09:12:56 | 显示全部楼层
    本帖最后由 kyletruman 于 2018-11-6 09:14 编辑 8 W- A, j( Z+ |8 a- a' X6 Z
    喬治兄 发表于 2018-1-4 23:07
    9 r8 N6 ?( ^+ a' h; n9 m( L+ k! P"文字版 PDF 转 HTML https://github.com/coolwanglu/pdf2htmlEX- m5 "
    # R! D( ~  t8 |6 _* |! g: TThe code seems not working.....
      F9 L( L0 c; N
    你提供的网址打不开,请重新编辑帖子,勾选右上角的“纯文本”,然后再保存帖子,超链接才能正常显示
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2018-11-6 10:11:40 | 显示全部楼层
    kyletruman 发表于 2018-11-6 09:12
    / r! m, X" k( r& d* H你提供的网址打不开,请重新编辑帖子,勾选右上角的“纯文本”,然后再保存帖子,超链接才能正常显示{:4_9 ...

    - r0 V; Z( Q$ B, n4 Lkyletruman 兄:
    8 K1 r6 ]+ _( P# K# Q! f- Q好像那個鍊也是掛了
  • TA的每日心情
    擦汗
    2019-11-13 23:25
  • 签到天数: 44 天

    [LV.5]常住居民I

    发表于 2018-11-12 13:27:44 | 显示全部楼层
    学习了,辛苦楼主
  • TA的每日心情
    开心
    2019-8-21 08:44
  • 签到天数: 163 天

    [LV.7]常住居民III

    发表于 2018-11-16 10:49:53 | 显示全部楼层
    分享一个简繁-繁简转换 python 包
    : e& c3 Y% u/ W
    ! o  x% @9 H' q4 [6 a& k8 V
    1. pip install opencc-python-reimplemented
    复制代码
    " U8 V$ t" K! J5 q$ ?7 E3 A8 K& A
    & u2 Z7 k' L; d! q5 J9 k
    原 opencc-python 包在 python3 里装不了,有人说要整什么 distribute_setup.zip, 某*sdn上居然有人50 个点卖这个文件 ,买者跟帖还说没有用。
    ' n: T6 ]; @1 n8 X* i; f' M
    , [* T3 f' M- s想着说不定有网友也在折腾繁简转换,希望有人看到可以节省一点时间。

    该用户从未签到

    发表于 2020-2-3 15:00:56 | 显示全部楼层
    Thanks for your great work.
  • TA的每日心情
    开心
    2024-8-19 14:29
  • 签到天数: 18 天

    [LV.4]偶尔看看III

    发表于 2024-6-24 16:50:30 | 显示全部楼层
    谢谢大佬,节省了很多时间
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-23 23:44 , Processed in 0.025688 second(s), 26 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表