掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1290|回复: 4

[新版发布] django-mdict工具

[复制链接]
  • TA的每日心情
    慵懒
    2022-11-19 00:41
  • 签到天数: 703 天

    [LV.9]以坛为家II

    发表于 2020-10-2 12:46:02 | 显示全部楼层 |阅读模式
    本帖最后由 jiangnianshun 于 2020-10-2 12:44 编辑 : b% m6 m4 i. D8 o, G/ h4 C
    7 M8 ~& x" C7 P5 w4 ~4 N. x4 G' |
    django-mdict是django实现的mdict词典查询工具。django是python的网站框架。
    5 I6 l- c" X, T1 t0 f! i本意是想解决手机存储容量不能装下所有词典的问题,后来换了大容量手机就没有这个问题了,摊手。; O$ ^! Y+ i9 s1 M0 z1 P
    界面如下
    0 S; V5 ~+ R/ d6 T& C; g( V$ v- l$ L$ {1 s
    + \( T; `" T& t2 I2 n
    ; S. x9 m3 \8 D! F+ l" W+ A5 c

    3 g% c" c- I" W  Y% Q& A2 N2 _感谢各位好心人制作的词典和工具,本工具主要做了功能集成:
    ) r0 {7 o7 O$ Q; n8 r! V
    / W2 [* Q% R5 ~* R$ Y- v一是内置词典,是一个内置数据库,用的是mathjax和ckeditor,支持latex公式(上面第四个图),可以导出为mdict格式的txt,我是把它当笔记用。1 m$ `& ^6 e; Y2 F0 y

    + T; k1 M' g& h( ~$ p* k二是拆字反查,修改自chaizi.py,已集成到查询功能中,比如查王八,返回王八、兲、玐(上面第一个图)。5 k& P8 A3 a/ |3 N4 W7 Q, l
    github hanzi_chaizi:https://github.com/howl-anderson/hanzi_chaizi4 M' P# f5 W. z& x. m3 k$ b
    github chaizi:https://github.com/kfcd/chaizi, s. g" f( ~+ V6 D% B
    开放词典网拆字字典:http://kaifangcidian.com/han/chaizi  ~" @% p& b0 c- d- s1 M5 P, d
    0 M$ j5 {$ |2 h# {8 \. p4 R
    三是部件检索,集成了部件检索和全宋体,拆字反查仅支持常用字。) ~  S3 N: F/ H: V" W# S
    全宋体大小95.5MB,第一次下载会很慢,之后会直接读取缓存。
    7 R8 s6 W  n6 o0 T' l. ]! }. k' YWFG博客:https://fgwang.blogspot.com/; j2 k- U+ k, U. V! g* ]( ^0 P, ?
    pdawiki部件检索和全宋体:https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=23133&highlight=%E9%83%A8%E4%BB%B6%E6%A3%80%E7%B4%A2
    ) n4 ]* M7 {3 [9 b9 ?, \4 O2 f- \
    四mdict查询功能修改自readmdict.py。7 E2 b+ f. L$ }% B# [2 V+ |
    bitbucket mdict-analysis:https://bitbucket.org/xwang/mdict-analysis/ Q+ b+ x6 P' D" N3 Y7 d2 n
    github mdict-analysis:https://github.com/csarron/mdict-analysis/blob/master/readmdict.py2 t1 k1 s# u# I7 E% E
    6 t* h7 ?. f+ _' B; P. [* D
    五支持繁简转化和全角字符转化
    4 u5 S) r( x6 B" I
    " I) \- L* p! l六划词工具使用tesseract和cefpython3,目前还存在很多问题。& W! W* F, }5 W4 r( y1 U

    : c) D, `# ?6 T7 K# F建议图片类词典使用双栏版,因为手机浏览器可以直接双指缩放,双栏不影响阅读,如果用单栏板,在手机没有问题,但是在电脑浏览器上会特别细长。% N; w( q8 R" i/ i
    7 h1 E4 W; `  ?/ ^( s* A

    ! z, i  g9 e" U( i, Z1 u
    4 S) i2 S7 }% t% {. [, b安装:+ x$ D) r: y* q, s3 y6 o- b& X
    部署比较麻烦,具体见readme.md和documentation.md。
    # U# j7 N$ i: N+ O) a
    , {) Q3 S9 K0 X性能:
    ! J+ L8 y3 E  Q" gwindows建议部署在wsl1 apache上,因为django在windows下不能用多进程(mltiprocessing在windows下需要name==main保护),速度大约差一倍。, u' h- k( @# w% B

    9 a- d0 P9 [* b在线demo演示(仅演示,不提供词典下载,过段时间会关闭):http://81.68.207.87/mdict
    + @. X: D4 t* w5 Z下载:+ A! M+ L/ G: Q8 m, E* y5 A
    链接:https://pan.baidu.com/s/1aADd97809jeGYOdOOdBouw
    4 ?' J  h7 c$ j* i4 o( O& q6 v提取码:47uf 3 s! R8 w. \8 T, m1 X: |
    复制这段内容后打开百度网盘手机App,操作更方便哦, ?2 \" l+ g6 j! `* s7 u3 c
    github:https://github.com/jiangnianshun/django-mdict
    7 h0 D! H2 b; q1 f' x- }- [$ A! o# t& e1 U4 E, c

    ' e, w' x2 K: h7 @
    2 C) i& V7 _6 _" d: u

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    评分

    4

    查看全部评分

  • TA的每日心情

    2020-8-15 10:40
  • 签到天数: 146 天

    [LV.7]常住居民III

    发表于 2020-10-3 07:18:06 | 显示全部楼层
    tesseract  OCR的数据太大,全部下载太烦,下载单独的语言包感觉也不友好+ b& e. z; H. u1 F4 v, f, {! o& ^
    cefpython3 怎么感觉有些鸡肋,如果用 pywxwdiget 或 pyqt,那么他们自带了WEB引擎,为什么要用cef?
    & O1 S1 j0 P6 _6 l' w# T: R% x& i  b( {+ B
    还有你这个也应当分为 客户端和服务端吧,内容里没有写明,在线demo只是服务端接口。服务端部署太复杂,非专业人士看不懂; h2 a5 I: t8 q% |

    ( ]3 G1 @( G5 |8 @看你的词典解释使用 iframe 方式,它有什么优缺点,我只知道 非iframe 主要问题是  释义代码不规范,tag错位,CSS相互冲突。iframe 方式是否完全解决了这个两个问题?! q/ J# u/ T8 K/ `

    , k- K) B. f# Q9 G, v" r" c8 ^$ H* e5 x2 t2 R5 ^3 Q

    2 p5 L0 ^& b6 @" ]
    . c1 v+ q$ J5 w0 y! f: o/ z# K
  • TA的每日心情
    慵懒
    2022-11-19 00:41
  • 签到天数: 703 天

    [LV.9]以坛为家II

     楼主| 发表于 2020-10-3 08:00:58 | 显示全部楼层
    zzzz_sleep 发表于 2020-10-3 07:18
    ; Q7 u7 j+ c% M8 i3 Ftesseract  OCR的数据太大,全部下载太烦,下载单独的语言包感觉也不友好
    & I6 h# W4 A, n% P2 F8 h/ S- v8 bcefpython3 怎么感觉有些鸡肋,如 ...
    - u3 h+ d0 C# K7 N& \; c7 ?& \
    对。cefpython3鸡肋,实际上整个工具都比较鸡肋,因为部署在云服务器上,对cpu和网速要求高,只能部署在局域网,但部署在局域网,用台式和大容量手机就解决了,鸡肋这点没错。为啥用cefpython3,因为边学边做,还没学到pyqt。
    ( w: n3 o, Z5 V+ e; _3 y: m' n& _是,分服务端和浏览器端。, ?7 p$ F9 a$ ?; e& [( K
    iframe能解决css冲突,代码规范这方面和非iframe是一样的。
  • TA的每日心情
    开心
    5 天前
  • 签到天数: 679 天

    [LV.9]以坛为家II

    发表于 2020-12-2 15:23:58 | 显示全部楼层
    谢谢,下来看看!
  • TA的每日心情
    开心
    2021-1-20 14:12
  • 签到天数: 12 天

    [LV.3]偶尔看看II

    发表于 2021-1-5 06:55:29 | 显示全部楼层
    非常不错,有几个地方能改进一下就更好了:; m# s- D$ G( _1 P% n3 A+ N
    1. 词典选择直接放在查询页上,因为这个经常需要Enable和Disable
    . A' l/ c  L, ^; A2. 默认会发音,最好给个控制选项,可以去掉默认发音
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-18 22:18 , Processed in 0.056935 second(s), 9 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表