掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1668|回复: 4

[新版发布] django-mdict工具

[复制链接]
  • TA的每日心情
    慵懒
    2022-11-19 00:41
  • 签到天数: 703 天

    [LV.9]以坛为家II

    发表于 2020-10-2 12:46:02 | 显示全部楼层 |阅读模式
    本帖最后由 jiangnianshun 于 2020-10-2 12:44 编辑 3 n" ?5 a7 n) C- x
    / N  m9 t3 x& |- w+ o: p& d
    django-mdict是django实现的mdict词典查询工具。django是python的网站框架。) D2 A# R# v- ?: }) {2 V& W5 t2 m4 e
    本意是想解决手机存储容量不能装下所有词典的问题,后来换了大容量手机就没有这个问题了,摊手。
    ' O3 w0 P+ w  W: g4 I, M6 I界面如下! l! A% e) a& u# p3 I
    1 v* n; M% h$ c$ z
    : M# V( ?3 W9 T0 b; K% |" d$ u

    / A& {6 n. T. U' J) g$ h' Y5 K! h8 u  N# m: o6 h4 q+ N+ Y( S
    感谢各位好心人制作的词典和工具,本工具主要做了功能集成:
    + S: L% J; u6 x4 v: q5 K4 P
    % t1 q  D0 e( S3 b4 m一是内置词典,是一个内置数据库,用的是mathjax和ckeditor,支持latex公式(上面第四个图),可以导出为mdict格式的txt,我是把它当笔记用。
    8 I5 F$ |4 d* B* D8 R. _8 \; u7 q1 d6 o4 r8 D
    二是拆字反查,修改自chaizi.py,已集成到查询功能中,比如查王八,返回王八、兲、玐(上面第一个图)。  k9 b/ O- J: D) G; H3 F% }$ T5 @
    github hanzi_chaizi:https://github.com/howl-anderson/hanzi_chaizi- h+ [) l- }6 i* l$ |
    github chaizi:https://github.com/kfcd/chaizi4 U! ?2 [- u  @& b2 B+ `, z6 u
    开放词典网拆字字典:http://kaifangcidian.com/han/chaizi. J5 v5 H  c, p' w( l5 I

    0 i+ ^7 r$ u. e; V三是部件检索,集成了部件检索和全宋体,拆字反查仅支持常用字。
    * x# t$ y3 o5 h, D& t全宋体大小95.5MB,第一次下载会很慢,之后会直接读取缓存。2 P- ], y9 z% S$ E  O, {) M$ v# f1 O
    WFG博客:https://fgwang.blogspot.com/
    6 y' t- r7 G4 r/ R+ \" V0 E; }pdawiki部件检索和全宋体:https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=23133&highlight=%E9%83%A8%E4%BB%B6%E6%A3%80%E7%B4%A2
      F/ D3 l' x) A( F# t* E" f4 T$ @
    ( [5 o/ m0 N5 D" N" r! b四mdict查询功能修改自readmdict.py。
    , B1 ?5 U8 b' e; P4 [( q( u; Obitbucket mdict-analysis:https://bitbucket.org/xwang/mdict-analysis
    ) [$ X, Q' R" g) y5 f. i" n) rgithub mdict-analysis:https://github.com/csarron/mdict-analysis/blob/master/readmdict.py
    ! z) a" w; `7 E, E0 a# V. v
    6 y7 h3 W, D3 g# @五支持繁简转化和全角字符转化( L( x, n. q8 u8 w  G$ v. {
    ! y% b) D: |* M. ]& |1 ]
    六划词工具使用tesseract和cefpython3,目前还存在很多问题。( ]+ K% g3 c% u" l

    $ \$ N, P/ ~2 G/ |* r  X建议图片类词典使用双栏版,因为手机浏览器可以直接双指缩放,双栏不影响阅读,如果用单栏板,在手机没有问题,但是在电脑浏览器上会特别细长。6 r3 u) ]6 f! S( I

    * S, C/ q% S! i8 ~9 q, R3 Y- i- W* j6 k$ T3 Q# H  V4 v( N- h

    # l9 u5 S$ N! a  U; F$ S安装:
    ' t7 N6 n" [$ @8 w/ w部署比较麻烦,具体见readme.md和documentation.md。
    / S2 f% F9 @# ]) _# k+ j" v% A
    , s4 x* M  Y+ \' z性能:
    . b- ?  ?: }2 d; K, D+ W' `0 Lwindows建议部署在wsl1 apache上,因为django在windows下不能用多进程(mltiprocessing在windows下需要name==main保护),速度大约差一倍。
    + g1 T5 v: }% Z: E6 d8 T9 B$ G" m2 b4 f1 T
    在线demo演示(仅演示,不提供词典下载,过段时间会关闭):http://81.68.207.87/mdict
    - ?1 c  m, S5 M8 }$ m下载:
    + d  h9 D* c! `3 {9 B/ x链接:https://pan.baidu.com/s/1aADd97809jeGYOdOOdBouw
    1 f6 Z4 W- N0 z% J+ M" u提取码:47uf
    8 p" D4 h% K/ i  i2 q. z复制这段内容后打开百度网盘手机App,操作更方便哦# v% s6 O$ i; J, Q/ K
    github:https://github.com/jiangnianshun/django-mdict
    1 y3 B; E5 M: k; u( U% z% ~9 F. N/ Q6 m# E3 D" S6 B
    6 o6 n2 ]4 {- ~$ q% J4 L* u

      P' n8 y% _, e  T9 h# T

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    评分

    4

    查看全部评分

  • TA的每日心情

    2020-8-15 10:40
  • 签到天数: 146 天

    [LV.7]常住居民III

    发表于 2020-10-3 07:18:06 | 显示全部楼层
    tesseract  OCR的数据太大,全部下载太烦,下载单独的语言包感觉也不友好* w8 ]6 W+ w$ [  P  s3 k$ c) }
    cefpython3 怎么感觉有些鸡肋,如果用 pywxwdiget 或 pyqt,那么他们自带了WEB引擎,为什么要用cef?
    1 x5 Z, I( {9 F* z4 P& K0 J
    - ?0 C. e- X8 B/ B2 ^1 @还有你这个也应当分为 客户端和服务端吧,内容里没有写明,在线demo只是服务端接口。服务端部署太复杂,非专业人士看不懂
    : H4 S5 ^5 L; R9 Z
    ( h6 ]* |% Y, t6 ?看你的词典解释使用 iframe 方式,它有什么优缺点,我只知道 非iframe 主要问题是  释义代码不规范,tag错位,CSS相互冲突。iframe 方式是否完全解决了这个两个问题?
    & M) W0 y5 A5 h3 p3 ^* G& m+ ?$ d) U* A3 `& X
    ' H( d8 o! E, ^3 e1 W" g
    , ]- G" }0 U2 H! F* E1 p

    : S& Y% Y+ G. t7 `  J
  • TA的每日心情
    慵懒
    2022-11-19 00:41
  • 签到天数: 703 天

    [LV.9]以坛为家II

     楼主| 发表于 2020-10-3 08:00:58 | 显示全部楼层
    zzzz_sleep 发表于 2020-10-3 07:18
    - o1 M: C* _5 E" itesseract  OCR的数据太大,全部下载太烦,下载单独的语言包感觉也不友好4 I6 ?" A6 `& z* {2 R- `6 j. m5 j
    cefpython3 怎么感觉有些鸡肋,如 ...

    ) d6 g/ q: m: h3 S+ l% D, I% H1 {对。cefpython3鸡肋,实际上整个工具都比较鸡肋,因为部署在云服务器上,对cpu和网速要求高,只能部署在局域网,但部署在局域网,用台式和大容量手机就解决了,鸡肋这点没错。为啥用cefpython3,因为边学边做,还没学到pyqt。8 J& v' S* e2 g  X9 P% u4 X
    是,分服务端和浏览器端。
    7 F0 O+ k+ j+ Siframe能解决css冲突,代码规范这方面和非iframe是一样的。
  • TA的每日心情
    开心
    2024-4-13 19:35
  • 签到天数: 679 天

    [LV.9]以坛为家II

    发表于 2020-12-2 15:23:58 | 显示全部楼层
    谢谢,下来看看!
  • TA的每日心情
    开心
    2024-7-1 10:33
  • 签到天数: 13 天

    [LV.3]偶尔看看II

    发表于 2021-1-5 06:55:29 | 显示全部楼层
    非常不错,有几个地方能改进一下就更好了:
    , j: p  w) d- M: e) E& q1. 词典选择直接放在查询页上,因为这个经常需要Enable和Disable1 u! N6 B" L7 a- h
    2. 默认会发音,最好给个控制选项,可以去掉默认发音
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-2 18:12 , Processed in 0.021691 second(s), 23 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表