掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1292|回复: 4

[新版发布] django-mdict工具

[复制链接]
  • TA的每日心情
    慵懒
    2022-11-19 00:41
  • 签到天数: 703 天

    [LV.9]以坛为家II

    发表于 2020-10-2 12:46:02 | 显示全部楼层 |阅读模式
    本帖最后由 jiangnianshun 于 2020-10-2 12:44 编辑 3 `4 u3 C& H+ _" S( x7 O% L
    # Z- P: C3 @; Z' }
    django-mdict是django实现的mdict词典查询工具。django是python的网站框架。
    0 B5 G1 O# Q% v本意是想解决手机存储容量不能装下所有词典的问题,后来换了大容量手机就没有这个问题了,摊手。1 z# J' z) |" k" Y
    界面如下
    2 J1 k2 ]& _+ H. @$ R, a
    ) `$ T; R) F/ `1 P, [5 w! _* A& q% c! j, E/ ^8 G

    6 z# b3 l. n3 h0 O. X2 N6 ]6 \3 L/ s: N
    8 k1 m# s! |8 Q3 l感谢各位好心人制作的词典和工具,本工具主要做了功能集成:
    * X" E* ]9 q# E: T% R9 x. `( V) T& L9 u3 G4 J0 ]" n+ B
    一是内置词典,是一个内置数据库,用的是mathjax和ckeditor,支持latex公式(上面第四个图),可以导出为mdict格式的txt,我是把它当笔记用。! J: \- x) f9 Y; ?1 f: y2 P# t
    ( O; G4 r. F1 ]% B( j6 q' z: o( T
    二是拆字反查,修改自chaizi.py,已集成到查询功能中,比如查王八,返回王八、兲、玐(上面第一个图)。+ t5 ]5 ~, ~0 k2 _) {. T
    github hanzi_chaizi:https://github.com/howl-anderson/hanzi_chaizi
    3 i- u4 T8 K; U# E4 t3 I+ q0 sgithub chaizi:https://github.com/kfcd/chaizi
    / T- L  u/ m5 S2 b5 \# F开放词典网拆字字典:http://kaifangcidian.com/han/chaizi9 q+ R0 L7 u) O" t! X$ O% O$ K

    $ Q7 s2 z) w/ ~6 ?7 S: N1 _: h三是部件检索,集成了部件检索和全宋体,拆字反查仅支持常用字。8 J; g. z0 R) Y& X) N# y: W
    全宋体大小95.5MB,第一次下载会很慢,之后会直接读取缓存。
    . ?2 `9 r; P, U  xWFG博客:https://fgwang.blogspot.com/, j1 p% A, g: M% X
    pdawiki部件检索和全宋体:https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=23133&highlight=%E9%83%A8%E4%BB%B6%E6%A3%80%E7%B4%A2
    ) B7 B6 E; ]% ?
    4 F) a" N1 o9 @四mdict查询功能修改自readmdict.py。
    2 ?& n, k! L  s! S* @, B, J3 abitbucket mdict-analysis:https://bitbucket.org/xwang/mdict-analysis  b5 I! }1 n. R0 k  n! f- A1 R
    github mdict-analysis:https://github.com/csarron/mdict-analysis/blob/master/readmdict.py1 t1 d6 p3 X  N, j. d' G

    : `! {& f+ g* M4 {五支持繁简转化和全角字符转化
    . d/ z9 g( s# ?/ i! t2 J- f
    # N- p) _: |9 e2 D六划词工具使用tesseract和cefpython3,目前还存在很多问题。
    ) e% |1 z' _6 V! g# G
    + ]+ Z. `/ \2 M9 K建议图片类词典使用双栏版,因为手机浏览器可以直接双指缩放,双栏不影响阅读,如果用单栏板,在手机没有问题,但是在电脑浏览器上会特别细长。6 A/ y& ~" g! D

    1 S8 t6 M6 j" G
    - \! ^6 Z5 p( @7 K+ o
    3 T2 {) q  S5 H/ J0 R- @0 t安装:
    8 S" F) Z! t" H3 N4 o部署比较麻烦,具体见readme.md和documentation.md。9 r$ x% t2 s0 p0 Z7 Q* a8 f4 N
    4 V) d. q; m/ z2 N% {3 M
    性能:
    * Y7 T8 o1 l# [+ Q1 o: vwindows建议部署在wsl1 apache上,因为django在windows下不能用多进程(mltiprocessing在windows下需要name==main保护),速度大约差一倍。" x+ W9 X. p8 y
    3 H% L0 G6 H- t4 A! d' w/ \
    在线demo演示(仅演示,不提供词典下载,过段时间会关闭):http://81.68.207.87/mdict0 Z# t  @: N% t# |$ e2 I* s
    下载:
    9 K: @  J7 `! Q0 @9 p. l  D) N链接:https://pan.baidu.com/s/1aADd97809jeGYOdOOdBouw & E8 A- R7 ]9 M9 M0 W# z7 h
    提取码:47uf ; O# A. f6 j+ a$ g9 J
    复制这段内容后打开百度网盘手机App,操作更方便哦( n% p$ G7 R0 _- @* o4 C& r$ z1 p  [
    github:https://github.com/jiangnianshun/django-mdict4 @8 p8 H! C7 r- r
    1 M9 m# ]; {$ w( w0 Y- p
    1 M( M% ^4 {9 U! Z! [2 d3 e
    ; y8 E( M3 t- c7 q

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    评分

    4

    查看全部评分

  • TA的每日心情

    2020-8-15 10:40
  • 签到天数: 146 天

    [LV.7]常住居民III

    发表于 2020-10-3 07:18:06 | 显示全部楼层
    tesseract  OCR的数据太大,全部下载太烦,下载单独的语言包感觉也不友好7 v: ^$ l+ D4 t; h# b0 j& N. O7 V( E/ Y* L
    cefpython3 怎么感觉有些鸡肋,如果用 pywxwdiget 或 pyqt,那么他们自带了WEB引擎,为什么要用cef?
    * u6 ]6 ~0 s6 R+ R6 f% v7 C' Q4 M- F; x* Y7 M+ Z8 o9 a( |" R0 @
    还有你这个也应当分为 客户端和服务端吧,内容里没有写明,在线demo只是服务端接口。服务端部署太复杂,非专业人士看不懂# ]1 J; k, G" o% g
    8 D) a# t1 I& m5 t0 q9 _/ k
    看你的词典解释使用 iframe 方式,它有什么优缺点,我只知道 非iframe 主要问题是  释义代码不规范,tag错位,CSS相互冲突。iframe 方式是否完全解决了这个两个问题?
    3 \% n" N% G' A; w( y5 I
    ( l6 {) I' S$ P: ^5 ?( o, _8 Y3 l9 C9 y; R& L, |' [

    7 Y" O  Y: Y. Q9 _7 E
    7 I7 L8 f  Z9 J4 b8 y
  • TA的每日心情
    慵懒
    2022-11-19 00:41
  • 签到天数: 703 天

    [LV.9]以坛为家II

     楼主| 发表于 2020-10-3 08:00:58 | 显示全部楼层
    zzzz_sleep 发表于 2020-10-3 07:181 d; |; n& C7 W- m6 b) ^) U4 D
    tesseract  OCR的数据太大,全部下载太烦,下载单独的语言包感觉也不友好
    % Z+ ?7 P0 z) f; Zcefpython3 怎么感觉有些鸡肋,如 ...
    & D) f4 a& e+ H5 r( A8 ]4 Z
    对。cefpython3鸡肋,实际上整个工具都比较鸡肋,因为部署在云服务器上,对cpu和网速要求高,只能部署在局域网,但部署在局域网,用台式和大容量手机就解决了,鸡肋这点没错。为啥用cefpython3,因为边学边做,还没学到pyqt。" T' P9 g6 [+ @
    是,分服务端和浏览器端。
    ' o. g! F& V+ x* z: Viframe能解决css冲突,代码规范这方面和非iframe是一样的。
  • TA的每日心情
    开心
    6 天前
  • 签到天数: 679 天

    [LV.9]以坛为家II

    发表于 2020-12-2 15:23:58 | 显示全部楼层
    谢谢,下来看看!
  • TA的每日心情
    开心
    2021-1-20 14:12
  • 签到天数: 12 天

    [LV.3]偶尔看看II

    发表于 2021-1-5 06:55:29 | 显示全部楼层
    非常不错,有几个地方能改进一下就更好了:5 K, r4 \& }: ~: [; Q$ l0 i6 r
    1. 词典选择直接放在查询页上,因为这个经常需要Enable和Disable
    7 a/ u1 ]% f3 `* y6 j' w& Z2. 默认会发音,最好给个控制选项,可以去掉默认发音
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-19 18:40 , Processed in 0.054720 second(s), 13 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表