掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 704|回复: 9

[求助] 请教[词条列表]的制作方法

[复制链接]

该用户从未签到

发表于 2016-8-7 22:41:12 | 显示全部楼层 |阅读模式
+ a7 E7 ~  W4 c/ u

- u5 J+ h- ^+ `- q0 L如idict大大所做的词典一样,最上方的[词条列表]功能如何实现呢,这功能实在太棒了,自己想修改其他的字典

该用户从未签到

发表于 2016-8-8 00:00:21 | 显示全部楼层
你好, 谢谢关注.
8 J* t3 e+ K4 Y/ a( {! r你是指帖子图一的顶部的词头/性列表吗?
' T+ G; X: Y8 V(如果是的话)是参照大神的构思做的. 在下写的是极其丑陋, 很多逻辑错误和不规范, 就不公开误人了! 词典公开是基于源文件公开. 在下没有改动原文本. 所以没敢误人.
( H2 K% O, P  E但可以说说大概的流程(在下较为呆呆, 就用呆呆法了, 没有逻辑可言).5 d7 n. b0 b4 o/ f( S' }9 V# P
# 使用Python解压原mdx/mdd, 读取txt, 输出词条列表. 和拆解以每一词条为一个内容的文本文件(小文件方便阅读), 而词条列表里, 配以唯一序号和对应词条文件名.
: j3 q' `4 V' {. V" m2 r! D# 将词条列表排序. 确保相同词条排放在一起. 这样就可以放心合并词条了.
& e% r' ^* I1 v' D/ T# 读取词条列表, 再读取相应的词条文本内容里词性资料(使用Beautiful Soup, 用lxml解释器), 删除不需要的, 生成词性列表, 再合并文本内容(如有其他的功能也可一并作处理).
  P3 `" g" q( y4 t" {9 U# x; j9 N  M# 然后再逐一合并成mdx格式的txt. 再用MdxBuilder打包即可.5 W" C6 Y, @+ c2 r
6 O, A& ~/ I$ U6 e  G2 I
论坛里有很多大神都公开了他们的代码. 如bt4baidu, 但凡抓网站的都有原码和原数据. TA的代码很逻辑, 在下能力有限是读不通. 也提供逻辑哲学(帖子大多顶置), 还提供图片处理代码呢. 犀利啊.
7 j# n4 W4 P6 J9 e( B2 T其中imfirefly大神的代码里有很多注解.
6 t5 A, _7 D7 C0 U[2016.07.21]CC-CEDICT(MDX+MDD: 4.78M)# Q/ s  r( @- Y) C* Q' U$ |
https://www.pdawiki.com/forum/fo ... &fromuid=201568
* X1 C' u7 N5 B3 M; D) K$ G(出处: 掌上百科)3 j: W' ~2 P4 N5 X  z6 s
在此向他们表示严重的致敬! 同时希望对你有用.0 P2 U, I# M3 L' L( s+ |3 T/ S
谢谢.

该用户从未签到

 楼主| 发表于 2016-8-8 00:03:20 | 显示全部楼层
idict 发表于 2016-8-8 00:00, K; k( k. u3 Q) H2 ^) D' \
你好, 谢谢关注.
3 b' F: R5 D: t. [你是指帖子图一的顶部的词头/性列表吗?4 x5 h1 G; ]0 H. n
(如果是的话)是参照大神的构思做的. 在下写的是 ...
1 H$ j3 y! ^. j
我忘了把您的回复贴上来给大家参考多谢大大

该用户从未签到

发表于 2016-8-8 00:25:46 | 显示全部楼层
wa1314159 发表于 2016-8-8 00:03: i5 N3 C$ {  S* X
我忘了把您的回复贴上来给大家参考多谢大大
! C- a7 p, v& ]/ M
喔喔, 那是[消息]噢, 如果是公众利益可以啦. 如果有双方私人东东, 要保密哟... 4 Y- ~! U, O, }  x& x2 U
这半分我赚了好吧.

点评

哈哈  发表于 2016-8-8 11:58

该用户从未签到

发表于 2016-8-8 01:32:05 | 显示全部楼层
置顶帖里有前辈大牛们开发的快捷工具和教程的,非常非常的简单,照猫画虎,点几下鼠标就可以了。

该用户从未签到

 楼主| 发表于 2016-8-8 12:09:45 | 显示全部楼层
onlyXXenglish 发表于 2016-8-8 01:326 f2 y2 E# K5 y+ ~
置顶帖里有前辈大牛们开发的快捷工具和教程的,非常非常的简单,照猫画虎,点几下鼠标就可以了。
- O8 C6 B6 V4 d7 V9 g
only大大应该指的Dict Source Editor咯,如图,我似乎完全没找对方向
6 U! k& f, L% W2 y/ L* j8 @
  z+ A: M. N. S( ^% e- R

该用户从未签到

发表于 2016-8-8 14:19:04 | 显示全部楼层
wa1314159 发表于 2016-8-8 12:090 k( [3 s; r7 I" @* {/ O# U
only大大应该指的Dict Source Editor咯,如图,我似乎完全没找对方向
2 n. k& U$ _5 s
要加入图里正则匹配的内容?: u3 V9 ~7 C) s- K4 Z3 O
勾上parts of speech

该用户从未签到

 楼主| 发表于 2016-8-8 16:02:52 | 显示全部楼层
本帖最后由 wa1314159 于 2016-8-8 16:06 编辑 5 z- q. \6 Q" c) z+ o
onlyXXenglish 发表于 2016-8-8 14:19$ N! l( ^! a+ v1 k. F4 T
要加入图里正则匹配的内容?4 r& f, u$ c" {  u# e3 a; B, p/ k* A
勾上parts of speech

. t/ r; e# V6 x9 X/ b  g/ P9 d+ m' P. C# x- _9 N
1.html里要提取的内容是:<div class="def">试验; 测试:</div>,不知道正则写的对不对,这软件不支持perl写法! u" A4 w& u; D" _2 g! {
2.我只打开了一本词典,这应该也不属于合并吧,,勾选parts of speech,然后combine,只导出了25个单词
7 G, F# R: E, @, C) e9 B软件信息如下:
/ W: h: o* O6 @1 M# E! }Uniting identical head words ...6 b8 ~7 W7 T  t0 d% a3 ?" i
Unite finished.
2 K& t' q4 p% U) UTotal input headwords: 25
4 ~& v2 J  l, l5 ]2 rHeadwords after united: 25- E- c4 ^8 Q1 }4 s# S2 M1 o8 Z
headwords reduced: 0+ ~6 r4 N/ S0 w! G, w- R
United to file: C:\SourceEditor\a.txt) e! _' e! ]- X+ S$ m* H, y2 h
( q* G$ _9 {- ]  n1 e9 X  W( _
导出的txt文件如附件,也有问题,只有如下跳转代码,显示内容不对,也没有<a name=/**/></a>标记
' e, _& t; ^# K) ^
  1. <block>1.<a style="text-decoration:none" href="entry://#_hka1">#        <sup>1</sup></a> | </block>
复制代码

5 N  J$ J$ Y: Q; Q2 I

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

发表于 2016-8-8 18:36:55 | 显示全部楼层

6 d7 ~; m# ?' z3 X8 T简陋地写两行吧,拿去看下就会了。
+ ?! I2 h2 y8 Y: G6 f8 m7 A8 A
/ c1 K7 l# \5 K" s" C5 |* l$ v0 L% N6 ?' O, ]: B! k

6 p  D2 U. e' t8 c/ H: x4 d9 `( i8 H9 q# n
  \4 R+ V& R7 _, i# m5 z, p

: d' R) f7 j2 \' L

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

小黑屋|手机版|Archiver|PDAWIKI |网站地图

GMT+8, 2025-5-8 07:00 , Processed in 0.023598 second(s), 26 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表