我爱mdict 发表于 2014-10-26 00:25:52

bt4baidu 发表于 2014-10-25 21:01
现有的mdx词典,其实足够绝大多数人用一辈子的了

本人前段时间制作、收集了不少,经过一段时间的比较 ...

能问一下那个VOC是啥词典啊?我好像从来没有见到这种缩写啊!

onlyXXenglish 发表于 2015-6-23 23:55:09

bt4baidu 发表于 2014-10-22 20:21
最好带着一个问题,在解决问题的过程中边用边学,比如抓词典;否则泛泛的看书、看资料、做一些不痛不痒 ...

默默点个赞

happlebao 发表于 2015-7-2 11:33:21

针对 IV. 片断索引型网站 说一下。
其实只是你没有发现而已。
ODE: http://www.oxforddictionaries.com/browse/english/
RHD:http://dictionary.reference.com/list/a/
CALD:http://dictionary.cambridge.org/browse/learner-english/

如果不想写爬虫来找索引入口,那么就要用好 Google 。答案肯定就在第一页。
以第二个为例:
inurl:browse | inurl:list site:dictionary.reference.com

PS:最近才发现这里,发现资料很多啊。

peterdocter 发表于 2015-7-7 13:05:42

只要可以完成任务,用什么语言都可以。。。
在python出来之前是perl是抓站首选。。。它才是为正则而诞生的。。。
python其实就是java的脚本代作。。。
linux现在核也不是纯是C,都用C++。。。
所以没有什么最好的,只有适用的。。。
抓站如果不用线程或进程之类,在linux上
shell+sed or shell+awk
wget or curl都可以通杀一大遍。。。。

geolin 发表于 2015-8-24 10:09:17

感谢楼主分享知识和经验。

bt4baidu 发表于 2015-9-12 12:17:54

排版、修改他人制成品小技巧

假如下载了别人制作的词典,对其中某一块的配色、缩进等不太满意,想自己动手改改
或者,看到别人的排版比较舒服,自己制作词典的时候想借鉴一下
结果解开mdd,打开css文件,看到上百行密密麻麻的文字还真是有点晕。。。
这里有个比较省时省力的小技巧,可以快速定位到想找的地方

1、Goldendict里,在想修改的地方点右键,有个“审查元素”:
https://www.pdawiki.com/forum/data/attachment/album/201509/12/120433fopcdppddkc4uu1u.png

2、点进去会打开webkit浏览器的调试窗口,红框圈起来的地方就是了,想借鉴就直接copy-paste到自己的css里完事
https://www.pdawiki.com/forum/data/attachment/album/201509/12/120438zlf58fqlqlf36gag.png

3、修改就用Gettext等工具解开mdd文件,然后打开css改相应的地方
https://www.pdawiki.com/forum/data/attachment/album/201509/12/120444akv8y7hs00zsuy2y.png

收工{:12_410:}

蜗牛慢吞吞 发表于 2015-9-17 13:37:38

原来学习教程在此,得好好研究一下,谢谢你!

bt4baidu 发表于 2015-9-20 10:40:37

Windows下制作词典必备的文本处理软件:

[*]EmEditor
[*]Beyond compare


前者用于编辑,后者用于差分比较
处理300Mb以上的超大尺寸文本文件毫无压力,实在是无比强悍

Langheping 发表于 2015-9-23 21:54:24

The best article ever read on how to get online dictionaries.

lxchen2001 发表于 2015-10-18 19:20:49

学习了!!!!

bt4baidu 发表于 2015-11-3 22:35:33

关于字体,请参考

网页设计中最常用的字体有哪些?(中文和英文)
http://www.zhihu.com/question/19680724

本人用的最多的是Lucida Grande、Helvetica,正文里的斜体字首选Georgia,音标用Lucida Sans Unicode
这几种字体在Windows、苹果OS上显示效果都不错,字号也比较全
另外Open Sans字体也挺漂亮

bt4baidu 发表于 2015-11-9 20:33:50

把UNICODE字符转为HTML实体字符,用于处理外来语字母,几行python代码搞定{:4_105:}

def uc_to_hc(text):
    rst = []
    for ch in text:
      val = ord(ch)
      if val<=0x7F:
            rst.append(ch)
      else:
            rst.append('{0}{1:0>4X}{2}'.format('&#x', val, ';'))
    return ''.join(rst)

bt4baidu 发表于 2015-11-14 18:19:54

【索引】 图片降噪点/切除白边/去背景(透明化)/分割程序
https://www.pdawiki.com/forum/thread-14681-1-1.html

qiuhao1112 发表于 2015-11-17 12:33:59

谢谢楼主正想学呢

RacherSasuke 发表于 2015-12-1 10:50:38

非常感谢楼主的分享!支持...

michaelwww 发表于 2015-12-6 23:40:44

感谢楼主分享,学习了,长了很多姿势。。。

nixuser 发表于 2015-12-27 06:20:40

感谢楼主分享知识和智慧。

韩信三年 发表于 2016-1-17 21:33:26

a

韩信三年 发表于 2016-1-17 21:33:45

f

韩信三年 发表于 2016-1-17 21:34:42

a

韩信三年 发表于 2016-1-17 21:35:56

la

韩信三年 发表于 2016-1-17 21:36:18

k

zht6625385 发表于 2016-1-19 19:37:17

好棒的教程!!!!!

bird73 发表于 2016-1-29 17:47:04

好教程,慢慢看看。

ssm222 发表于 2016-3-12 19:53:26

学习了!谢谢
页: 1 [2] 3 4 5 6
查看完整版本: 【史上最全】在线词典抓取、制作技术汇总