sunsmile23 发表于 2014-8-21 22:50:33

Dict Source Editor【2014.08.24】

本帖最后由 sunsmile23 于 2014-8-29 09:56 编辑

对论坛的这个帖子进行了更新,现重新发一贴。那个帖子不再更新。
https://www.pdawiki.com/forum/thread-11430-1-1.html

在原帖中介绍了一个词典工具。其实那只能算作一个半成品。功能不多,界面也不美。为了使其至少像一个软件,现对其进行了升级。
升级后,更易用,更能干点实事。
由于时间有限,现阶段也不太完善,也无时间美化。目前基本上有如下功能:编辑、预览、导出、合并。

一、文本编辑
作为一个普通文本编辑器还是个初级阶段。虽然比记事本强,可以打开几十几百M的文件,但目前很不稳定,仅仅可以把文件打开看一眼。
https://www.pdawiki.com/forum/data/attachment/album/201408/21/222911x3d5h838nb3g0hmd.png

二、预览。
Dict Source Editor支持打开三种格式的词典文件,以直观的方式浏览其内容
https://pdawiki.com/forum/data/attachment/album/201408/24/205439rs4j5qs5as5lqis7.png

Mdx格式文件
https://www.pdawiki.com/forum/data/attachment/album/201408/21/222926zzk600u2iiuvuidv.png

TXT格式源文件
https://www.pdawiki.com/forum/data/attachment/album/201408/21/222933bqgtv5tddl0ttqb5.png

Mdd文件。直接浏览里面的图片,或者查看css文件内容
https://www.pdawiki.com/forum/data/attachment/album/201408/21/222938zjrqjshspgr4ecqw.png
https://www.pdawiki.com/forum/data/attachment/album/201408/21/222939lgg0p0tscgmdgnca.png

编辑框键入词条回车,定位到相应词条。也可以在列表框键入快速定位
https://www.pdawiki.com/forum/data/attachment/album/201408/21/230601m10yqpao7q7wyycw.png

编辑框完整支持正则表达式。键入后单击右面的RegEx, 列出的是匹配正则表达式的词条。
例如键入“tion”,然后单击 RegEx,列出的是所有含有“tion”的词条,不管它是在单词中什么位置。
https://www.pdawiki.com/forum/data/attachment/album/201408/21/232656btowq6bk8kztk7tk.png

这是所有以“ed”结尾的单词
https://www.pdawiki.com/forum/data/attachment/album/201408/21/232701cm91r2qehrj200yq.png

这是所有以开音节样式结尾的单词
https://www.pdawiki.com/forum/data/attachment/album/201408/22/154809x8q8ta7q8q7ptpqh.png

将编辑框清空,单击RegEx,则显示所有的单词。

外部css. 若有外部css文件,或者若想测试外部css文件,则右键指定。目前还不是很智能。若是修改了css文件,得重新指定一回。

三、导出
Export-Current可导出当前显示的Mdx,Mdd,MDict源文本文件。
https://www.pdawiki.com/forum/data/attachment/album/201408/22/160402khi209moehp0180z.png

只导出列表框内显示的词条。例如,编辑框键入一个空格“ ”,单击RegEx,则列出的是所有包含空格的词条,也就是各种短语。这时导出的就是所列出的短语,而不是全部词条。
https://www.pdawiki.com/forum/data/attachment/album/201408/22/161755css4s059lilpb0zl.png

Export-Custom可以按照自己的需求导出指定的词条文本。例如只导出自己需要的某些词条,或者不导出某些词条。只需将你需要导出的词条保存到一个文本文件,每个词条一行,然后指定这个文件即可。如下图所示。
https://www.pdawiki.com/forum/data/attachment/album/201408/22/163533qkf596y6ox3qazo5.png

可以看出,只导出了所希望的列表。
https://www.pdawiki.com/forum/data/attachment/album/201408/22/163535ea4afvdx44qfqqg8.png

上面的按需导出功能对打开的Mdx、MDict源文本有效。
Export-Mdx, Export-Mdd是导出其它没有打开的文件。相对而言,内存消耗要小些。

导出head words. 可以只导出head words,而不导出释义内容。如下图所示。导出时也支持上面介绍的正则表达式过滤,从而只导出自己需要的词条
https://www.pdawiki.com/forum/data/attachment/album/201408/28/215716vc5fu1ydjwqc7coo.png

  

sunsmile23 发表于 2014-8-21 22:50:43

本帖最后由 sunsmile23 于 2014-8-24 21:32 编辑

四、合并
可以合并文件和/或词条。
合并功能使用向导式WYSIWYG方式,每一个选择都能立即直观地看到效果。
词头合并的样式来自于Hugh

1. 相同词头的词条合并
前面加一大标题。这儿的Combination/Single代表相应的词头,就是你最终会见到的词头样式。左面栏预览的是当有合并词条发生时的式样,右面栏是没有词条合并时的样子。
https://www.pdawiki.com/forum/data/attachment/album/201408/22/171232gnpkv7fkvcwz5556.png

加上跳转。若源文件有词性等特征信息(不一定词性,任何特征都行),可提取到前面作为跳转用。特征可能不只一种,可用多行,每行代表一种特征,互不影响。设置了一定距离限制。不然前面没有特征时,倒把后面的派生词(有的词典后面跟有派生词)词性提取出来。在所给定的限定范围内没有找到特征信息时,会自动用头词加上标代替。
https://www.pdawiki.com/forum/data/attachment/album/201408/22/184705x3pdzd2hghtmptng.png

设置分标题。单击分标题会回到词条首。
https://www.pdawiki.com/forum/data/attachment/album/201408/22/175736z9n5ri55kbyr66z2.png

其它设置。自定义列表的作用前面有解释。就是只输出自己需要的单词
https://www.pdawiki.com/forum/data/attachment/album/201408/22/182607d3663xyjgor8q8oh.png

合并后最终的样子
https://www.pdawiki.com/forum/data/attachment/album/201408/22/184952hm17cffkgi992mc9.png

若原来有大标题,再加上大标题后就会重复不好看。为了合并后统一风格,可把原来的标题删除。这需要认真研究原标题及其前后的特征,并使用替换的技术,把前后特征保留下来。查找和替换都可使用多行,以适应多种特征,每行互不影响。替换框相应行为空时表示删除。
https://www.pdawiki.com/forum/data/attachment/album/201408/22/215742dezm7derevy1uv4m.png
https://www.pdawiki.com/forum/data/attachment/album/201408/22/215751a086jlipelqij000.png


2. 文件的合并
可以把多个Mdx、MDict源文件合并到一起。当你同时打开了多个文件时,可以用两种方式把它们合并到一个文件中。有全部合并和补充合并供你选择。
https://www.pdawiki.com/forum/data/attachment/album/201408/22/222708kzkryjeeqyefyqev.png

合并文件时,你还可以选择同时合并词条。可以选择只合并文件,或文件合并后也合并词条。有时文件合并只是一个中间环节,也许还不准备合并词条,或还要等待合并其他文件,以后再一起合并词条。此时就可选择只合并文件。自定义列表可以只输出各个词典中自己需要的词条内容,看前面的例子。
https://www.pdawiki.com/forum/data/attachment/album/201408/22/224050uko5ophty3ty3rnb.png

由于合并多文件时可能有的有大标题,有的没有。所以要仔细观察原来的标题特征,把它删除(见前面的例子),用自己的大标题来统一风格。
由于还没时间考虑编码的问题。所以合并文件时应该把所有文本都变成UTF-8, 以免出问题。

sunsmile23 发表于 2014-8-21 22:50:56

本帖最后由 sunsmile23 于 2014-8-24 22:35 编辑

注意事项:
1. 文本编辑功能问题多多,尽管想给它赋予一些词典方面的特殊功能,但没有时间去弄。再说文本编辑器多如牛毛,好的多的是。可以直接忽视它。
2. 编码处理的还不太智能。为了顺利操作,应该把所有文件统一转换成一种格式,如UTF-8,以免合并后出现乱码。若预览出现显示乱码,可右键菜单,编码选 UTF-8.
3. 目前主要重在提供功能,性能(如速度、内存消耗等)还无暇顾及。
4. 界面还不是很美观,作者也没有多少美术细胞。如能有人设计一套图标美化一下,将会很好。每一个工具按钮需要一个16X16和32X32的图标。

sunsmile23 发表于 2014-8-21 22:51:09

本帖最后由 sunsmile23 于 2014-8-29 12:03 编辑

Dict Source Editor的一些部件来自互联网。作者制作本软件只是为了个人学习和测试有关功能,并无意自由分发。若你也想测试一下软件功能,请仔细阅读后面的说明。
作者保证本软件不含有任何有害的、恶意的部分,若360之类提出警告、或者你有怀疑,请不要使用。
尽管作者尽量保证数据安全,但以防万一,请备份好你的重要数据。若使用软件的过程中造成数据损失或丢失,作者不负任何责任。
若使用过程中发现了bug,请在后面说明。


mdx痴迷者 发表于 2017-4-19 15:34:33

本帖最后由 mdx痴迷者 于 2017-5-9 20:52 编辑

楼主的软件不能去重(释义重复的合并之后照常重复),另外楼主的软件不支持favor
@@@LINK=favour
</>类词条合并,这怎么办?

Oeasy 发表于 2014-8-22 05:33:23


{:5_227:}

欣赏需要什么就学什么的人,不以“我很忙,我是文科生……”为借口。
佩服缺什么工具就自己造的人,比如sunsmile23。



sky66 发表于 2015-10-27 14:53:27

感谢楼主!

原本在制作词典时还在想要如何将词频与词典用正则结合,
想不到有如此方便的合并工具! 而且不但可以合并词典, 还可以加上词条跳转..
虽然对于词性跳转我还用不太出来, 不过目前的结果已经很满意了!

在使用过程中, 有发现一个疑似的小bug:
加上词条跳转时, 每个词条前会有<a name="_topa"> <a> 之类的源代码.
这部分应该是<a name="_topa"> </a>才是.
目前我是用手动将<a>替换成</a>, 问题不大..仅供楼主参考..

dave 发表于 2015-1-2 16:54:56

sunsmile23大大,Dict source Editor 很好用。特别是制作有自己特色的字典,但有一个小小的问题需要大大再完善一下就更完美了。问题是:Export-Custom可以按照自己的需求导出特色字典,但导出的字典的关键词都会自动排序,能否不自动排序,而是按词条顺序导出?还有MdxBuilder能否按词条顺序自制字典。比如按孩子英语书学习顺序制作字典.那就功德圆满了。

Silas 发表于 2018-7-10 20:39:13

GL_n 发表于 2018-7-10 20:27
不知哪位坛友还收藏有Dict Source Editor?看了下该软件制作人sunsmile23兄的demo,感觉这个软件在制作词典 ...

地址在四樓readme.rar裏面

sky66 发表于 2015-10-29 17:19:29

加上词条跳转还有一个问题,
就是程序会自动产生_topa , _topb …. _topy , _top`
以及_hka , _hkb …. _hky , _hk`的跳转标签

如下源码,但当出现 _hk`1的时候, 这个词条经过MdxBuilder打包成mdx之后, 这个词条就无法显示了, 只会显示1. 也就是hk `1之前的内容
估计是和mdx “记号文件” 冲突了

as
<a name="_top`"> </a>
<block>1.<a style="text-decoration:none" href="entry://#_hk`1">as<sup>1</sup></a> | 2.<a style="text-decoration


我的解决方式是将_hk`改为_hkz
_top` 要改不改应该都可以.

zhlpen 发表于 2015-10-22 12:06:54

在4楼的readme文件里,下载readme,打开后里面有下载地址

sunsmile23 发表于 2014-8-22 18:55:40

要是O大闲得没事,就烦请做出个英文帮助文件
{:5_185:}

featman 发表于 2023-1-9 04:19:59

感谢分享了

chigre3 发表于 2014-8-22 03:16:54

论坛又增一有力工具! 谢谢sunsmile23!

bsqby 发表于 2014-8-22 06:55:12

强悍,牛逼得爆表。

shipley.wu 发表于 2014-8-22 07:26:12

佩服!谢谢sunsmile23。

吴贯和烬羽 发表于 2014-8-22 07:37:39

可视化词典制作

huala 发表于 2014-8-22 09:29:03

收藏级帖子,必须支持

ok927 发表于 2014-8-22 09:35:36

本帖最后由 ok927 于 2014-8-22 10:30 编辑

谢谢老大,期待功能、性能的进一步完善——做成一个可视化的编辑工具!
再次表示感谢。

wenlishahsa 发表于 2014-8-22 10:53:18

佩服会编程的人

lewpad 发表于 2014-8-22 11:20:49

本帖最后由 lewpad 于 2014-8-22 11:22 编辑

谢谢楼主,能用正则表达式,很强大。
1、不知道是否能查词典中的汉字呢?比如 日期,会出现date的词条,
2、是否能查例句中的汉字词组呢,比如感到羞耻,就会查到you should be ashame of yourself for telling such lies这个句子,以及其他单词中的“感到羞耻”的句子?
不好意思,我也感到羞耻,问这么多。

lixun305 发表于 2014-8-22 13:00:09

本帖最后由 lixun305 于 2014-8-22 13:03 编辑

这确实需要对 mdx mdd html脚本等 格式有很深的了解! 支持!编程实现的艰辛不是一两句能说完的。

对 超大mdx 文件 (例如百度百科 or 维基百科 )的浏览和编辑,对程序是个很大的挑战,大于1G的文件打开一次都是难事, 看 emeditor 在处理几百M文件的时候,虽然做的很好的,但还是要费劲的很。

itarcy 发表于 2014-8-22 15:10:19

我是来围观神仙的~ :)

Oeasy 发表于 2014-8-22 18:48:51

{:4_104:}

界面改英文了,这下国际友人、港澳台同胞、海外侨胞也能用上了。
要是帮助文件也是英文,就更好了。
{:5_227:}

Hugh 发表于 2014-8-22 19:16:22

论坛自从有了Sunsmile,词典迷们就过上了幸福的生活!

fedor 发表于 2014-8-22 21:34:02

sunsmile23 发表于 2014-8-21 22:50 static/image/common/back.gif
四、合并
可以合并文件和/或词条。
合并功能使用向导式WYSIWYG方式,每一个选择都能立即直观地看到效果。 ...

好东西,期待啊

ok927 发表于 2014-8-22 21:51:34

老大,建议增加一个功能:导出“指定的txt单词列表”中对应的所有词条的功能。

houbible 发表于 2014-8-22 21:54:07

好东西,灰常的期待,sunsmile真乃高人,论坛高人真多!

sunsmile23 发表于 2014-8-22 22:06:22

ok927 发表于 2014-8-22 21:51 static/image/common/back.gif
老大,建议增加一个功能:导出“指定的txt单词列表”中对应的所有词条的功能。

“自定义词条列表”不就是这个目的?

ok927 发表于 2014-8-22 22:19:59

不好意思,这张图片没看到。
如果有下载链接,真想好好试用。

shawky.nasr 发表于 2014-8-23 04:28:51

太棒,期待 {:4_104:}

感谢sunsmile大哥 :)

zhu1234 发表于 2014-8-23 08:39:43

非常期待的词典编辑工具。。{:4_113:}
页: [1] 2 3 4 5 6 7
查看完整版本: Dict Source Editor【2014.08.24】