JollyJoe 发表于 2016-11-17 11:07:07

提取各大英汉对照词典的例句

可不可以批量提取mdx格式英汉对照词典的所有例句(朗文、牛津、柯林斯、剑桥高阶等),同时将词汇解释部分还有无用行删除掉??求解。

JollyJoe 发表于 2016-11-17 11:08:58

用正则删除了大部分无用内容,还剩好多,没辙了。{:4_93:}

spoiltbrat 发表于 2016-11-17 11:28:52

本帖最后由 spoiltbrat 于 2016-11-17 11:30 编辑

JollyJoe 发表于 2016-11-17 11:08
用正则删除了大部分无用内容,还剩好多,没辙了。

这个工具可以满足你的要求;

按正则提取:
Mdict Editor Tool v1.2https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=18986&fromuid=203976

wuhsiaohui 发表于 2016-11-22 09:46:31

这个强悍,支持捣鼓

肥猫小咪 发表于 2016-11-22 15:30:34

路过,支持一下

bdqgwy 发表于 2016-11-22 23:19:53

强悍

chinakid1 发表于 2016-11-23 00:20:11

用正则表达式

chinakid1 发表于 2016-11-23 00:21:36

spoiltbrat 发表于 2016-11-17 11:28
这个工具可以满足你的要求;

按正则提取:


目前我用这个工具用不了怎么回事

chinakid1 发表于 2016-11-23 00:22:00

JollyJoe 发表于 2016-11-17 11:08
用正则删除了大部分无用内容,还剩好多,没辙了。

继续删除啊

markus2000 发表于 2016-11-27 11:20:03

本帖最后由 markus2000 于 2016-11-27 11:23 编辑

每个字典(朗文、牛津、柯林斯、剑桥高阶等)格式不一样,统一批处理基本无解觉得……
其实几乎所有的英中双语字典的例句都有人提取过,楼主可试着搜索相应的tmx(翻译记忆交换标准)文档。

JollyJoe 发表于 2016-12-8 10:46:45

markus2000 发表于 2016-11-27 11:20
每个字典(朗文、牛津、柯林斯、剑桥高阶等)格式不一样,统一批处理基本无解觉得……
其实几乎所有的英中 ...

哈哈,我就是想要做成TMX,手头又一部分,但是很明显是不全的,所以想自己弄,但技术又不行。

JollyJoe 发表于 2016-12-8 10:47:10

chinakid1 发表于 2016-11-23 00:22
继续删除啊

计算机知识不行啊

JollyJoe 发表于 2016-12-8 10:47:34

spoiltbrat 发表于 2016-11-17 11:28
这个工具可以满足你的要求;

按正则提取:


谢谢,我试试。

JollyJoe 发表于 2016-12-8 10:53:24

spoiltbrat 发表于 2016-11-17 11:28
这个工具可以满足你的要求;

按正则提取:


用过了您发布的两个版本的软件,打开exe就停止响应。。。

lxchen2001 发表于 2016-12-10 05:06:12

只要格式工整 总是有办法的

realspirit 发表于 2016-12-11 09:37:18

应该是可以的- -

lxchen2001 发表于 2016-12-11 22:14:48

markus2000 发表于 2016-11-27 11:20
每个字典(朗文、牛津、柯林斯、剑桥高阶等)格式不一样,统一批处理基本无解觉得……
其实几乎所有的英中 ...

tmx一般用什么格式?
页: [1]
查看完整版本: 提取各大英汉对照词典的例句