你去哪里 发表于 2019-8-2 00:31:42

请教词条提取中遇到的一个问题

我利用Source Editor对coca 60000的mdx进行提取词条操作后,用MdxBuilder将提取出的txt重新打包成mdx,发现在txt里面处于第一个的词条a,在mdx里面总是成为了最后一个,其他mdx进行提取——打包操作同样如此。但是如果不进行提取操作,只对mdx进行解压——打包操作,则不会出现此问题。可是我又看不出提取出的txt到底哪里出了问题,因此望各位加以指点。

menglongma 发表于 2019-8-2 07:21:00

我以前也遇见过同样问题 忘记当时是怎么真正解决的了 但有一个当时用过的拙笨的解决办法还记得 就是把txt最后一个词条文本 剪切再粘贴到最前边 然后打包MDX文件即可

你去哪里 发表于 2019-8-2 07:57:28

menglongma 发表于 2019-8-2 07:21
我以前也遇见过同样问题 忘记当时是怎么真正解决的了 但有一个当时用过的拙笨的解决办法还记得 就是把txt最 ...

你的方法应该可行,我把第一个单词删除后,第二个单词就到了最后面。不过实在想不明白提取这个过程到底出了什么问题。

klwo2 发表于 2019-8-2 08:57:10

文件要保存成utf-8无bom

你去哪里 发表于 2019-8-2 09:09:38

klwo2 发表于 2019-8-2 08:57
文件要保存成utf-8无bom

可是从source editor导出txt时,没法对txt格式进行设置啊。

你去哪里 发表于 2019-8-2 12:54:02

klwo2 发表于 2019-8-2 08:57
文件要保存成utf-8无bom

懂了,已经解决。非常感谢。
页: [1]
查看完整版本: 请教词条提取中遇到的一个问题