请教一个mdict制作上的问题
手上有一个韩-韩的词典,想要转换成mdx,基本上已经完成了,还剩下一个小问题,不知道有没有人能给点建议。我现在已经把文本格式整理成:
词条
释义
</>
的形式,但其中有少数词的格式是这样的:
词条
词条的另一种写法
(词条的其他写法,如有)
释义
</>
直接转换是没有问题的,但这样一来“词条的另一种写法”就成了释义的一部分,有没有什么办法可以使之也可以直接用于检索呢?
按照https://pdawiki.com/forum/thread-4498-1-1.html这个贴子的方法尝试过将标题同义词之间的间隔符进行了定义,可惜在转换过程中有一小部分韩语中的unicode字符变成了乱码。
不知Mdxbuider能进行标题同义词的定义吗?还是说就没有别的办法了?请识者教我,多谢! 同义词要利用Redirect的功能来实现。例如A和AA的含义都是B的话写成:
A
B
</>
AA
@@@LINK=A
</>
这样在条目列表里就会出现A和AA, 点击这两个条目显示的内容都是一样的。 谢谢Rayman亲自回答,不过这个词典收词27万,还有11000个同义词,手工处理恐怕是不行的了,昨天晚上用UWSC处理了一晚上,大约处理了1000多条,打算放弃了。如果mdxbuilder能对标题同义词之间的间隔符进行定义自动生成就好了。 你可以用uedit32程式,就可以批量轉換了!不需要手工处理,如果你不懂程式的語法,你可以在論譠中找一找,或上傳文本,論譠中排版的高手多的是! 如果你的词典原来就有固定格式,那应该可以借助正则表达式替换来实现批量修改的。 论坛上传附件有512K限制,我这个文档有47兆,要压90个包,就不上传了,而且我还是希望能够得到“渔”而不仅仅是“鱼”,所以还是请高手指教下应该怎么做。我前期的处理都是在uedit下做的,现在得到的文本,下面是部分示例,每个词的释义由换行+tab开始,请注意第四个词,第二行没有tab开头,是同义词,第三行其实是将两种同义词的写法归纳一遍,也可以算作释义的一部分,删去也不影响。第四行才是真正的释义。正则表达式我是不太明白,给各位添麻烦了,多谢!
골 네트
<p>골 네트</p><p> [골:-] (영어goal net)</p><p>[명사]</p><p>《체육》 축구, 하키 따위의 경기장의 골대 뒤에 친 그물. </p>
</>
골 라인
<p>골 라인</p><p> [골:-] (영어goal lI ne)</p><p>[명사]</p><p>《체육》</p><p>1 = 결승선(決勝線).</p><p>2 축구나 하키 등의 경기장에 골의 두 기둥을 이은 선. </p>
</>
골 킥
<p>골 킥</p><p> [골:-] (영어goal kI ck)</p><p>[명사]</p><p>《체육》</p><p>1 축구에서, 상대방이 골 라인 밖으로 차낸 공을 자기편 골 에어리어에 가져다 놓고 차는 일.</p><p>2 럭비에서, 트라이를 한 뒤나 또는 골대와 가까운 곳까지 공격하였을 때 득점하기 위해 차는 일. </p>
</>
골 지르다
골을 지르다
<p>골(을) 지르다
<p> 밭을 세 번째 갈다. </p>
</>
골각기
<p>골각-기【骨角器】</p><p> [-끼]</p><p>[명사]</p><p>《고고학》 석기시대에 동물의 뼈, 뿔, 이빨 같은 것으로 만든 연장. 도끼, 창, 활고자, 낚시, 바늘 따위가 있다. [참고] 골기. 각기. </p>
</>
골간
<p>골간【骨幹】</p><p>[명사]</p><p>1 = 뼈대.</p><p>2 = 골자(骨子). </p>
</>
골감
<p>골-감</p><p> [골:-]</p><p>[명사]</p><p>《식물》 꽃자리에서 꼭지 쪽으로 네 갈래의 골이 져 있는 감. </p>
</> 我看过你的排版,但我不懂韩语,我想所有没有tab的韩语应该是第二个解释吧?如果是的话就容易决了,使用正则表达式就可以在没有tab的前端加一个@@@link=的符号! a
@@@link=b
释义
这样也可以吗?如果是这样就方便了,谢谢! editplus 正则表达式替换
查找 “<\/>\n([^<>]*)\n([^<>]*)\n ”
替换为 “</>\2\n@@@link=\1\n</>\n\1\n ”
即可
thread-4498-1-1.html mdict编辑器暂不支持unicode字符显示 本帖最后由 wonthen 于 2010-8-19 13:07 编辑
感谢ldcau!试验了半天,还有三点小问题:
1.替换后生成的文本中第一个同义词直接连在前面的</>后面了,还好我自己能设法加一个换行上去。
2.替换的文本中@@@link=应该是@@@LINK=,我也自行修改了。
3.最要命的是,文本中还有以下这样的格式:
A
B
C
D
E
其中ABCD都是同义词(还有更多的同义词,最多的一处有8个),按照刚才的正则表达式替换,只有B被当作词头了,而C和D依然没有作为词头,这个问题我慢慢再想想能不能解决。总之非常感谢! 本帖最后由 wonthen 于 2010-8-19 13:35 编辑
<\/>\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n
</>\n\2\n@@@LINK=\1\n</>\n\1\n\3\n\4\n\5\n\6\n\7\n\8\n
<\/>\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n
</>\n\2\n@@@LINK=\1\n</>\n\1\n\3\n\4\n\5\n\6\n\7\n
<\/>\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n
</>\n\2\n@@@LINK=\1\n</>\n\1\n\3\n\4\n\5\n\6\n
<\/>\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n
</>\n\2\n@@@LINK=\1\n</>\n\1\n\3\n\4\n\5\n
<\/>\n([^<>]*)\n([^<>]*)\n([^<>]*)\n([^<>]*)\n
</>\n\2\n@@@LINK=\1\n</>\n\1\n\3\n\4\n
<\/>\n([^<>]*)\n([^<>]*)\n([^<>]*)\n
</>\n\2\n@@@LINK=\1\n</>\n\1\n\3\n
<\/>\n([^<>]*)\n([^<>]*)\n
</>\n\2\n@@@LINK=\1\n</>\n\1\n
这样好像可以,多谢各位帮助! 本帖最后由 莲花无语 于 2010-9-7 19:20 编辑
看看这个也长见识,同义词,我一直用链接的方法,rayman给出的更简单,谢谢了,有空儿试试。
2010.9.7试验过了:失败
AA
@@@LINK=A
</>
没有成功,不知问题处在哪里;还是先用着链接的方法吧,这个好用:
<a href="entry://被链接词条">显示文字</a>
页:
[1]