klwo2 发表于 2020-7-15 23:07:01

GD使用的中文繁简模块有待增强

本帖最后由 klwo2 于 2020-7-16 08:23 编辑

众所周知,Goldendict使用的中文繁简模块是OpenCC,OpenCC是可以自定义扩充转换表的,但是Goldendict不行。

简而言之,在某些比较老的词典(比如老辞海)或者某些文本mdx里面,索引使用的是旧字形或者比较老式的写法,这些写法在今天港台不通用,所以OpenCC默认没有,比如:

靑      青
倂      併
値      值
吿      告
喞      唧
兪      俞
喩      喻
刴      剁
朶      朵
Goldendict 内置三种繁简转换模式:简转繁(香港),简转繁(台湾),繁转简,都不能处理上面的情况,输入「青春」不能查「靑春」,输入「靑春」不能查「青春」。

我把上述文档保存成NewOld.txt,在t2s.json的"conversion_chain"里面加入

      "type": "text",
      "file": "NewOld.txt"


可以解决部分问题。但是「吿老還鄉」只能兼容「告老还乡」,依旧无法兼容「告老還鄉」,因为Goldendict 缺乏「繁体转繁体异体」的模式

我想能否放开Goldendict 的模式限制,opencc下面有几个json,就加载几个模式?或者在现有基础之上开多个空白模式,有需要的人去编辑配置文件?

如果不好弄,至少也需要增加繁(台湾)转繁(异体)、繁(异体)转繁(台湾)、简转繁(异体)、繁(异体)转简 这四种

yinu111 发表于 2020-7-16 12:53:03

這箇是伱在編辭海見到的間題吧,好奇問下你是用甲乙丙丁什麼版的辭海,作mdx和mdd?

yinu111 发表于 2020-7-17 07:18:09

是無關,就是看到後問下、
页: [1]
查看完整版本: GD使用的中文繁简模块有待增强