效果:

实际上这个词典还是个半成品,对日语单词变形的支持不是很好——。其实,如果GoldenDic习惯用Ctrl+C+C 查词的话,也应该会注意到有类似的问题,moji、欧路、沪江稍微好一点。
所以斗胆拿这个半成品的词典来抛砖引玉,谈谈我认为日语字典的词头编撰时可以优化的地方和想出的一些办法(基本都是利用Unicode 编码规律),希望大家能不吝赐教,给出一些更好的办法。
1. 拟声拟态词很多时候写片假名——一般词典的词头都是平假名, 平假名(12353-12438) + 96 = 片假名 (12449-12534)
2. 形容词的词尾变形 いく(同上 い =12356 く=12367)
3. 支持直接查动词变形(同上变换一次假名不行了233……虽然日语动词的词尾都在う段(12358、……),变换也在基本在同段进行,但不是绝对,比如う的连一 い 12356 (-2)……,连二 った 12387,还有拨音变等等)本来猜测机器翻译领域也许会有这方面的算法和结果可以直接用,但找了很久都没找到,只能尝试自己写,但花了一周还是惨不忍睹——遗漏的变形太多了,倒是成功巩固了动词变形)
4. 复合动词 一般来说第二个动词不会写汉字,这个暂时一点头绪都没有。
已有 20 人购买 本主题需向作者支付 30 粒米 才能浏览 购买主题
谢谢,但能否简单介绍一下呢
没个介绍、效果都要购买才能看,搁着开盲盒呢。。。。
能否做成MDX格式的呢?
trans 发表于 2022-2-9 11:03
实际上这个词典还是个半成品,对日语单词变形的支持不是很好——。其实,如果GoldenDic习惯用Ctrl+C+C 查词的话,也应该会注意到有类似的问题,moji、欧路、沪江稍微好一点。
所以斗胆拿这个半成品的词典来抛砖引玉,谈谈我认为日语字典的词头编撰时可以优化的地方和想出的一些办法(基本都是利用Unicode 编码规律),希望大家能不吝赐教,给出一些更好的办法。
1. 拟声拟态词很多时候写片假名——一般词典的词头都是平假名, 平假名(12353-12438) + 96 = 片假名 (12449-12534)
2. 形容词的词尾变形 いく(同上 い =12356 く=12367)
3. 支持直接查动词变形(同上变换一次假名不行了233……虽然日语动词的词尾都在う段(12358、……),变换也在基本在同段进行,但不是绝对,比如う的连一 い 12356 (-2)……,连二 った 12387,还有拨音变等等)本来猜测机器翻译领域也许会有这方面的算法和结果可以直接用,但找了很久都没找到,只能尝试自己写,但花了一周还是惨不忍睹——遗漏的变形太多了,倒是成功巩固了动词变形)
4. 复合动词 一般来说第二个动词不会写汉字,这个暂时一点头绪都没有。
谢谢,但能否简单介绍一下呢
抱歉抱歉,第一次发帖,没注意这一点{:6_116:} GifGif 发表于 2022-2-9 17:48
没个介绍、效果都要购买才能看,搁着开盲盒呢。。。。
囧{:6_130:} chchbhbh 发表于 2022-2-9 22:20
能否做成MDX格式的呢?
词典本身就是从MDX的转过来的(就是在社区里下的大辞泉),我只是修改、添加了日语用言变形后的的词头,释义什么的没有修改,所以要做的话,也只会做词头部分啦 谢谢!AnkiHelper只内置了一部泸江词典,太少了,您做的词典很有用!您还有做好的日语词典吗?或者可以发个教程吗?
页:
[1]