想把《新編英和活用大辞典》的词条顺序号给修复了
本帖最后由 jiaoyidongxi 于 2018-6-19 19:21 编辑《研究社新編英和活用大辞典》应该是论坛上已知最好的版本,句型高亮,js 折叠效果等。是从 EPWING 上转换而来,但转换后的排版词条里不同释义的顺序号乱了,而且乱的非常规律,2 - 3 - 1 这样。导出文本看了下,顺序号全都在首行开头,而尾行部分也很规律,可以连成以顺序号为开头的单行,最后用正则重新排序。当然,以上全都是脑洞,还是想手把手求教。
https://my.mixtape.moe/hshkib.PNG
源文本,
https://my.mixtape.moe/hxjewh.PNG 论坛上会做词典的都不再出手了,尤其是教程 对于没有学过计算机来说,比较吃力
真的希望各位版主,写点大致的步骤,主攻那些章节 本帖最后由 cixiplc66 于 2018-6-19 20:29 编辑
要编程吧,只依靠编辑器里的正则估计难实现
把1部分往前提,或者2以后往后移动
好像只有一部分并非全部是顺序颠倒 本帖最后由 cixiplc66 于 2018-6-19 21:05 编辑
像sick 也有3个相同词头,但是标记为2,1和无标记
这本词典源文件还是有点乱
才发现词头可以重复吗,对于重复词头 词典都怎么处理的呢
123分部内容单独为相同的词头,牵扯到词头排序 老复杂了 改了下js,来处理这个情况,不过我只是简单的测试了一下,可能还有其他情况没考虑。
而且目前的情况是,同一词条不同词义是分开的单独词条,像mdict这种分开显示的应该就没用。
最好处理源文件把词条合并了,那样改动源文件的序号也比较简单了,应该可以通过正则来改了。 simonfire 发表于 2018-6-20 11:10
改了下js,来处理这个情况,不过我只是简单的测试了一下,可能还有其他情况没考虑。
而且目前的情况是,同 ...
这个 js 是把 sup 序列号变正序了,但释义排序本身没动;嘛,是个「好方法」,对强迫党来说是个好的欺骗手段 :^)))
看到各位都很热情的出谋划策,外加这 js ,反倒觉得无所谓了,反正只是内容排序颠倒,内容本身并不影响。
关于词条分开部分对我个人来说没事,纯 GD 党。
确实,sup 顺序号并不是全部颠倒,粗糙地说,sup 号总计 3K 多,至少大半是倒的。
顺便一并感谢楼上/里外诸位。
本帖最后由 jiaoyidongxi 于 2018-6-20 20:20 编辑
simonfire 发表于 2018-6-20 11:10
改了下js,来处理这个情况,不过我只是简单的测试了一下,可能还有其他情况没考虑。
而且目前的情况是,同 ...
说到 js,我还有个求教,就不开新帖了,待会重新编辑一下主楼的贴。
CACD 也是部好词典,是剑桥早期风格词典,即一个单词以不同变形词排一起作释义,所以这本词典排版不知是本来就这样,还是原制作者的转换改动所致,加了一堆 @@@link,这在 GD 上显示就出现了查一个词由于变形词的缘故,导致重复显示。这里随便举 2 个词作例子,如 duplicate, mimic。我试过在原文本上插入 js 外链,然后从 stackoverflow 上看来的 js 去重代码,以及你对 bing 双解词典去重的代码依葫芦画瓢把 class 换掉照搬上去都无效,所以还是求教下。 我已经修好了,有空传上来
页:
[1]