chigre3
发表于 2015-5-27 04:41:11
https://www.pdawiki.com/forum/data/attachment/forum/201505/27/044023fbwvj1omhhh131r4.png
2015.05.25 《葡汉词典》字母A部分138页完成词头校对,使用脚本制作的粗略效果图。
chigre3
发表于 2015-6-2 22:19:51
本帖最后由 chigre3 于 2015-6-2 22:22 编辑
https://www.pdawiki.com/forum/data/attachment/forum/201506/02/221858tk6z9u9vd2k9r932.png
https://www.pdawiki.com/forum/data/attachment/forum/201506/02/221859rti7jz242drj7gt1.png
https://www.pdawiki.com/forum/data/attachment/forum/201506/02/221901hed4zlqlmhej5qlj.png
《葡汉词典》全索引图片版
词条数目统计:
68674(无重复词头)
69923(全部词头)
+ 13(目录等)
+1174(页面链接)
-----------
71100(合计索引)
chigre3
发表于 2015-6-11 04:59:34
本帖最后由 chigre3 于 2015-6-11 06:47 编辑
https://www.pdawiki.com/forum/data/attachment/forum/201506/11/045532p3f583gyvxjwppzv.png
https://www.pdawiki.com/forum/data/attachment/forum/201506/11/045535mx2w2gkbzwi33wqh.png
左侧:蓝色
右侧:红色
单字:橙色
——————————————
74645(15826单字,其余词语等;71021不重复)
1792(页面索引)
57(部首检字索引)
28(目录索引)
——————————————
76522(72898不重复)
注:
1. 词头有若干使用拆分部件或其他问题,末尾加注星号*表示;
2. 词头未经过删除重复处理;
3. 蓝左红右,单字词头橙色;
——————————————
原始词头文件:meigen
LYX1692
发表于 2015-6-19 13:43:24
相当精致!
gongzhe
发表于 2015-7-26 17:44:23
学长,我是微博上向你求助过的那个骚年= =
你也知道我只有几本从ruboard上下的西西词典还拿得出手= =
求图片版新西汉词典!!
我代我班上另外24个妹子感谢你!!!
dingyang
发表于 2015-7-27 11:35:56
gongzhe 发表于 2015-7-26 17:44
学长,我是微博上向你求助过的那个骚年= =
你也知道我只有几本从ruboard上下的西西词典还拿得出手= =
求 ...
具体哪部西西词典,嘿嘿,说来听听
dingyang
发表于 2015-7-27 11:36:16
gongzhe 发表于 2015-7-26 17:44
学长,我是微博上向你求助过的那个骚年= =
你也知道我只有几本从ruboard上下的西西词典还拿得出手= =
求 ...
具体哪部西西词典,嘿嘿,说来听听
lwangls
发表于 2015-7-27 16:16:08
请问楼主是用什么方法把这几万个词条提出来的? 有什么技巧?
chigre3
发表于 2015-7-28 01:05:55
lwangls 发表于 2015-7-27 16:16
请问楼主是用什么方法把这几万个词条提出来的? 有什么技巧?
1. 手打
2. 从大范围的西班牙语原文词典的词头着手增删
lwangls
发表于 2015-7-28 07:23:18
本帖最后由 lwangls 于 2015-7-28 07:31 编辑
chigre3 发表于 2015-7-28 01:05
1. 手打
2. 从大范围的西班牙语原文词典的词头着手增删
俄,手打工作量不小,一天几百词,一部词典小半年。
我在考虑用PS处理图片: 1)图片按词目的最大长度剪裁掉大部分解释内容
2) 通过黑白差异设阈值, 把剩余解释内容过滤掉, 只剩下词条
3) OCR读取词条
以上都需要批量处理, 不知行不行得通。
chigre3
发表于 2015-7-28 07:51:36
lwangls 发表于 2015-7-28 07:23
俄,手打工作量不小,一天几百词,一部词典小半年。
我在考虑用PS处理图片: 1)图片按词目的最大长度 ...
所以不手打,用现有的更大范围的词头索引进行删减。
半个月一般可以搞定一部6万词头的词典。
-------------------
全索引图片版就是要保证词头正确,OCR就算了。
chigre3
发表于 2016-2-22 07:44:44
坛友 DIC4Khmer 写的经验贴:
我的词典制作方法
https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=15574
chigre3
发表于 2016-5-2 03:45:27
hengjiu
发表于 2016-5-2 14:37:54
很不错
孤影
发表于 2016-5-19 14:47:37
能否私发一下一图片字典(只需1-2个词条就够了)我想借用你的排版
chigre3
发表于 2016-5-21 00:33:36
孤影 发表于 2016-5-19 14:47
能否私发一下一图片字典(只需1-2个词条就够了)我想借用你的排版
YHD2_0001
<link rel="stylesheet" type="text/css" href="YHD2016.css"><link rel="stylesheet" type="text/css" href="file:///sdcard/GoldenDict/YHD2016.css">
<e><pag-t>上一页: <a href="entry://YHD2_0001">0001</a> [当前页: <a href="entry://YHD2_0001">0001</a>] 下一页: <a href="entry://YHD2_0002">0002</a></pag-t>
<pag-l><sup>1</sup><a class="page" href="entry://A">A</a> / <sup>2</sup><a class="page" href="entry://A">A</a> / <sup>3</sup><a class="page" href="entry://a">a</a></pag-l>
<pag-m><sup>1</sup><a class="page" href="entry://a">a</a> / <sup>2</sup><a class="page" href="entry://a">a</a></pag-m>
<pag-r><sup>1</sup><a class="page" href="entry://a">a</a> / <sup>2</sup><a class="page" href="entry://a">a</a> / <sup>3</sup><a class="page" href="entry://A.">A.</a> / <sup>4</sup><a class="page" href="entry://a.">a.</a> / <sup>5</sup><a class="page" href="entry://a’">a’</a> / <sup>6</sup><a class="page" href="entry://A-">A-</a> / <sup>7</sup><a class="page" href="entry://a-">a-</a> / <sup>8</sup><a class="page" href="entry://a-">a-</a> / <sup>9</sup><a class="page" href="entry://a-">a-</a> / <sup>10</sup><a class="page" href="entry://a-">a-</a> / <sup>11</sup><a class="page" href="entry://a-">a-</a> / <sup>12</sup><a class="page" href="entry://a-">a-</a> / <sup>13</sup><a class="page" href="entry://-a">-a</a> / <sup>14</sup><a class="page" href="entry://-a">-a</a> / <sup>15</sup><a class="page" href="entry://ā">ā</a> / <sup>16</sup><a class="page" href="entry://@">@</a> / <sup>17</sup><a class="page" href="entry://A1">A1</a> / <sup>18</sup><a class="page" href="entry://A2">A2</a> / <sup>19</sup><a class="page" href="entry://A3">A3</a> / <sup>20</sup><a class="page" href="entry://A4">A4</a> / <sup>21</sup><a class="page" href="entry://A5">A5</a> / <sup>22</sup><a class="page" href="entry://AA">AA</a> / <sup>23</sup><a class="page" href="entry://AA">AA</a> / <sup>24</sup><a class="page" href="entry://aa">aa</a> / <sup>25</sup><a class="page" href="entry://aa">aa</a> / <sup>26</sup><a class="page" href="entry://aa">aa</a> / <sup>27</sup><a class="page" href="entry://A.A.">A.A.</a></pag-r>
<img class="HYD2" src="0001.png"/>
<pag-t>上一页: <a href="entry://YHD2_0001">0001</a> [当前页: <a href="entry://YHD2_0001">0001</a>] 下一页: <a href="entry://YHD2_0002">0002</a></pag-t></e>
</>
CSS:
/*词条内容, 整体*/
e {font-size:1em;font-family:"Palatino Linotype", Palatino, Georgia, "Times New Roman", "NotoSansSC", "Microsoft YaHei", STXihei, 'HanaMinA', 'HanaMinB';}
e a{text-decoration:none;color:inherit;font-size:1.1em;font-weight:bold;}
e a:hover {text-decoration:underline;background-color:yellow;}
pag-t, pag-l, pag-m, pag-r {display:block;line-height:1.6em;padding-left:5px;font-size:.9em;font-weight:bold;border:0;}
pag-t {background:#009A31;color:white;border-radius:.3em .3em 0 0;}
pag-l {background:#EFF2FB;color:blue;}
pag-m {background:#E6E6E6;color:black;}
pag-r {background:#FBEFF8;color:red;}
img.HYD2 {
max-width: 100%; /*图片占用窗口最大宽度*/
display: normal; /*显示图片, normal; 不显示, none;*/
}
chigre3
发表于 2016-5-21 07:21:45
有感于 @vbnet 的 [索引] 20160518_2更新_制作图片字典工具的试作https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=16663&extra=page%3D1
想把当初制作图片版词典未能实现的一个想法也实现:
查询单词,索引列表*单击,直接跳到图片所在的垂直位置:
https://www.pdawiki.com/forum/data/attachment/forum/201605/21/071725kfdjz5zb5nax7fpf.png
前提:
1. 完整索引
2. 完整的词条坐标 (词条在图片上的XY坐标)
chigre3
发表于 2016-5-21 07:27:06
于是,GOOGLE了一下python相关的关键词:python image mouse coordinates
第一个网页里的一段代码就成了我所需要的主要内容,
http://stackoverflow.com/questions/5501192/how-to-display-picture-and-get-mouse-click-coordinate-on-it
再作一些更改,就可以实现:打开图片,单击(红点标志,提醒作用),坐标保存到文本文件
非常简单,非常方便。不用截取图片,只用单击所在位置点。
cherry777
发表于 2016-5-21 15:40:30
谢谢楼主的分享
chigre3
发表于 2016-5-22 00:55:43
TEST_PIC_DIC.zip (12.04 KB, 下载次数: 0)
解压ZIP:
TEST.html 可以用浏览器查看一下效果
TEST.MDX 只能用 GoldenDict 查看不完全效果,即“红色标识”的显隐性不成功,有谁懂点JS的帮忙给出个主意!
不然图片下方的词条,因为版面高度关系会因为没有“标识提示”而变得难找了!!!
chigre3
发表于 2016-5-22 01:29:18
python代码来源:
http://stackoverflow.com/questions/5501192/how-to-display-picture-and-get-mouse-click-coordinate-on-it
#!/usr/bin/env python
# -*- coding: utf-8 -*-
from Tkinter import *
from tkFileDialog import askopenfilename
from PIL import Image, ImageTk
if __name__ == "__main__":
root = Tk()
#setting up a tkinter canvas with scrollbars
frame = Frame(root, bd=2, relief=SUNKEN)
frame.grid_rowconfigure(0, weight=1)
frame.grid_columnconfigure(0, weight=1)
xscroll = Scrollbar(frame, orient=HORIZONTAL)
xscroll.grid(row=1, column=0, sticky=E+W)
yscroll = Scrollbar(frame)
yscroll.grid(row=0, column=1, sticky=N+S)
canvas = Canvas(frame, bd=0, xscrollcommand=xscroll.set, yscrollcommand=yscroll.set)
canvas.grid(row=0, column=0, sticky=N+S+E+W)
xscroll.config(command=canvas.xview)
yscroll.config(command=canvas.yview)
frame.pack(fill=BOTH,expand=1)
#adding the image
File = askopenfilename(parent=root, initialdir="C:/Users/dell/Desktop/意汉词典/_ok",title='Choose an image.')
img = ImageTk.PhotoImage(Image.open(File))
canvas.create_image(0,0,image=img,anchor="nw")
canvas.config(scrollregion=canvas.bbox(ALL))
#function to be called when mouse is clicked
def printcoords(event):
#outputting x and y coords to console
canvas = event.widget
x = canvas.canvasx(event.x)
y = canvas.canvasy(event.y)
oval = canvas.create_oval(x-8, y-8, x+8, y+8, fill="red")
print x,y
f = open('_coords.txt','a')
f.write('X: %s\tY: %s\n' % (x,y))
f.close()
#mouseclick event
canvas.bind("<Button 1>",printcoords)
root.mainloop()
chigre3
发表于 2016-5-24 05:59:06
图片词典测试:
PIC_DIC_TEST_20160523.zip
----------------------
颜色:蓝左红右, 灰色为单词链接热点区域 (点击查询)
----------------------
全页版图片词典差不多该有的都有了吧??
已经实现的功能:
1. 查询单词,显示界面:
上一页: XXX [当前页: XXX] 下一页: XXX
单词 Pag. xxx,左o右序号|总数
xxx.png
----------------------
2. 单击查询单词,自动翻到所在的Y纵坐标
3. 词典图片所有词头均可单击, 查询相应单词
4. 单击页码, 该页所有单词均显示:
(1) 单击上标数字, 翻到该单词所在的Y纵坐标
(2) 单击单词, 查询相应单词 (尤其适合多词典联合查询)
【实际上在小平板上,一目了然,并不需要额外的再次点击跳到所在纵坐标位置,有“特殊颜色标识”已经能够让使用者眼睛定位!!
目前软件测试结果:
1. GoldenDict 桌面版和Android版均完全支持
2. Mdict 桌面版不能自动翻到到所在Y纵坐标(总是到图片0,0处),其他正常
3. Mdict 安卓版完全支持
https://www.pdawiki.com/forum/data/attachment/forum/201605/24/055258pree3r7ue34z50e0.png
https://www.pdawiki.com/forum/data/attachment/forum/201605/24/053529mo3zd9g7yezgnanq.png
https://www.pdawiki.com/forum/data/attachment/forum/201605/24/053737zrarza1ar9ra4z0z.png
----------------------------------------------------------
链接:https://www.pdawiki.com/forum/forum.php?mod=redirect&goto=findpost&ptid=16663&pid=318246&fromuid=174481
chigre3
发表于 2016-5-30 19:46:17
https://www.pdawiki.com/forum/data/attachment/forum/201605/30/193912ac6ktaq2vkatca6a.png
https://www.pdawiki.com/forum/data/attachment/forum/201605/30/193926c5et5takpqp9t8ga.png
1. 各种前言附录等链接
2. 上一页 当前页 下一页【上下页浏览,页面全部词条】
3. 当前查询单词 及其 位置【单击可以自动跳到纵坐标位置, GoldenDict下正常】
4. 当前页图片【所有词头均可以点击查询,当前单词高亮(蓝左红右),其他单词灰色】
5. 上一页 当前页 下一页【上下页浏览,页面全部词条】
chigre3
发表于 2016-6-1 03:55:12
需要根据坐标获取软件得到的数据进行后期的python代码处理一次得到最终效果
待办理:python代码
chigre3
发表于 2016-6-3 18:52:44
https://www.pdawiki.com/forum/data/attachment/forum/201606/03/185004psyxmxmsxyygzy8y.png
https://www.pdawiki.com/forum/data/attachment/forum/201606/03/185017i8cu7dtu7hhpssw7.png
利用坐标制作的完美全页图片版词典
20160603