cdyg 发表于 2009-2-26 22:24:43

ISILO格式电子书制作工具ISILOX相关文档处理工具、教程



最新版ISILOX 4.37官方下载地址:http://www.isilox.com/download/iSiloXWindows.htm

[ 本帖最后由 cdyg 于 2009-3-1 18:38 编辑 ]

cdyg 发表于 2009-2-26 22:25:54

相关文档处理工具:
一、MINIKILLEBOOK(绿色版)
反编译任何IE内核的带有独立目录页的电子书或网站(允许以纯文本格式反编译或以HTML格式反编译)


二、UNEBOOK(绿色版)
反编译CHM文档利器……


三、TextForever中文版 (绿色版)
文档处理专家:文件切分与合并、段落合并与拆分、文本替换(支持多行文本与正则表达式)……



四、西安国华etextwizard(XX安装版)
是一个文档批量处理、批量格式转换工具;help和chm帮助文件快速制作软件;电子书批量制作工具;批量chm反编译工具;内码转换、索引生成、批量改名软件。
它的长处在于文件的批量重命名、自动对指定目录所有指定格式文件生成html格式或TXT格式的索引

下载地址:http://www.onlinedown.net/soft/13562.htm
破解文件:覆盖到安装目录即可XX

五、eTEXTcov绿色版
文档自动排版一流(内置智能引擎),自动进行文档排版,对网页上抓取有不规则硬回车的文档进行排版非常方便。


六、小说章节分割器
通过指定关键词(如第**章等)自动将大文件切分成若干小文件,当然指定关键词可以通过正则表达式成批添加定制。


七、虚拟服务器
对于非unicode编码的中文名文件或目录在ISILOX编译过程中会无法解析,通过这一软件在后台搭建本地虚拟服务器,再进行编译就不会出错了。



[ 本帖最后由 cdyg 于 2009-2-26 23:26 编辑 ]

cdyg 发表于 2009-2-26 22:26:05

ISILOX使用教程

ISILOX是制作ISILO格式电子文档的专用工具。

第一次运行时请选择你使用的设备,选择合适的设备,不仅便于制作的文档与手机能及时同步,同时也便于以合适的分辨率压缩图片,达到最佳的制作效果。


一、修改ISILOX的默认文档设置:
选择document--default properties,弹出文档默认设置的窗口。
对于每一文档编译任务,都有这么一个设置窗口,这里的默认设置可以设置你最常用的一些习惯,这样可以最大程度减轻后期设置的工作量。

1、修改文档的编码、解码格式
ISILOX支持unicode编码仅有UTF-8格式,这是一种变码长的Unicode编码方式,而不支持UTF-16(即UEDIT默认的unicode格式),更不用说支持unicode16的Little/Big endian(小尾序/大尾序)格式。
一般情况下,对于中文文档来说,选择GBK或GB18080就可以了,前者是微软于Windows95后推出的汉字GB2312-80的汉字内码扩展规范,GB18080编码是之后于2000后制定的国家标准,GBK是GB18080的一个子集,二者完全兼容。
修改方式:
见下图 Document--Text encoding Option,选中相应的编码与解码方式即可。这里需要指出的是,编码格式一定要与源文件真实的编码格式一致,否则编译出来的文件汉字将是乱码。


2、修改链接方式

Maximum link :最大链接层次数,即对于源网页上的超级链接页是否允许再次链接,最多链接的层次是多少。
对于要编译的一个文档来说,选择链接层次越多,则源网页上被逐级交叉链接到的其它网页越多,被编译入的网页也越多,编译完成的文档也就越大,这时你有可能发现你的文档包含了许多你所不感兴趣的其它链接信息。
对于一些比较复杂的网站来说,最好对源网页下载下来进行适当处理,去除一些无关的链接分支,选择一个合适的链接层次数,这样才能达到最理想的编译效果。
Follow off-site :是否要编译主网站链接到其它网站链接的信息,一般选否。
再下面一个是子文件编译夹编译选项,无关紧要。
接下去的Include unresolved link :是否要包含无法解析的链接(包含链接失效、或中文文件夹无法解析编译的链接),如果允许,则文档将包含许多无法解析链接页的错误信息,首次预编译时可以选中,以检查文档的链接、解析健康状况,以便进行适当的后期处理,最后完成文档编译时建议去除。
最后两项是网址的过滤选择,即文档编译过程中对链接进行特定处理的“包含”与“排除”选项,自己可以进行定制。

3、修改图片选项

Include alternate text.. :是否允许文字超级链接,如不允许,则编译出来的文档不解析文字超级链接。
Include image 是否允许包含图片
下面分别设置图片调整尺寸大小、提高对比度、是否允许抖动、压缩,图片的位数,建议在Lossy选项右方选择压缩所有图片: All image压缩比率选择75左右。

4、目标位置选项:
如图

这里选择编译后的文档放在哪里,你可以按Folder选择一个常用的文件夹(比如桌面),Document右边有个框框是文档的标题(不是文件名),这个要等到具体编译工作前时在文档设置选项中填入,一般情况下最好不要填写汉字,建议填写汉字拼音或英文,因为在智能手机端,文档标题如是汉字往往会显示乱码。当然编译后的文件名可以用中文命名。

[ 本帖最后由 cdyg 于 2009-3-1 20:05 编辑 ]

cdyg 发表于 2009-2-26 22:26:13

ISILOX使用教程(续) ISILO文档的编译工作

二、ISILO文档的编译工作。
熟悉了以上的一些常用设置方法,文档的编译就很容易了。

1、简单编译方式(适合于初学者)
这种编译方式适于制作最简单的ISILO格式文档,不需要制作索引目录,你所需要做的就是把收集到的TXT文件或图片等素材加入ISILO的源数据(Souce)中即可。

①建立新项目
以编译圆周率表为例:
Document→Add



②输入文章的标题。
建议用英文或拼音,如果用中文标题要在中文标题后加2个半角的空格,这样可以避免在手机上查看时标题栏显示的乱码。



将素材文件按浏览的先后顺序依次加入到数据源中(注意,下面第三幅图中的文件类型可以根据需要选择文本或图片格式)




④编译
选择编译后文件的位置(点下图中Browse选择),完成编译工作。

点的左边的图标是编译当前文件,点右边的图标是编译所有文件。
如果在②步骤中选择的是英文或拼音文件名,编译后的文件名也是英文或拼音的,可以重命名为中文名(当然标题还是英文的)。


2、索引编译方式
具体的说,你所要做的工作,就是指定一个主文件为编译的源文件,这个源文件可以来自某个网站上包含了最多需要内容链接信息的网页(比如目录页),也可以是你对需要编译文章建立的一个索引网页文件(这是我最常采用的方式),也可以把某个网站给镜像下来,对网页数据进行处理,特别是对广告或其它不需要的信息进行过滤,把所有需要的信息都链接到目录页作为源文件。
把这个源文件作为主文件给拖到ISILOX的窗口中(如是网页按相应提示输入网址亦可),这样你的工作区多了一行,就是这篇文档编译工作对应的任务,双击该任务可进行具体的设置,设置方法与上文相同。最后执行编译即可。
还是以上面的编译圆周率表为例。
最关键是做个文件索引。在二楼的常用工具中的“四、西安国华etextwizard(XX安装版)”就是一个生成索引文件的利器。

①生成索引:

索引文件有两种常用格式:
一种是普通的索引格式,索引的文件顺序排列;
第二种是以表格方式显示。
对应于下图 .htm是普通的索引格式;html table是表格显示的索引格式。

在生成文件索引前,先查看一下是否有中文名称,如果存在中文名称,要钩选上“汉字链接自动转拼音”,这样可以避免后期编译不能解析中文文件名而出错(当然还有一种办法,就是利用二楼常用工具中的“七、虚拟服务器”来搭建本地虚拟服务器,这样编译过程实际是对本地网站服务器解析出来的文件名进行编译,对中文文件名支持很好。)当然,此时索引文件中指向的是拼音缩写的文件名,接后还要将中文文件名改名为拼音,如何进行批量改名,也可以利用“四、西安国华etextwizard(XX安装版”这一软件:


生成的索引文件如下:


②检查生成的索引文件
对索引文件进行本地检查,是否能正确链接到本地其它素材文件。
如果是以etextwizard的简单方式而不是表格方式生成的索引,有可能引用的是硬盘目录的绝对地址而不是对于主索引文件的相对地址,要予以更改。
例如索引文件中引用的是:file:///d:\aaa\ab.txt,如果索引文件与ab.txt在同一目录下,应将该绝对地址直接改为"ab.txt"即可。

③将索引文件拖入ISILOX源文件中进行编译。
在简单编译中提到的第二步中,将索引文件拖入中间的空白窗口即可:




双击上图显示的当前任务行,对当前文件的编译工作进行具体的设置(本步可略过,具体设置可参见三楼设置部分),最后进行编译(见“1、简单编译方式(适合于初学者)”部分介绍)。

当然,上文仅是对ISILOX的编译制作ISILO文档的简易教程。
真正复杂的过程在于索引文件的后期制作与处理,这里涉及到对网页的制作与美化,可以使用Frongpage、Dreamweaver甚至WORD等工具进行处理,在这里不做更多的讨论。
如果使用镜像网站dump下来的索引文件为源文件,可能含有大量的广告及不需要的信息,如何进行过滤处理,建议继续看下楼UEDIT高级搜索替换教程。

以上例子所用到的素材包含在以下的压缩包中:


三、如何使用上文提到的虚拟服务器?

1、将源索引文件及其它文件与子目录拖到虚拟服务器左窗(建议以真实文件夹方式载入)

2、将虚拟出来的地址作为源索引文件地址进行后期编译即可



四、ISILOX编译成的文档常见错误分析
1、编译出来的文件汉字是乱码
这是因为编译前设置的编码方式错误。请将ISILO的编码方式设置为与源文件相同,详见三楼的编码设置。
如果只有部分汉字乱码,估计是该章节引用的文件的编码方式与其它文件不同,例如这个文件是采用Unicode编码,而其它文件是GBK编码,请将这个文件另存为GBK编码文件后再编码。

2、链接不存在
请检查编译的错误报告,具体是哪个文件的链接不存在,有可能是以下的几种原因:
①设置中的链接层次数设置过少,请适当增大。
②中文目录或中文文件无法解析,请转换为英文重新制作索引文件;如果在本地可以正常索引,亦可采用虚拟服务器的方式进行编译,请见本楼“三、如何使用上文提到的虚拟服务器?”部分。
③索引文件中采用的是绝对地址而不是相对地址。这个是大忌,例如索引文件中引用的是:file:///d:\aaa\ab.txt,如果索引文件与ab.txt在同一目录下,应将该绝对地址直接改为"ab.txt"即可。

3、编译后文档的顺序与习惯阅读顺序不一致
ISILOX编译文档按以下的顺序进行:
源文件表的优先顺序→主索引文件及次层索引文件(或网页文件)中引用超级链接的顺序。
因此,如果想让编译出来的文档阅读顺序按习惯进行调整,可以将主索引文件链接到的其它文件也拖到ISILOX的Souce窗口中,主索引文件排在第一位,其它文件按章节顺序依次排列,最后是其它的索引文件。

4、还没有想到,欢迎大家提问或补充。

[ 本帖最后由 cdyg 于 2009-3-1 20:03 编辑 ]

cdyg 发表于 2009-2-26 22:26:23

在文本处理时善于利用ULTRAEDIT进行高级搜索与替换

善于使用UEDIT32的高级搜索与替换,可以实现事半功倍的效果。
使用UEDIT32的高级搜索与替换至少有两个最明显的优点:
一、执行速度非常快,是WORD的数千倍,不信你打开一个20M的TXT文档,用UEDIT替换只要3秒钟,用WORD看要不要几个钟头?
二、UEDIT的替换内容可以包括查找到的内容,这是在WORD以及更高级更专业的“微软正则表达式”所都无法支持的,不过这个应用可能大部分的朋友都不知道。

   虽然许多极其复杂的文档查找与替换必须使用较专业的正则表达式来处理,但对于一般甚至比较高级的操作来说,UEDIT还是我们的不二选择。现在我来简要介绍一下UEDIT的查找与替换的高级应用。

以下的示例使用中文版UEDIT10进行讲解
裁剪.png


1. UEDIT查找的快捷键是Ctrl+F(find)或ALT-F3,替换的快捷键是Ctrl+R(replace),再次查找的快捷键是F3。
2. 一般查找与替换功能:
※在查找/替换框内将“正规表达式”的√给去除,并分别在查找与替换的框格内输入所需的字符,执行查找与替换即可。
裁剪_2.png 下载 (11.12 KB)



※如果需要匹配回车键,在查找框中可输入^p(注意p是小写)来代替回车键
说明:在unix格式中^n表示换行,而在mac的文本格式中^r 表示换行,dos格式中^p 表示换行,不过一般情况下^p 可以同时兼容^r 或^p
举例:

dfdf
ss
fssdf给替换为dfdf,ss,fssdf格式:可在查找中输入^p,替换中输入,(半角逗号)即可。
反之将dfdf,ss,fssdf给替换成以上三行只要在查找中输入,(半角逗号),替换中输入^p即可。
高级查找部分:
1.要记住将查找/替换框中的正规表达式给√上
2.常用的查找/替换命令:
%      匹配行头(0字符,仅是匹配一个位置)
$      匹配行尾(0字符,仅是匹配一个位置)
?      在一行中匹配一个单字符
*      匹配一个或多个字符(不允许跨行匹配)
+      匹配+左边的那个字符一或多次(不允许跨行匹配).
++      匹配+左边的那个字符零或多次(不允许跨行匹配).
^b      匹配分页
^p      匹配DOS文本的换行符(通用)
^r      匹配MAC文本的换行符
^n      匹配UNIX格式文本的换行符(在wondows操作系统中一般情况下可与^p互换)
^t      匹配tab符
[ ]      匹配单字符或字符范围
^{A^}^{B^}      匹配A或匹配B
^(...^)      用于替换框中代替查找的内容,后面我会详细说明

其它的都很容易理解,红色部分的我再进行一些说明:
(1)%与$匹配行首与行尾仅是指位置,不匹配具体的字符。

ddffga
a12345
asdgggh
b45546a7676要将a开头行的第一个a给替换为b,在查找中输入%a,替换中输入b执行全部替换即可。
裁剪_2.png



(2)+是匹配左边的字符一或多次,++是匹配左边的字符零或多次:
如将
scccccchool
school
shool的前二行给替换成bool,可在查找框中输入sc+h,替换框输入b;
裁剪_3.png



如将前三行都给替换成aool,可在查找框中输入sc++h,替换框输入b。

(3)[]可匹配多个不同字母中的每一个单字符:如要将以下三行中的a、b、d三个字母都给替换成m,可在查找中输入,替换中输入m
asdaff
bstdf
esdbsf替换后效果为:
msdmff
mstdf
esdbsf
此外,可匹配1~9的任意一个数字,如将以下三行中的数字都给删除:
a34d
s567#
第23页可在查找中输入,替换置空即可。

(4)^{A^}^{B^}匹配A或匹配B,当A或B为单字符时,可在查找中输入即可,否则要用^{A^}^{B^}格式
如以下文本:
一、第一页,一三五
二、第二页,二四六
要将第与页中间的一、二等中文全部给替换成a(但其它位置大写数字不替换),因为汉字占两个(gb2312)或多个字符(unicode),所以这里查找要输入
第^{一^}^{二^}页,替换中输入a。
裁剪_4.png




(5)替换中使用查找中的内容
为了方便讲解,我现举个例子:
以下是我制作《读者》电子书的部分文本,这篇TXT文档非常大,有近4M,里面有2400多篇文章,我现在想把这2400多篇文章给分割出来,在每篇文章的开始处加上一个标识######
裁剪.png



好了,大家观察一下规律,有没有看到每一篇文章的结尾都有“本文摘自《读者》……期P……”,下一行是新一篇文章的开始。

现在我们要查找的是“期p*^p”(即期后跟2个数字再跟任意字符再跟换行符),如果我们直接在替换框中置空,那么就便把刚才被查找的内容包括换行符都给删除了,替换后效果就变成了:
裁剪_5.png


这当然不是我们想要的。
这时只要将“期p*^p”给当作^(...^)中的...的内容,构造成^(期p*^p^),输入到查找框中;
在替换框中输入^1######,,就可以实现我们所需要的替换效果了:(^1是指查找框从左往右数第一个运用^(...^)效果的位置,^2是指第二个位置,以此类推):
裁剪_6.png



裁剪_7.png



(6)录制宏加快文档处理的速度
文章在处理过程中,由于源文件的复杂性,往往要进行后期人工编校,但需要编校的位置常常具有一些规律性,这时可以通过录制与执行宏可提高效率,达到事半功倍的效果。

例如下文中连续两行的行头都出现了#####,而我们仅需要第一行的行头出现#####,
裁剪_8.png



我们可以在查找中输入:
#####*^p#####
裁剪_9.png



找到后取消,跳转到文章头。
然后点击 宏→快速编制宏 (或按Ctrl+shift+R键),开始快速录制新的宏。
然后按Alt-F3(或点击再次查找),将以选中方式跳到第一处找到的位置,
然后按home键,再按向上键,跳转到第一处的#####开始位置,连按5次的del删除键,再按向下键。选择宏→停止录制宏。

好了,下次按Ctrl-M播放宏操作(或Ctrl-L)多次播放宏,就可以循环代替你刚才执行的多个步骤,几秒钟就可以完成后期处理了。不过为了保险起见,最好用Ctrl-M单次播放宏,以免在特殊情况不符合规律时出错。

[ 本帖最后由 cdyg 于 2009-2-26 23:09 编辑 ]

philostone 发表于 2009-2-26 22:31:26

授人以渔、分享经验对大家非常有益!钦佩并预先感谢!有空慢慢来……:)

zcm1019 发表于 2009-2-26 23:19:45

好贴,顶

tchon 发表于 2009-2-26 23:59:34

慢慢来学习,谢谢!

liaoguiquan 发表于 2009-2-27 08:48:37

向老师致敬!!!

weihana 发表于 2009-2-27 09:02:02

俺是来学习的,支持。
快点上酸菜吧民。:lol :lol

md1980 发表于 2009-3-1 09:54:05

用txt如何建立目录?

tchon 发表于 2009-3-1 12:02:39

原帖由 md1980 于 2009-3-1 09:54 发表 https://pdawiki.com/images/common/back.gif
用txt如何建立目录? 好象不行,一定要用html格式才能制作链接目录吧

md1980 发表于 2009-3-1 13:40:18

我写错了,我是想问如何建立一个带目录的pdb电子书,我的源文件是txt格式的!

cdyg 发表于 2009-3-1 18:44:43

原帖由 md1980 于 2009-3-1 13:40 发表 https://pdawiki.com/images/common/back.gif
我写错了,我是想问如何建立一个带目录的pdb电子书,我的源文件是txt格式的!

我在3楼写了个简单的教程,希望对兄弟有所帮助。

wayuzh 发表于 2009-3-3 20:54:31

哇,厉害厉害,下来研究研究

wayuzh 发表于 2009-4-3 20:46:43

学习中,感谢cdyg大哥

yzlliqiang 发表于 2009-4-13 16:05:33

很好的教程,收藏下来,慢慢学习。

nihaocool 发表于 2009-5-27 21:53:02

看来要好好学习一下那个正则表达式,呵呵

vista11 发表于 2009-5-28 00:19:40

坐下来慢慢学习,先顶一个。

YAOLEE 发表于 2009-5-31 02:13:07

看樣子很複雜,有機會我會試用一下。

3d11 发表于 2009-6-17 22:55:38

顶。。。学习了

weihana 发表于 2009-8-27 08:20:08

有一些HTML语言的标签在ISilo里是不支持的,如框架和背景都不会支持的,还有哪些不支持呢?大家在制作过程中请分享一下制作的经验,谢谢。

weihana 发表于 2009-8-27 08:20:37

有些脚本语句和表单也不支持。

CJJT 发表于 2009-9-4 22:28:49

本帖最后由 CJJT 于 2009-9-4 23:33 编辑

想请教一下,为什么我用isilox编译出来的PDB文件里面的标点全部被转换成英文点了,导致很多文字对不起影响观感.

CJJT 发表于 2009-9-4 23:33:40

另一个问题:我的PDB编译出来后,在设备上无法更换字体, 一直都是使用默认字体,想换个字体看书都不行.
页: [1] 2
查看完整版本: ISILO格式电子书制作工具ISILOX相关文档处理工具、教程