|
本帖最后由 惟吾无为 于 2014-1-4 15:25 编辑
4 |/ Z/ x( J2 X+ k
0 M$ D- g9 a& e9 L5 H) Z9 [1 d开源, GPLv2协议. 不会用git. 临时传到百度盘.
( p- N2 l X* w& R1 W, K& t下载链接: http://pan.baidu.com/s/1nt7CIRR#dir/path=%2Fqlvwp%2Fqlvwp6 c! s4 X" _- Y. W
重大更新, 2013年12月30日18:24之前下载的请重新下载. 现在windows上使用自带的lua可以直接打开2G大文件了.# i: s+ q) \- {. g5 J
) d& O( {1 ^6 ^% M本人于1月5日回家, 之后一个半月内没有网络, 期间回复将在元宵后统一处理. (如果过年走亲戚可能提前处理回复下)
8 k6 T6 i% G' F' [1 w# F
. A) f& ]3 f6 {5 Z& o-- zip包有份使用说明, 下面都是废话, 可以不看的 --
! D+ V! N6 G0 G( R8 S. E! ^% u, c% B4 u' h' J; J" ~
在linux上使用wine运行mdxbuilder很慢。所以今后我很会少转mdx。但尽力提供数学公式的更新(过年后会尝试加入zhwiki图片更新); j- q3 k( U; G) e0 a1 Z
/ G C" ~7 R: P% ~5 M7 L- v
灰色文字于2013年12月30日18:24失效 | # y3 i2 S9 c3 p
+ {, R+ s) \" K" N H现在发帖是写注意事项的,我怕明天忘了(话说我一直试图让解析器能直接在windows上运行,结果刚才才发现好几个lua解释器都只能处理2G内的文件。)/ y* |( W2 U3 _' t) h8 o k! g) `
0. 所有脚本都在linux下编写测试, 理论上windows能用, 但不做保证. 编辑脚本时请使用utf8编码, unix换行符.
9 E- C& s2 Y4 {. q2 e1. 有能力的网友可自行编译支持大文件的lua解释器。否则参考第二条处理。
) Y- m, |; d3 h& J8 E2. lua解释器只能打开2G内的文件时,请先使用xml分割工具分割,然后拼接。(别用qlvwp自带的分割拼接脚本,依赖lua, 同样不起作用的)
, t1 O R# c- B( ]# q0 _
6 z3 P6 K! O9 t; {$ O# q |
0 f# H: D1 V4 L
- j- }6 K, _9 V) d2 m" u预期的解析器(lvwp)速度太慢,随着我对维基的了解越来越深,才终于发现这是个多么庞大的系统了,3年前的想法如今还是实现不了,所以出现了这个版本。
( Y, ~& y" \% ]; H4 b x本版本不再试图实现维基的环境,而是保证速度,尽量针对性地人工实现一部分功能(到时模板就是直接运行对应函数,而非处理Template空间的对应页面了)。
( s8 [' {/ g. d1 \2 _' `& q/ t& }qlvwp包括解析器(quick_wiki_parser.lua)和数学公式转换器(convformula.lua)。并额外提供了wiki xml的分割工具和文本合并工具以及xml索引工具及单个词条提取工具。
: e2 b$ ?* S# I- ]3 b2 L ]8 v O! s2 e' g
转换策略如下:
8 v! G) S& W$ R. @1. 先用数学公式转换器生成数学公式对照文件。(到时可使用我提供的对照文件可跳过此步. 记住附上对应的图片mdd)
% I" L( v: E1 a) ^- p; r+ C2. 用解析器处理维基标记文本。(读取数学公式对照文件来确定数学公式的图片名)
7 q3 ` b. q/ _2 m$ `" Z: _*** 提示: 解析器限于lua, 只能使用单核, 如果你是多核电脑又很赶时间, 可先分割成多个小文件, 然后开多个进程来处理它们.
/ K) z0 {5 I: P V+ V- h
- J& B# ?5 C$ |# V2 g功能对比. 图例:√实现 ×未实现 ○小部分实现 ◎大部分实现 & v8 r: s0 [6 R3 R2 l
功能 | 关键字 | qlvwp | mediawiki
$ R& f0 B3 x+ @8 T | 粗体/斜体 | '''/'' | √ | √
6 D" E6 z" U! S) b | 链接 | [...]/[[...]] | ○1 | √
) A" P1 E5 M- _ | 表格 | {|...|} | √ | √" S9 o. c4 N' S
| 公式 | <math> | √ | √
, K& F9 i# v' c, U; H' m | 模板 | {{...}} | ×2 | √7 V$ I! f% ] h9 a, G5 u& J" o
| 列表 | (空格)*#;:- | √ | √
' g% E/ X$ U S8 u | 标题 | =...= | ◎3 | √1 z* H/ c, x$ q' W2 W
| 图片 | [[File:]] | ○4 | √
+ [+ }- X+ ^! }9 J6 ]5 p/ }9 l | nowiki | <nowiki>/<pre> | √ | √
- E" y. p( _2 e* t& B9 a6 ~ | 引用 | <ref> | × | √' T/ i E, W0 q* V5 L0 O; Z
| 相册 | <gallary> | × | √
: ~" u: D1 ?4 l1 r. Y, s, _ | 字词转换 | -{...}- | ×5 | √/ n! z+ H& f% `; u6 l/ J$ Z
| 更多特性未支持... |
: [; P8 l: s- P. |注释:4 o% ?3 I8 E3 t5 y. m
1. 基础的web外接, 站内链接实现了. 图片链接直接返回原始文件名. 跨站链接未处理(转储文件从0.7版好像都没了), 姊妹项目未处理. 分类链接未处理. 就记得这些了...
/ t* y1 V% [5 H8 \ S2. 暂时显示出模板名和所有参数. 可用css屏蔽整个模板块, 或仅屏蔽参数块.; A7 b% z0 u9 Y' l4 \
3. 给标题们加id锚点了, 非url字符使用维基的.XX格式. 但没有生成索引. 需要的话我下次写.# i0 k, l( w8 \1 v1 S: G
4. 图片链接只返回文件名, 其他的都丢弃了.
! n: e9 P8 D1 m" D1 ^5. 暂时没有字词转换. 今后可能实现, 可能不. 同胞們學習下正體中文唄.
( y* Z* z, r1 F" n! e$ ~
3 {0 i0 u, o& s; b界面都是命令行。理论上cmd下亦可运行,未测试。5 H) R3 P: x7 [4 X! _; W
使用说明见usage.txt |
评分
-
1
查看全部评分
-
|