掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1661|回复: 1

[讨论] Tidy-HTML5用于mdx源文件的技巧

[复制链接]
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    发表于 2019-1-7 11:10:20 | 显示全部楼层 |阅读模式
    本帖最后由 VimVim 于 2019-1-7 20:35 编辑
    - q& f  X* v( B! }1 J; F- _
    0 j: h, W! S6 x3 O看到@garypang 的如下帖子,介绍Tidy是个大杀器,能将html格式化的同时自动修复html里的错误:4 n8 V3 J0 ?. {0 i
    / Q  d5 M$ o' n- {: K6 L
    MDX词组提取 - 从正则进阶到头发护理  https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=26645
    0 J( O# T. D8 r7 I+ A0 V7 B# n6 A9 @& T
    我去官网下载了最新的版本:http://binaries.html-tidy.org/3 p& b: @+ V) b* |
    并做了一些试验,下图左边为源文件,右边为tidy处理后的,发现如下问题3 l( U1 j* [, B( J6 p; B
    1、添加了不必要的<html><head>等网页头内容,造成词条错误! v+ e9 X9 ?8 ]1 V' N9 ]" q
    2、将</>与下一个keyword行合并,造成mdx源文件格式错误" P1 B2 R' {/ \: S" O
    3、将</>转化为可读性差的& l t ; / & g t ;7 ^7 S2 C7 p* B+ b- ?

    " d0 {" T+ \3 s# }3 r) t! j5 o; u0 T; \1 Z. z1 W
    8 P1 c2 p1 H+ q( W! T4 b) }

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    本帖被以下淘专辑推荐:

    • · 中医|主题: 7, 订阅: 0
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

     楼主| 发表于 2019-1-7 20:13:31 | 显示全部楼层
    看了以下配置文档,总算了解了,但解决问题还需要绕几弯:, k: p5 |; g4 l
    http://api.html-tidy.org/tidy/quickref_5.6.0.html
    + H5 H$ c% D3 m+ b% W! T( R% G9 }  B. d
    针对上贴问题的解决:
    " F/ ^- K5 Q/ y5 r2 \' h0 {Q1:配置tidy configy.txt文件:show-body-only: yes
    " b  ]4 R3 ?6 q3 \8 j+ wQ2和Q3:
    4 u/ [% q+ ^( T( l(1)需暂时将</>替换为<mdx/>,将关键字设置为<keyword>关键字</keyword>
    ; p& N/ i+ b1 \! N7 z(2)配置tidy configy.txt文件:new-empty-tags: mdx以及new-blocklevel-tags: keyword; K; C9 O. t9 V7 m0 K
    (3)待tidy完成之后,再将<mdx/>恢复为</>,将<keyword>和</keyword>删除& Y- B+ X4 B/ {; S6 [7 c9 m

    评分

    1

    查看全部评分

    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2023-12-10 02:44 , Processed in 0.034840 second(s), 12 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表