掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1898|回复: 1

[讨论] Tidy-HTML5用于mdx源文件的技巧

[复制链接]
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    发表于 2019-1-7 11:10:20 | 显示全部楼层 |阅读模式
    本帖最后由 VimVim 于 2019-1-7 20:35 编辑
    . Y' P3 a% h* J" }
    0 w5 m7 O4 Q- P4 @: W9 O看到@garypang 的如下帖子,介绍Tidy是个大杀器,能将html格式化的同时自动修复html里的错误:
    . `/ z3 z. w+ a# u' s) P1 q2 n, @' o9 W9 `6 _- u4 v2 u: u0 q9 V$ R. G
    MDX词组提取 - 从正则进阶到头发护理  https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=26645( l1 e" ^. ]! c5 U* ]

    ! b9 y5 n/ y7 O4 C% v9 H: P我去官网下载了最新的版本:http://binaries.html-tidy.org/2 n* `! ]8 L# p" \$ t
    并做了一些试验,下图左边为源文件,右边为tidy处理后的,发现如下问题
    2 ?/ ]6 w  Y% l8 y4 d1 k  m$ I1、添加了不必要的<html><head>等网页头内容,造成词条错误
    . i+ M) d% Z" o( g( B: k" p1 a2、将</>与下一个keyword行合并,造成mdx源文件格式错误% \( l, W' |4 r/ K+ u6 F
    3、将</>转化为可读性差的& l t ; / & g t ;
    9 A0 {& m! f5 \" y7 y
    6 N( `9 l5 i5 E: A6 t2 N' |, v$ O  X! T! a' \

    . T% {/ Z  |$ L" O

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    本帖被以下淘专辑推荐:

    • · 中医|主题: 7, 订阅: 0
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

     楼主| 发表于 2019-1-7 20:13:31 | 显示全部楼层
    看了以下配置文档,总算了解了,但解决问题还需要绕几弯:
    0 y4 n! L+ H5 _) t  w- }0 uhttp://api.html-tidy.org/tidy/quickref_5.6.0.html3 D8 W0 G3 f" n+ ]6 b8 F
    ; X! F& \* ^! y% A% m8 {
    针对上贴问题的解决:
    2 A& ]$ K* }; D5 V' r. [Q1:配置tidy configy.txt文件:show-body-only: yes
      _9 ~* r' {" f$ |1 w& n4 ~+ KQ2和Q3:
    & }& H% Z' G) ^+ B; h+ w, W) v(1)需暂时将</>替换为<mdx/>,将关键字设置为<keyword>关键字</keyword>
    * @; y9 ]# ?% S" E0 X, [(2)配置tidy configy.txt文件:new-empty-tags: mdx以及new-blocklevel-tags: keyword
    6 F2 Y0 r& R/ P) {5 A(3)待tidy完成之后,再将<mdx/>恢复为</>,将<keyword>和</keyword>删除2 s5 K( x' J' U) l

    评分

    1

    查看全部评分

    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-3-29 19:24 , Processed in 0.029309 second(s), 11 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表