掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1897|回复: 1

[讨论] Tidy-HTML5用于mdx源文件的技巧

[复制链接]
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    发表于 2019-1-7 11:10:20 | 显示全部楼层 |阅读模式
    本帖最后由 VimVim 于 2019-1-7 20:35 编辑
      E+ O# |; V4 Y* x3 X% V9 U8 z3 N8 Q, ?# W& {  l
    看到@garypang 的如下帖子,介绍Tidy是个大杀器,能将html格式化的同时自动修复html里的错误:
    3 `- R% i! w  a% v. n* P
    , U; |4 |" b, ^0 \MDX词组提取 - 从正则进阶到头发护理  https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=26645; E6 D3 K, P: t. O5 U2 J) \, t/ C7 z
    $ L$ |0 f! L3 w/ S( G* z. l
    我去官网下载了最新的版本:http://binaries.html-tidy.org/
    ; X7 y/ F4 L& o# F  n并做了一些试验,下图左边为源文件,右边为tidy处理后的,发现如下问题. @7 I: @' i9 }( H# J
    1、添加了不必要的<html><head>等网页头内容,造成词条错误; j" w/ z$ Y. D
    2、将</>与下一个keyword行合并,造成mdx源文件格式错误
      H( O" U( r, w( v4 p8 d5 y3、将</>转化为可读性差的& l t ; / & g t ;
    9 g* ~2 i7 _! t# T8 [: ?  b
      k( _" x, J7 U; F9 z
    " H9 }  M; k8 C3 H- |) m
    , X  Z- D+ {% X% E- k) ]

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    本帖被以下淘专辑推荐:

    • · 中医|主题: 7, 订阅: 0
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

     楼主| 发表于 2019-1-7 20:13:31 | 显示全部楼层
    看了以下配置文档,总算了解了,但解决问题还需要绕几弯:% R4 A9 _, I2 p& w( N5 Q8 }& H$ Q, R
    http://api.html-tidy.org/tidy/quickref_5.6.0.html
      l; z/ a1 P- n- b, p  O7 {6 {1 k( l/ |1 ?3 I/ k$ |+ q
    针对上贴问题的解决:
    ; H. u7 Z- E7 {  V$ I, X) DQ1:配置tidy configy.txt文件:show-body-only: yes. E6 B4 ^0 ]0 b2 s' T
    Q2和Q3:1 S! I; X' w. k3 W) d
    (1)需暂时将</>替换为<mdx/>,将关键字设置为<keyword>关键字</keyword>
    ( h  y# s' o  C; l; ~(2)配置tidy configy.txt文件:new-empty-tags: mdx以及new-blocklevel-tags: keyword- o! M. l. a; \" U( e' v
    (3)待tidy完成之后,再将<mdx/>恢复为</>,将<keyword>和</keyword>删除
    & D( o* t! [! q$ E7 D6 f$ N; ]. y

    评分

    1

    查看全部评分

    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-3-29 15:38 , Processed in 0.032228 second(s), 11 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表