掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1944|回复: 1

[讨论] Tidy-HTML5用于mdx源文件的技巧

[复制链接]
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    发表于 2019-1-7 11:10:20 | 显示全部楼层 |阅读模式
    本帖最后由 VimVim 于 2019-1-7 20:35 编辑
    : W1 D$ Z  i, t6 A5 ~% R- H$ \: @3 C4 v$ d. g$ N: q
    看到@garypang 的如下帖子,介绍Tidy是个大杀器,能将html格式化的同时自动修复html里的错误:% ^/ y8 L# W1 M' t! p+ D
    : _  D3 O4 L2 E- k
    MDX词组提取 - 从正则进阶到头发护理  https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=266450 h& r8 h2 K( n4 y7 [0 x

    6 u$ K8 W5 X% ?5 G: X我去官网下载了最新的版本:http://binaries.html-tidy.org/9 I+ t/ z7 r( P; l
    并做了一些试验,下图左边为源文件,右边为tidy处理后的,发现如下问题- j9 b4 M$ D% h1 \9 |* C
    1、添加了不必要的<html><head>等网页头内容,造成词条错误% [3 x. U1 W0 _7 U
    2、将</>与下一个keyword行合并,造成mdx源文件格式错误
    : k: ]7 T7 ?& v# U4 x1 t( ?$ P3、将</>转化为可读性差的& l t ; / & g t ;9 e/ ~. d* s9 J# s3 W
    ; Z  C+ d. q( ~7 b
    " q) r; l5 O: h8 j

    % Z1 d3 t. H3 C7 ~1 n6 V' y" y

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    本帖被以下淘专辑推荐:

    • · 中医|主题: 7, 订阅: 0
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

     楼主| 发表于 2019-1-7 20:13:31 | 显示全部楼层
    看了以下配置文档,总算了解了,但解决问题还需要绕几弯:0 e* G, }; U4 \( ?
    http://api.html-tidy.org/tidy/quickref_5.6.0.html
    ) W, B7 R4 Z" }, ~/ D$ @
      Z+ C: @9 |- ]针对上贴问题的解决:
    $ ^/ m2 @! h6 h. c4 _Q1:配置tidy configy.txt文件:show-body-only: yes8 \+ P, h8 q. y! E0 _$ U
    Q2和Q3:
    7 F9 v3 I5 C1 b(1)需暂时将</>替换为<mdx/>,将关键字设置为<keyword>关键字</keyword>; z3 n  A/ y+ H5 y; }6 a# g
    (2)配置tidy configy.txt文件:new-empty-tags: mdx以及new-blocklevel-tags: keyword
    9 T/ w' t9 C* q( P7 J2 D(3)待tidy完成之后,再将<mdx/>恢复为</>,将<keyword>和</keyword>删除
    3 |7 r1 M: Y- z- z" i0 c( `" Z

    评分

    1

    查看全部评分

    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2024-4-26 07:46 , Processed in 0.044956 second(s), 14 queries , MemCache On.

    Powered by Discuz! X3.4

    Copyright © 2001-2023, Tencent Cloud.

    快速回复 返回顶部 返回列表