掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 2491|回复: 1

[讨论] Tidy-HTML5用于mdx源文件的技巧

[复制链接]
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    发表于 2019-1-7 11:10:20 | 显示全部楼层 |阅读模式
    本帖最后由 VimVim 于 2019-1-7 20:35 编辑 7 Z* i# p0 t! N: d6 M5 A4 P
    & E. u! p! a+ p6 c# i$ `% W6 A, c% x$ g
    看到@garypang 的如下帖子,介绍Tidy是个大杀器,能将html格式化的同时自动修复html里的错误:( Q3 j" s' u/ i$ v" Y
    1 e3 Z& N& |! a
    MDX词组提取 - 从正则进阶到头发护理  https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=26645( R( v, ?  u$ c' V
    9 Q( i5 U! E2 W. ?  A2 o8 l+ f
    我去官网下载了最新的版本:http://binaries.html-tidy.org/. p8 l$ `: _, `" R+ x1 ^
    并做了一些试验,下图左边为源文件,右边为tidy处理后的,发现如下问题. K7 V: h  d6 _* B% i  T* h4 M
    1、添加了不必要的<html><head>等网页头内容,造成词条错误' D" t- \- K7 e
    2、将</>与下一个keyword行合并,造成mdx源文件格式错误
    4 c0 y# f, F! S; W3 Z) C, F3、将</>转化为可读性差的& l t ; / & g t ;' [' O- T' m( P# f1 L# Q

    7 _- l* ]% e/ b4 V  ?  Q! k% L. K4 @6 s% q) _
    7 \" q  B6 [0 p$ m1 C/ u6 D

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?免费注册

    x

    本帖被以下淘专辑推荐:

    • · 中医|主题: 7, 订阅: 0
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

     楼主| 发表于 2019-1-7 20:13:31 | 显示全部楼层
    看了以下配置文档,总算了解了,但解决问题还需要绕几弯:
    % _' c& t' Z8 ]; z5 g6 k! jhttp://api.html-tidy.org/tidy/quickref_5.6.0.html
    3 k% M  \* u7 }9 D. A0 e9 ]( l4 i% ]4 A9 O% A" j- t' a3 x
    针对上贴问题的解决:
      T% l/ }8 |1 |# ~Q1:配置tidy configy.txt文件:show-body-only: yes
    6 r) L! y0 o* mQ2和Q3:
    % F. ?% z* v* F4 i9 t; D! D(1)需暂时将</>替换为<mdx/>,将关键字设置为<keyword>关键字</keyword>- c, r5 x7 A- ?2 U6 t/ ~) E& `9 h
    (2)配置tidy configy.txt文件:new-empty-tags: mdx以及new-blocklevel-tags: keyword1 `/ [, O4 O3 E  E& V9 s0 \4 k
    (3)待tidy完成之后,再将<mdx/>恢复为</>,将<keyword>和</keyword>删除
    - V+ ]% Q1 b4 J# E: F, k; O

    评分

    1

    查看全部评分

    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-6 15:13 , Processed in 0.022869 second(s), 26 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表