nullname 发表于 2021-3-11 11:41:47

请教 MDX解包后 样式规则如何还原成文本?

本帖最后由 nullname 于 2021-3-11 11:43 编辑

刚刚解包了一个MDX文件,发现里面的格式是这样:




imgbb图片备份:https://i.ibb.co/6yn4jJm/3.jpg

然后还发现了一个样式规则文本style.txt:



imgbb图片备份:https://i.ibb.co/HtBs6Hf/2.jpg


求助是否有什么方便的方法或工具能将样式信息(图二)还原至源MDX解压出的TXT文本(图一)当中去?

没找到悬赏的按钮,若有帮助我会以点评或其他形式支付米。

喬治兄 发表于 2021-3-11 12:52:45

nullname 兄,不用懸賞,這個是 mdxbuilder HTML compact 的格式,解出後有 style.txt 是它的格式,你若要如圖上的格式,僅能對照 那style.txt 用正則去還原

nullname 发表于 2021-3-11 13:03:40

喬治兄 发表于 2021-3-11 12:52
nullname 兄,不用懸賞,這個是 mdxbuilder HTML compact 的格式,解出後有 style.txt 是它的格式,你若要 ...

谢谢喬治兄,就是在用正则替换的时候发现有些嵌套的层数多一点,有些少一点,还有些标签此有彼无,很费脑筋。所以特地发帖来论坛问问有没有前人造好了轮子能直接还原的..

喬治兄 发表于 2021-3-11 13:15:19

本帖最后由 喬治兄 于 2021-3-11 13:28 编辑

nullname 发表于 2021-3-11 13:03
谢谢喬治兄,就是在用正则替换的时候发现有些嵌套的层数多一点,有些少一点,还有些标签此有彼无,很费脑 ...

nullname 兄:
先還原 `1`, `2`,`3`................
1:
<b style="font-size:180%;">
後再以
尋找==> <b style="font-size:180%;">(.*?)<
替代成==> <b style="font-size:180%;">$1</b><
大概如此吧!我正則不太會....你試試,應該能成吧
箝套的部份....我真不知如何處理

nullname 发表于 2021-3-11 13:36:27

喬治兄 发表于 2021-3-11 13:15
nullname 兄:
先還原 `1`, `2`,`3`................
1:


谢谢喬治兄,已经用正则硬上了,漏网之鱼一个个手工解决

喬治兄 发表于 2021-3-11 13:40:30

本帖最后由 喬治兄 于 2021-3-11 14:37 编辑

nullname 发表于 2021-3-11 13:36
谢谢喬治兄,已经用正则硬上了,漏网之鱼一个个手工解决

仁兄太客氣了,還原我也沒試過....我的正則更是不行,只是一個大概的想法,希望沒有誤導你.....
應該是不會有箝套的,因為 HTML compact 的處理,我不知道 mdxbuilder 如何以如此簡單的編輯來判斷箝套的架構,因為沒有其他標簽明示斷點在哪,所以應該僅能以下一個標簽為斷點,mdxbuilder 應該是無法判斷,HTML compact 應該是沒有箝套的,因為到另一個標簽前就已經是一個斷點,若是有箝套架構應該是不合理也做不到吧!
所以有箝套架構應該是不會用 HTML compact 來編輯的
因成形的架構如此,應該是不會有漏網之魚

bee larva
`1`bee larva`2``2`
蜜蜂幼蟲</br>
</>


static/image/hrline/1.gif

`2`

這是剛好此欄是空的,
所以在結合時會出現 2 個
`2``2`


static/image/hrline/1.gif

HTML compact 的方法應該是適用於編輯資料如 excel 那樣的表格,每一欄都有固定的格式,若哪一個 cell 的資料是空的,就會有留下標簽,但資料是空的狀況,來維持格式

但此並非箝套架構.....如此而以

nullname 发表于 2021-3-11 18:18:04

喬治兄 发表于 2021-3-11 13:40
仁兄太客氣了,還原我也沒試過....我的正則更是不行,只是一個大概的想法,希望沒有誤導你.....
應該是不 ...

对着一堆1234看了大半天,最后看出些规律了,确实没有嵌套,我之前没仔细看,有点浮躁..叹气.. 问题已经解决{:4_105:}
页: [1]
查看完整版本: 请教 MDX解包后 样式规则如何还原成文本?