|
pasado en cosa juzgada
" a9 C& s) u/ l& Y3 T/ X1. loc. adj. Der. pasado en autoridad de cosa juzgada.
1 ^1 C% n' ?+ H<a class="a" href="?id=4UNmzWP#6ATTjFy" style="cursor: pointer;">pasado en autoridad de cosa juzgada.</a>0 W2 R2 L2 z% `0 |3 F R8 Y( ^. ?
原始HTML加粗部分的跳转方式为ID#section
N* ]4 q9 I1 O3 j, ?9 J# |4 J) \【问题来了:需要把ID替换为具体的词头!!!】
) c! ~: Y( l6 O$ @8 j. ~7 K原始文本接近100万行, 替换的情形大约只有6万处, 经过处理, 有ID和词头对应列表。
2 }; I/ |; @, R* M9 y) W9 T) V+ }$ R( e) t6 z/ U
尝试了一些方法, 最终组合使用3个工具解决, 也比较有效率吧. (谁写个高效率的代码直接搞定也好)。。。# ] M' O: a( o4 E4 z- k+ ~
解决方法和步骤:
0 t) E. A! j5 Y F1. 用EmEditor正则给ID号前增加特殊标记1 x- g3 f9 r5 l
2. 用UltraEditor给特殊标记换行 (保证单行只会有1处ID)
$ O( W% A* m1 l3. 用UltraEditor列模式添加行号$ h% j) J! P. F# Q* ?
4.① 用EmEditor正则查找并删除所有不带特殊标记的行, 排序, 删去空行" b% A. y$ e3 p. k
4.② 用EmEditor正则查找并删除所有带特殊标记的行, 另存备用
( X }+ g$ j p$ y5. 将4①得到的结果复制到Excel里, MID函数得到ID号,VLOOKUP函数得到ID号对应的词头, SUBSTITUTE函数替换ID号为词头: D, i" K1 g; p# H1 l R
6. 将得到的结果复制回4②的文本末尾, 用EmEditor排序, 删去空行, 正则删去行首序号, 用UltraEditor将之前特殊标记换行处减行返回正常文本 |
|