掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 669|回复: 4

[求助] [已解决] 文本批量替换问题

[复制链接]

该用户从未签到

发表于 2015-11-20 23:59:39 | 显示全部楼层 |阅读模式
pasado en cosa juzgada
" a9 C& s) u/ l& Y3 T/ X1. loc. adj. Der. pasado en autoridad de cosa juzgada.
1 ^1 C% n' ?+ H<a class="a" href="?id=4UNmzWP#6ATTjFy" style="cursor: pointer;">pasado en autoridad de cosa juzgada.</a>0 W2 R2 L2 z% `0 |3 F  R8 Y( ^. ?
原始HTML加粗部分的跳转方式为ID#section
  N* ]4 q9 I1 O3 j, ?9 J# |4 J) \【问题来了:需要把ID替换为具体的词头!!!】
) c! ~: Y( l6 O$ @8 j. ~7 K原始文本接近100万行, 替换的情形大约只有6万处, 经过处理, 有ID和词头对应列表
2 }; I/ |; @, R* M9 y) W9 T) V+ }$ R( e) t6 z/ U
尝试了一些方法, 最终组合使用3个工具解决, 也比较有效率吧. (谁写个高效率的代码直接搞定也好)。。。# ]  M' O: a( o4 E4 z- k+ ~
解决方法和步骤:
0 t) E. A! j5 Y  F1. 用EmEditor正则给ID号前增加特殊标记1 x- g3 f9 r5 l
2. 用UltraEditor给特殊标记换行 (保证单行只会有1处ID)
$ O( W% A* m1 l3. 用UltraEditor列模式添加行号$ h% j) J! P. F# Q* ?
4.① 用EmEditor正则查找并删除所有不带特殊标记的行, 排序, 删去空行" b% A. y$ e3 p. k
4.② 用EmEditor正则查找并删除所有带特殊标记的行, 另存备用
( X  }+ g$ j  p$ y5. 将4①得到的结果复制到Excel里, MID函数得到ID号,VLOOKUP函数得到ID号对应的词头, SUBSTITUTE函数替换ID号为词头: D, i" K1 g; p# H1 l  R
6. 将得到的结果复制回4②的文本末尾, 用EmEditor排序, 删去空行, 正则删去行首序号, 用UltraEditor将之前特殊标记换行处减行返回正常文本

该用户从未签到

发表于 2015-11-21 01:16:32 | 显示全部楼层
EmEditor不就有批次取代功能了嗎?

该用户从未签到

 楼主| 发表于 2015-11-21 04:23:49 | 显示全部楼层
ryuya 发表于 2015-11-21 01:16
" f$ O/ m! f0 {EmEditor不就有批次取代功能了嗎?

0 q( }5 O4 g9 c0 G0 i是有啊。但是加载接近十万个LIST,然后批量替换。。。等了半天还没有结果。。。假死状态) Y8 z, p. f; `$ w  h
主要是替换的LIST大,要替换的文本也大。
  • TA的每日心情
    郁闷
    2018-5-17 09:15
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2015-11-21 09:41:22 | 显示全部楼层
    的确很麻烦,楼主你这种方式很费时间,这种方法前提是要把文件开启后才能处理。但文件数量大这些软件都会假死,分批次一点点处理又太累人了,不知还有没有其它更好的工具不用开启文件就能批处理的。
  • TA的每日心情
    难过
    2025-3-15 05:59
  • 签到天数: 37 天

    [LV.5]常住居民I

    发表于 2015-11-29 13:20:50 | 显示全部楼层
    楼主好厉害,以及开始自己制作词典了
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-8 09:24 , Processed in 0.020013 second(s), 21 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表