掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 725|回复: 7

[求助] 关于此问题,如何用正则表达式解决?

[复制链接]

该用户从未签到

发表于 2015-11-8 15:28:22 | 显示全部楼层 |阅读模式
各位大神:
& b$ `& _2 R; Y) S8 R
. t, m- C: u5 T: K假设词条如下:
4 ^6 G; k# c4 ]- e) K( V' q( \
- q: V. s4 F1 g) n; L+ i【解决】①处理问题使有结果。~困难|~问题|~矛盾。②消灭(坏人):残余匪徒全给~了。
/ ^, V/ i! J8 G# _8 T& s( h& t3 A6 Y) g  ?( M
如何使用正则表达式,剔除解释和例句。只留下【解决】或解决二字就好?

该用户从未签到

发表于 2015-11-8 16:25:51 | 显示全部楼层
你意思是提取词头?可以试试置顶的sunsmile的神器

该用户从未签到

 楼主| 发表于 2015-11-8 20:24:02 | 显示全部楼层
本帖最后由 ly1316 于 2015-11-8 20:27 编辑
9 E! b! w% c8 G  v- ]" Y3 u" k- K
Hugh 发表于 2015-11-8 16:25
3 {( J6 R1 }- S" w8 T9 ~6 P你意思是提取词头?可以试试置顶的sunsmile的神器

8 D! m6 F2 C9 h& f9 Z+ B0 f& W5 N! o; g$ N% ?& u
首先感谢Hugh大大的回答。
. O* r7 v% d' j1 d+ N8 H
2 B( t/ f5 J& @6 p/ a我的确只想提取词头,但您说要"置顶的sunsmile的神器",我则不太明白,它是一套軟件嗎?否者是......。是否可以请您再说清楚些。谢谢!

该用户从未签到

发表于 2015-11-8 20:59:11 | 显示全部楼层
" T4 y" X9 s  r6 L
工具:UltraEdit ,正则表达式引擎是 Perl,注意文本是 DOS 格式。
6 c  @0 F) O1 B: N: {* t# ^0 ^' ?-
3 }/ F& _5 o/ [1 W6 b3 |1 o第一步、+ Z8 `- u/ r" ^
】替换为\r\n】. w6 N8 A4 \# X3 H
第二步、/ l- [4 d4 V6 J2 G! b, C
^】.*$\r\n替换为空
( u  o; S( y( A* W/ j, e/ g. U' j第三步、9 F/ U1 |+ b. W. Q& x
【替换为空, a% O9 Y( B2 U3 d3 t  w
-
) ^/ ]9 d7 y( b- O' N

该用户从未签到

 楼主| 发表于 2015-11-8 21:06:59 | 显示全部楼层
Hugh大大:
7 u+ N1 u) e4 O# _& x1 Y, |9 @( X
刚刚摸索了一下,我了解你的意思了!您是指SourceEditor这套软件吧?这套软件的确可以取出词头,但它应该只适用于已编好的mdx,可将之导出。但我的情况是想将纸本词典OCR后,只取词头的部份来编辑,不知是否可用正则表达式来达到我要的效果?如果可以,应如何写出正则表达式?感谢!

该用户从未签到

 楼主| 发表于 2015-11-8 21:39:18 | 显示全部楼层
Oeasy 发表于 2015-11-8 20:59
3 N2 H9 ~: S/ I; g, F  [工具:UltraEdit ,正则表达式引擎是 Perl,注意文本是 DOS 格式。$ ~7 v6 L) E. F1 m+ z% v( K' a
-( l* ]- B. Z6 o+ w( ^) r
第一步、
0 R" \, i# g' y7 Z' d; E$ k! M
Oeasy 大大:1 f6 o8 s, i% o- d0 f  c

6 ]8 D- R- u/ o/ s2 A' r太感谢你了!我终于成功了。不过我用的软件不是UltraEdit,而是Notepad++。按您的方法操作了一下,一样可达到所要的效果。

该用户从未签到

发表于 2015-11-8 21:48:36 | 显示全部楼层
如果用emeditor
7 t7 F  o$ N+ ]$ j- R
9 @) V4 \& d2 [$ B/ m5 T% k  L^【([^】]*?)】.*$$ ~' Q3 A  F! o( ^

+ O. S* ?& d6 D, V2 F取代成
: L: X; J5 t5 z# ~\1
& z6 A; [3 q) \' ?
8 T# N6 }# w, l6 |, _但是我的疑问是, 现汉六不是有mdx了? meigen版里面已经有七万多个词头..
8 _% L& A4 e8 z. R+ V! P

该用户从未签到

 楼主| 发表于 2015-11-8 23:07:57 | 显示全部楼层
sky66 发表于 2015-11-8 21:48
5 L$ F! @8 T( o& T: u  ~8 }+ _如果用emeditor
) b. n6 `! E* X! _( A- m+ R% @2 }1 Z8 `. f8 Q0 g$ ^. q6 w
^【([^】]*?)】.*$

, N& g% q4 ^  q8 O$ ]sky 大大:5 i- ]- U- Y" \6 W8 x2 S
+ X8 g4 M) U, E, s. U5 R1 F
您的方法更加简洁利索了!一样能达到我要的效果。(崇拜中)
4 |, X# G# [3 r. }
- `! N4 f3 x4 o  z/ ]$ a我知道《现汉六》有mdx。但目前自己编辑的词典不是《现汉六》,而是《世说新语辞典》(百度网盘找的)。我的想法是想透过OCR,先将之文本化,再透过正则表达式,取出词头,进行编辑。最后连结图片,使之成为图片版词典。(如此会不会是最省key in的时间,也是最快编辑出一本词典的方式?)
% e6 Q; M8 m& N* T
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

小黑屋|手机版|Archiver|PDAWIKI |网站地图

GMT+8, 2025-5-8 09:23 , Processed in 0.020914 second(s), 21 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表