掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1001|回复: 16

[求助] 如何清除空词条

[复制链接]

该用户从未签到

发表于 2014-5-21 16:31:44 | 显示全部楼层 |阅读模式
盘里有个worldbook dictionary词库,每个词条都有一个重复的空白词条,只有词头无内容,想把空白词条清除,不知道用什么正则?

该用户从未签到

发表于 2014-5-21 21:57:22 | 显示全部楼层
期望高手出马指教了,我也顺带学习下。

该用户从未签到

发表于 2014-5-23 13:42:25 | 显示全部楼层
有截图或者代码不

该用户从未签到

发表于 2014-5-23 17:13:17 | 显示全部楼层
我用了一个很笨的方法,用lingvo编译之后再反编译即可。

该用户从未签到

 楼主| 发表于 2014-5-23 19:18:29 | 显示全部楼层
本帖最后由 lzr80 于 2014-5-23 20:04 编辑 2 M; L) I1 E3 P4 u( q
: U7 X" c$ [; s9 [: }0 I
附件传不上来,词库wbd.mdx和用getdict转出来的源文件world book.rar在网盘我的目录里。
2 u* V' f- Y* l4 H) f2 o( x4 S

该用户从未签到

 楼主| 发表于 2014-5-23 19:23:40 | 显示全部楼层
楼上两位道兄请出手

该用户从未签到

 楼主| 发表于 2014-5-23 19:59:52 | 显示全部楼层
1984: s% A9 N# \; i* u
★<font color="blue">1984</font><br>- o& i  Z7 W5 s3 q7 {
: ~6 p" a/ i9 z; q
<br>    a date symbolizing a totalitarian society of the future in which truth and freedom are suppressed and people live in a totally regimented and dehumanized state.
3 \2 x2 i6 i) ]. S* k8 Q<br>    <font color="green">△Ex. Throughout the campaign, the political uses of television advertising and packaging of candidates were heralded ... by doomsayers as the ominous forerunner of 1984 (Time). </font>' H9 [1 h1 c3 m/ J& ?8 o
</>
0 T& m! I7 U, ?1984
5 Q8 B5 T; M, f7 K( [+ |* R★<font color="blue">1984</font><br>1 M7 }0 Z" a6 L8 z% P
8 g# @0 U! c5 \( G
</>; e) d* i- g* m( u
2; S" N/ q8 ?8 @. k( U* N, T
★<font color="blue">2</font><br>2 N2 R" c9 \' i- g9 y, }
4-D, noun./ \! m4 D- i9 n, }& K, Y# j
</>
* a' ], b! s$ V3 j28 k% x+ o' n5 ~5 L1 N
★<font color="blue">2</font><br>+ r5 L; G/ h  g: L! E+ A) S$ |$ u
4-D, noun.
( f$ v& v+ A% N- r/ d7 A7 N<br>    a poisonous, crystalline substance used to kill weeds. 1 c+ H& u4 Q9 h9 S
</>
4 D0 i) z1 ]7 V" [2
2 b2 a! u8 r: x. g1 {★<font color="blue">2</font><br>
5 `* E  _  o. k2 M+ J5 c* |4,5-T, noun.
7 N* e8 T# E3 ^<br>    a poisonous, crystalline substance used to kill weeds. 8 A+ W( Q' V' p6 m
</>% }/ K$ C: x8 A. i3 ~
2
  M& Z7 n3 Z4 t6 Y★<font color="blue">2</font><br>
0 o: I- I9 Q- B6 A; ^) ^; f( K4,5-T, noun.
: k/ U" \/ r$ l  x# ~+ L</>
" F: }, S% g! f) Y
: ?: o  I$ Q  `* L上面是开头几个词的代码

该用户从未签到

发表于 2014-5-23 21:03:07 | 显示全部楼层
itarcy能关注该贴,真好啊,期望能指点了。谢谢itarcy!

该用户从未签到

发表于 2014-5-23 21:09:00 | 显示全部楼层
空白行啊?
  1. \n\n
复制代码
替换为
  1. \n
复制代码

该用户从未签到

 楼主| 发表于 2014-5-23 23:23:47 | 显示全部楼层
不是空白行,是这样

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

该用户从未签到

 楼主| 发表于 2014-5-23 23:37:43 | 显示全部楼层
转换时显示28万词,实际是14万,另外14万是重复的,只有词头,无内容。

该用户从未签到

 楼主| 发表于 2014-5-23 23:42:16 | 显示全部楼层
mitkyg兄不知修改完成没,可否发出来?

该用户从未签到

发表于 2014-5-23 23:42:42 | 显示全部楼层
哦,这种啊,这种怕是会误杀(有的没内容的排在前面,有的排在后面;而且行数也不固定),看大人们有没办法

该用户从未签到

 楼主| 发表于 2014-5-24 00:08:30 来自手机 | 显示全部楼层
这个词库文本来源网上,可能原文件有问题

该用户从未签到

发表于 2014-5-24 11:47:57 | 显示全部楼层
簡單講 正則搞不定 Excel 可搞定

该用户从未签到

 楼主| 发表于 2014-5-24 16:36:38 | 显示全部楼层
道兄能否讲一下

该用户从未签到

发表于 2014-5-24 20:55:14 | 显示全部楼层
正則做不到的比對 IF函數可以辦到
3 w( A% z( W6 H8 x6 B5 p加上排序、移除重複" N' @; }6 `7 X
能用的手段很多0 {( S3 m2 s7 m# _
- o/ B; ^, h/ Z
再來就是要處理二十萬筆的數據
/ {  V8 @0 k" `( N5 a; e$ L. GExcel 版本不能太舊
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

小黑屋|手机版|Archiver|PDAWIKI |网站地图

GMT+8, 2024-4-29 20:31 , Processed in 0.066110 second(s), 9 queries , MemCache On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表