|
发表于 2017-3-24 11:49:18
|
显示全部楼层
本帖最后由 LYX1692 于 2017-3-24 13:20 编辑
1 j7 X! z) D* j+ G. U4 w' }3 k9 x
我来冒个泡吧。' k, C$ B b; v1 I, \2 h2 g
Filelocator pro 作全文搜索这想法,应该是我先想出来的吧。
- P1 \+ u% @3 o: N, _8 d9 u" m至于说去除代码这事,TextForever是可以的。如果单个文件太大,就切割下,反正就算你用Filelocator pro,文件过大也是不便搜索的。
" j( |$ h: U, @9 v, v(Python 的 BeautifulSoup 也可以,至少它是有这功能的,我自己只是拿它处理过一些小文档,没有处理过大文档,效果未知). P" S7 [8 \' P" U% h: X5 q0 }
都是要切割成一些小文档,这样不会影响搜索,反而有利于提升搜索速度。
* g. h) r8 h' r2 n- r) s
1 m- t* _) L% M0 U3 N如果是我做,我恐怕不会直接用工具转成纯文本 txt 的。, E5 x8 u8 k+ ]1 V9 b* h
我以前做的时候,虽然我知道有更方便的工具,可我还是得用正则来做的。. `* q: @7 |. l* Y2 A2 z' S: y
因为你是要弄成纯文本来搜索,你最好设置好特定的格式。1 W( |1 N4 X1 W- n
比如说,单词词条上加个五角星什么的。; r$ c/ X' S! q6 B" ]8 X
1 l* J( b$ J' d& A! L2 [
像这样:
) z- B# u$ b3 ^2 D4 A- g( L$ Y»He tries to keep his professional life completely separate from his private life. ┊ 他设法让自己的工作和私生活完全分开。~『朗文当代』
+ {3 q3 W% B" @2 u" y- D2 ]: R: B9 m1 i+ g1 U# ` ^' |/ m
哪里是例句,哪里是中译,哪里是原文出处。( d$ @8 _, H7 A( I+ T8 T/ }5 t% j
1 h, r- g# G$ N
以一定的格式来处理 txt,会让你的搜索更有针对性。4 H4 D! |; u% {( J' \. d% v# x' F
导出来之后,也有利于你进一步整理。
- U( ?5 b; M8 t! @* ^
# T% o! Z; M! q这样的话,用正则,一个个htm标签来细心排版,活虽然做得慢点,可是,对你以后想做的事有好处。; O- x3 O: q% r8 a7 O2 `1 Q
. a- f# n! N. Q, [& o% P& e
' s9 `, b6 N; f) S! e2 F( v——————
6 ]; r$ c" ?4 s$ T1 ^4 i感谢O大帮我看了下发贴时间,看到2013,这让我很感慨。
: L9 y5 S a* s6 O6 e i |
|