|
发表于 2017-3-24 11:49:18
|
显示全部楼层
本帖最后由 LYX1692 于 2017-3-24 13:20 编辑
8 e, Q4 ~" L4 F" k- Z6 X6 c( u4 d: [# K! C2 ` i9 J' D4 c5 P
我来冒个泡吧。
3 t) L; Z% A& W2 ]+ OFilelocator pro 作全文搜索这想法,应该是我先想出来的吧。
: r* x: ]0 a+ m' P至于说去除代码这事,TextForever是可以的。如果单个文件太大,就切割下,反正就算你用Filelocator pro,文件过大也是不便搜索的。" b5 Q9 R, z; x0 f' T4 N
(Python 的 BeautifulSoup 也可以,至少它是有这功能的,我自己只是拿它处理过一些小文档,没有处理过大文档,效果未知)
6 E( t/ i a" f2 v都是要切割成一些小文档,这样不会影响搜索,反而有利于提升搜索速度。
+ Q/ W) @! P! A) u, O" b% o, [5 x# d3 S2 }0 u3 Y4 U5 @2 k3 J3 k
如果是我做,我恐怕不会直接用工具转成纯文本 txt 的。
' l8 L! k1 ^7 R9 s1 J& B我以前做的时候,虽然我知道有更方便的工具,可我还是得用正则来做的。* }# P0 K" N6 ^: S9 f( t- P, h+ c
因为你是要弄成纯文本来搜索,你最好设置好特定的格式。
9 t% p Y) C7 }+ V, B4 p比如说,单词词条上加个五角星什么的。
7 n& E! w) t W4 e0 O6 D* c& a( r0 m# r
像这样:
3 V U4 ^0 L3 ^" h j»He tries to keep his professional life completely separate from his private life. ┊ 他设法让自己的工作和私生活完全分开。~『朗文当代』5 r% t& E1 M' q$ o7 p9 U; z$ k
& {9 a9 i) r* D/ y9 E哪里是例句,哪里是中译,哪里是原文出处。
" b0 c* c" L) p2 ?. q/ p
9 J* v6 L$ |% g4 x3 H* T5 \4 p1 Q以一定的格式来处理 txt,会让你的搜索更有针对性。
) B$ E+ H' v0 M. ~( {2 G导出来之后,也有利于你进一步整理。
0 O+ k$ h' h7 n6 r! A F
- H! _2 L8 g1 \8 L" r这样的话,用正则,一个个htm标签来细心排版,活虽然做得慢点,可是,对你以后想做的事有好处。9 V; Q$ t1 Q: w0 E3 S
, k; O0 J5 L3 C' n& W1 Q
) Q: ]+ V; I6 c/ z0 I
——————
" Z, Z7 q1 V9 p. N$ C( C+ {4 S, e感谢O大帮我看了下发贴时间,看到2013,这让我很感慨。
$ I; e$ N9 G, ?- @2 e2 F7 a- v' n |
|