|
发表于 2017-3-24 11:49:18
|
显示全部楼层
本帖最后由 LYX1692 于 2017-3-24 13:20 编辑 / W! i2 e5 D/ F, |6 {8 g7 P
. P, s; \: l, t- m1 {
我来冒个泡吧。$ R9 K$ \) r' d! j5 l
Filelocator pro 作全文搜索这想法,应该是我先想出来的吧。
3 _0 b7 o7 I X! F. y至于说去除代码这事,TextForever是可以的。如果单个文件太大,就切割下,反正就算你用Filelocator pro,文件过大也是不便搜索的。
) v. G+ i/ f5 A6 [7 D(Python 的 BeautifulSoup 也可以,至少它是有这功能的,我自己只是拿它处理过一些小文档,没有处理过大文档,效果未知)
% c" h* G. i9 V! m% N' f1 |9 N$ D都是要切割成一些小文档,这样不会影响搜索,反而有利于提升搜索速度。/ U/ @* L6 I" K" O+ e
& r% N" b" X6 l6 j
如果是我做,我恐怕不会直接用工具转成纯文本 txt 的。
) i* h7 q8 j8 R" J6 k+ j1 \& s我以前做的时候,虽然我知道有更方便的工具,可我还是得用正则来做的。. X* ]+ H" X8 m. q
因为你是要弄成纯文本来搜索,你最好设置好特定的格式。
3 i! g/ |6 y- H, w比如说,单词词条上加个五角星什么的。
1 {0 {: n6 C' O, L% ~, ~9 H6 b- g0 r1 `8 f1 y$ Y* H9 U
像这样:
* \# ~. g; s) E: S5 P) F# l»He tries to keep his professional life completely separate from his private life. ┊ 他设法让自己的工作和私生活完全分开。~『朗文当代』" C, _* o0 S6 Z/ }4 s, T( V
( V. X( i i5 h K- R: o5 @, ~1 v哪里是例句,哪里是中译,哪里是原文出处。
# p/ `" z" f4 L" V+ i3 V/ d* ~3 G' N; g3 g U+ j6 p
以一定的格式来处理 txt,会让你的搜索更有针对性。
$ B d0 M0 Q) N1 A3 O3 ^导出来之后,也有利于你进一步整理。3 R* s3 a- M3 C7 ^0 s! Z
) t/ L# Q0 R1 \4 A) Z- C/ k8 F这样的话,用正则,一个个htm标签来细心排版,活虽然做得慢点,可是,对你以后想做的事有好处。
7 c7 R4 A& z2 B$ Z4 M( r8 \1 P5 M3 f- R& \* Y
! K5 A3 ?* c" ?6 r* K" \4 m8 C
——————
* ^. L) v* X$ U7 v" G+ T9 Q感谢O大帮我看了下发贴时间,看到2013,这让我很感慨。# _+ [! d# Q* B' e) ~
|
|