|
发表于 2017-3-24 11:49:18
|
显示全部楼层
本帖最后由 LYX1692 于 2017-3-24 13:20 编辑 : V* T' Z6 a- L- |2 b R
7 K5 d0 {3 D9 P7 l我来冒个泡吧。
% }% D/ X: S. \$ m) p! O' PFilelocator pro 作全文搜索这想法,应该是我先想出来的吧。+ x' K9 ?: g3 \+ M9 B/ [1 A; H
至于说去除代码这事,TextForever是可以的。如果单个文件太大,就切割下,反正就算你用Filelocator pro,文件过大也是不便搜索的。5 M" Y9 j, R1 h# _$ O3 \
(Python 的 BeautifulSoup 也可以,至少它是有这功能的,我自己只是拿它处理过一些小文档,没有处理过大文档,效果未知)' F. K7 {8 E' V( \1 J
都是要切割成一些小文档,这样不会影响搜索,反而有利于提升搜索速度。) G. `# @% ^$ N& i5 `& Q
( v! B+ P+ `. g g5 M- k
如果是我做,我恐怕不会直接用工具转成纯文本 txt 的。" V! r7 S( I% F+ ~$ G
我以前做的时候,虽然我知道有更方便的工具,可我还是得用正则来做的。' W% x" n8 r( O0 }
因为你是要弄成纯文本来搜索,你最好设置好特定的格式。
; Q4 k$ T2 H, c9 ^比如说,单词词条上加个五角星什么的。' J# u# w z4 d5 T+ A$ F
* L' ^0 ]6 O6 r0 e
像这样:& q9 B9 O0 F" c' `& S6 d, o
»He tries to keep his professional life completely separate from his private life. ┊ 他设法让自己的工作和私生活完全分开。~『朗文当代』1 q$ K, b' ^: Q
9 m* C, O* w: r, e8 e, ^/ a
哪里是例句,哪里是中译,哪里是原文出处。
! W" |$ a4 E, E& g7 P
3 z) m6 q7 I9 S以一定的格式来处理 txt,会让你的搜索更有针对性。
- G0 ?3 U0 m- n导出来之后,也有利于你进一步整理。
' @ ~6 k, I3 [- h7 J# d5 a4 p5 p1 X( n; l$ l' v
这样的话,用正则,一个个htm标签来细心排版,活虽然做得慢点,可是,对你以后想做的事有好处。/ Z: d9 F$ T* O8 K' l
3 P9 ^0 W3 {( J; K) D' e7 y
& _7 R" b' T4 o/ a+ o——————6 N+ d$ ~& Q- o* x6 e8 z+ f
感谢O大帮我看了下发贴时间,看到2013,这让我很感慨。: a& M: Y; C9 k# A- U M
|
|