掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 3521|回复: 48

[经验心得] 搭建本地全文搜索数据库,快速提高理解能力。

[复制链接]
  • TA的每日心情

    3 天前
  • 签到天数: 112 天

    [LV.6]常住居民II

    发表于 2019-2-26 16:50:19 | 显示全部楼层 |阅读模式
    本帖最后由 孤影 于 2019-6-8 12:00 编辑
    7 l& O  `4 H0 ]7 I+ B8 P2 V
    ! i0 a# W3 J5 r1 ?3 Q$ e# l* X4 Y) E意大利语 读秀 2019年5月1日
    + ?& E7 a$ L4 l# A* ~3 @% qhttps://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=34449
    . m) s1 j4 l) N(出处: 掌上百科 - PDAWIKI)5 q1 y5 J- a8 ^# N# L, l& S  @& [

    ; p4 U+ x" ]6 M9 `- U. e( q& s; d6 D# h心理学类双层PDF书籍 200本 10GB
    9 I# G, O' Q- z) J$ d) h# [- thttps://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=33600* R$ ]7 G1 r! p# j3 L# O. r( @3 D
    (出处: 掌上百科 - PDAWIKI)
    / }& O% T$ ]! P
    1 G6 b+ v- D! b+ N. Z7 g/ Q公共服务领域英文译写规范 PDF_OCR
    8 H0 e7 r& _9 |6 Uhttps://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=34620; O$ X4 g# B" W$ N! f6 U
    (出处: 掌上百科 - PDAWIKI); s, J9 Z& R, A9 G) [7 M, r; {
    ( G2 q4 ~0 B+ Z& ]
    " H: f+ a  a, A4 Q! P. C

    5 M& E- p* w  t3 P9 g6 r  h# }: I3 ^* |) l0 d, y2 e7 ]
    0 p& j  c) Q! T. L& ?
    2 ]8 h8 N( k7 s! d" ^9 L1 X
    ' z; L* W$ w$ s
    3 {7 Z% x1 Q# ^  G
    6 M0 F$ ^9 @" ?- h- N* P
    数据收集
    • http://www.duxiu.com  图片版资源,有相关的下载技巧,某宝有售
    • https://www.amazon.cn kindle电子书,出版级资源,可和谐
    • 搜索术 通过各类搜索引擎,各显神通( a/ Q' \1 q4 n0 M6 G0 ?

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?免费注册

    x

    评分

    2

    查看全部评分

    本帖被以下淘专辑推荐:

  • TA的每日心情

    2019-6-17 12:07
  • 签到天数: 57 天

    [LV.5]常住居民I

    发表于 2019-3-18 07:35:34 | 显示全部楼层
    其实本人也在论坛中游荡多年,从论坛中获得了很多宝贵资源,真的非常的感谢。+ P( [0 {0 C( R0 i( G7 p1 y2 j! P& G, i2 ^& b
    感谢那些无私奉献的人。
      J/ W" q7 O) D9 y' }, t8 h1 Q每次看到做出的精美的mdx,心里也会有一丝感动,感动的不光是词典本身,而是制作者精益求精的态度及执着的精神。0 o3 \5 E5 @% w4 B
    8 o/ a: P( ~' ~3 M, V2 r( I$ a放眼望去,几年之中,论坛的制作高手相继的离开大家的视线,当然也有新人涌现,但是能够像O大这样坚守和无私奉献的人真是寥寥无几。4 }! o2 U+ M. f% g* i9 S1 W* M* w0 d# n' T" i, `
    本人真心佩服O大和感谢O大,真的是辛苦了
    5 P2 Z2 S9 T9 a# Q# p

    评分

    1

    查看全部评分

  • TA的每日心情
    开心
    2018-3-30 09:21
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    发表于 2019-2-27 09:29:03 | 显示全部楼层
    为什么不试试这个,记得论坛上有人推荐过- b# W0 x+ O* }& F3 @
    Archivarius 3000 v4.78 Multilingual x86/x64
    ( H, o1 c' i+ n, P" M" e+ Jhttps://www.0daydown.com/07/185643.html
    , T. ]' M1 P! `" z7 |官方http://www.likasoft.com/document-search/index.shtml; A& w5 [/ l! a; D
    最新版4.79: g% ^, L% I- @% e# v/ p

    . s; K' m9 e, n+ R

    该用户从未签到

    发表于 2019-3-25 17:02:02 | 显示全部楼层
    试了下,还是百度硬盘强大。可惜已经很久不更新了。
  • TA的每日心情

    3 天前
  • 签到天数: 112 天

    [LV.6]常住居民II

     楼主| 发表于 2019-2-26 16:56:41 | 显示全部楼层
    本帖最后由 孤影 于 2019-2-26 08:22 编辑
    ( Y8 R; ]' J0 m2 L
    8 o' P1 i; U! F/ T. V8 h" c使用abbyy批量OCR的时候会有两个问题2 S* e& O* L$ M& Q
    1、性能低下
    7 g9 l/ n: ]/ s5 i/ L6 b   可以通过虚拟机多开解决,不建议,不过没其他的办法8 F. k, q9 p% u, Z
    2、不能保存源文件的书签
    & G& P/ R( K2 @6 L& J" }   需要自己写程序,懒,还没写
  • TA的每日心情
    奋斗
    2019-4-14 02:12
  • 签到天数: 93 天

    [LV.6]常住居民II

    发表于 2019-2-26 21:18:32 | 显示全部楼层
    孤影 发表于 2019-2-26 16:56
    1 X/ p. \6 \2 l- e5 Q使用abbyy批量OCR的时候会有两个问题
    + g1 @% q" m, ^9 F+ y1、性能低下   O) @) S/ c$ v1 q
       可以通过虚拟机多开解决,不建议,不过没其他的办法
    ( O3 j# S3 K2 x
    原来PDF也可以全文搜索… ; a& @3 J; n- b5 J8 k  q3 t
    通过Adobe Acrobat Pro OCR的图片PDF也可以这样用对吧2 M5 M6 y+ _/ N* d8 B
    想想有点激动…
  • TA的每日心情

    3 天前
  • 签到天数: 112 天

    [LV.6]常住居民II

     楼主| 发表于 2019-2-26 21:53:56 | 显示全部楼层
    jonah_w 发表于 2019-2-26 12:18/ b8 z+ [: X6 ~. Y, t1 f
    原来PDF也可以全文搜索…
    2 o9 M; ^% d3 a4 F. D6 `! ?通过Adobe Acrobat Pro OCR的图片PDF也可以这样用对吧
    8 }4 G2 k9 f/ n4 X- }- {4 W1 I/ Y1 k! {想想有点激动… ...

    % C7 |! s; B  e0 Y  {* I可以
  • TA的每日心情
    奋斗
    2019-4-14 02:12
  • 签到天数: 93 天

    [LV.6]常住居民II

    发表于 2019-2-26 22:08:23 | 显示全部楼层
    孤影 发表于 2019-2-26 21:53/ U' n& n4 ?0 `& L" p# {  w. T
    可以

    % r. \! o1 c+ H+ h1 q不过我刚用rg全文搜索命令去搜,好像不行。是不是必须用FileLocator Pro 软件才可以支持pdf内的全文搜索… 另外试了epub文件和mobi文件貌似都不支持rg命令
    - t1 z0 a2 X8 a# l9 e3 m; U8 w1 }; v: ]
  • TA的每日心情

    3 天前
  • 签到天数: 112 天

    [LV.6]常住居民II

     楼主| 发表于 2019-2-26 22:10:42 | 显示全部楼层
    jonah_w 发表于 2019-2-26 13:08& D/ {7 T* h) j
    不过我刚用rg全文搜索命令去搜,好像不行。是不是必须用FileLocator Pro 软件才可以支持pdf内的全文搜索 ...

    & k$ s% A( x  p* l1 G这个东西还需要细细研究。
    , y7 R/ P/ {& ]5 I我又了解了到了一个新的软件Citavi 6,比filelocator好用。
  • TA的每日心情
    奋斗
    2019-4-14 02:12
  • 签到天数: 93 天

    [LV.6]常住居民II

    发表于 2019-2-26 22:16:46 | 显示全部楼层
    孤影 发表于 2019-2-26 22:10$ V. s1 V. V: K0 f2 D& {( k
    这个东西还需要细细研究。
    9 b5 r( Q- r% p! `: d6 n6 f我又了解了到了一个新的软件Citavi 6,比filelocator好用。 ...

    5 J& l+ [& O5 ^7 }0 K# {我去搜搜看
  • TA的每日心情
    奋斗
    2019-4-14 02:12
  • 签到天数: 93 天

    [LV.6]常住居民II

    发表于 2019-2-26 22:21:48 | 显示全部楼层
    孤影 发表于 2019-2-26 22:10' E2 b+ [6 G2 S0 J" ^, K# N
    这个东西还需要细细研究。
    9 \) B$ T) h! y4 n& A我又了解了到了一个新的软件Citavi 6,比filelocator好用。 ...
    $ ]1 l+ ^: m; b( d4 u9 M5 X
    好像不支持mac os
  • TA的每日心情

    3 天前
  • 签到天数: 112 天

    [LV.6]常住居民II

     楼主| 发表于 2019-2-26 22:23:02 | 显示全部楼层
    jonah_w 发表于 2019-2-26 13:21
    7 T0 B2 R8 z) A5 _好像不支持mac os
    5 O0 @9 F$ `) f; Q5 N
    对哦
  • TA的每日心情

    3 天前
  • 签到天数: 112 天

    [LV.6]常住居民II

     楼主| 发表于 2019-2-26 22:37:03 | 显示全部楼层
    jonah_w 发表于 2019-2-26 13:21; w" p  I; N: J; J, F
    好像不支持mac os

    % b$ m9 U/ s4 A4 O' e. ~gl_n老哥给我推荐了DEVONthink这是mac独享 158欧
  • TA的每日心情
    奋斗
    2018-5-18 05:02
  • 签到天数: 27 天

    [LV.4]偶尔看看III

    发表于 2019-2-26 22:37:37 | 显示全部楼层
    jonah_w 发表于 2019-2-26 22:21
    , H2 a& K$ w1 l9 L( G* q: s+ M) ~好像不支持mac os
    6 X5 b- b/ \$ R8 I
    Mac里用这个:DEVONthink,媲美citavi
  • TA的每日心情
    奋斗
    2019-4-14 02:12
  • 签到天数: 93 天

    [LV.6]常住居民II

    发表于 2019-2-26 22:56:38 | 显示全部楼层
    GL_n 发表于 2019-2-26 22:37
    . U$ g* E; P) W* J, IMac里用这个:DEVONthink,媲美citavi
    , [- M* P: b& k: B, x: O
    好,马上试试,感谢老哥
  • TA的每日心情
    奋斗
    2019-4-14 02:12
  • 签到天数: 93 天

    [LV.6]常住居民II

    发表于 2019-2-26 23:46:26 | 显示全部楼层
    GL_n 发表于 2019-2-26 22:37; U1 ~, }( f, E
    Mac里用这个:DEVONthink,媲美citavi

    ' Y3 x+ g$ h* y研究了一下,这个软件支持txt等基本格式,但好像对pdf支持很一般,搜索的时候不能直接显示pdf内容。* Y/ q& f& {; j
    像filelocator里这样:直接显示文字内容$ Z9 R3 ]4 z) t, \
  • TA的每日心情

    3 天前
  • 签到天数: 112 天

    [LV.6]常住居民II

     楼主| 发表于 2019-2-27 00:29:47 | 显示全部楼层
    jonah_w 发表于 2019-2-26 14:464 n4 z8 [, c! ?; d; M1 N! C
    研究了一下,这个软件支持txt等基本格式,但好像对pdf支持很一般,搜索的时候不能直接显示pdf内容。
    $ Z$ |$ K6 X' t像fi ...
    # A: t7 [/ }8 y9 P; k
    对啊,而且慢。
  • TA的每日心情
    奋斗
    2018-5-18 05:02
  • 签到天数: 27 天

    [LV.4]偶尔看看III

    发表于 2019-2-27 00:51:01 | 显示全部楼层
    jonah_w 发表于 2019-2-26 23:46
    - X3 U: g5 O- L1 N4 z6 z$ N+ F- s2 C研究了一下,这个软件支持txt等基本格式,但好像对pdf支持很一般,搜索的时候不能直接显示pdf内容。
    $ \: s) F( L* f8 Y像fi ...
    : c; x. F( u3 @* U
    要对PDF文献进行全文搜索,DEVONthink好像目前是不怎么强大。如果对PDF文献全文搜索很依赖的话,Mac上我发现这个功能最强的文献管理工具是zotero,你可以试试zotero。
  • TA的每日心情
    奋斗
    2019-4-14 02:12
  • 签到天数: 93 天

    [LV.6]常住居民II

    发表于 2019-2-27 01:02:29 | 显示全部楼层
    本帖最后由 jonah_w 于 2019-2-27 01:04 编辑 ; p; N( z! Y' L5 Y9 C
    GL_n 发表于 2019-2-27 00:51
    2 f/ a, i3 l% c0 u2 c要对PDF文献进行全文搜索,DEVONthink好像目前是不怎么强大。如果对PDF文献全文搜索很依赖的话,Mac上我 ...

    0 y4 n1 ^# B+ w刚试了一下zotero,提示“The selected file is not in a supported format.”' @! j4 X4 ]! c
    不支持pdf格式 1 d' M* l$ B4 n7 g9 z
    txt格式也不支持…
    9 J% V" n7 l# f! G
  • TA的每日心情
    开心
    4 天前
  • 签到天数: 95 天

    [LV.6]常住居民II

    发表于 2019-2-27 03:34:33 | 显示全部楼层
    我试过 Foxit PhantomPDF OCR 辨识 PDF 文件,. H' g& s( m4 M6 `, R
    在 File Locator Pro 中是可以搜索的,
    , D+ k) ~. k6 O3 y- ]7 G3 Q% ]% NOCR 可以一次辨识多个档案。
  • TA的每日心情
    奋斗
    2018-5-18 05:02
  • 签到天数: 27 天

    [LV.4]偶尔看看III

    发表于 2019-2-27 05:34:19 | 显示全部楼层
    jonah_w 发表于 2019-2-27 01:02; S% O( k" R2 d
    刚试了一下zotero,提示“The selected file is not in a supported format.”+ c( n9 I2 R. e1 V0 M/ O
    不支持pdf格式  : z" u2 E6 Z3 }$ f3 P+ q7 K4 Q
    t ...

    7 Q. ]4 G+ n) I: W, G, G7 Szotero不可能不支持PDF啊。任何一个不支持PDF的文献管理软件,都不是真正的文献管理软件。可以说,几乎所有称得上文献管理软件的管理工具都是支持PDF的。你应该是设置不对。
  • TA的每日心情
    奋斗
    2019-4-14 02:12
  • 签到天数: 93 天

    [LV.6]常住居民II

    发表于 2019-2-27 08:40:47 | 显示全部楼层
    本帖最后由 jonah_w 于 2019-2-27 08:43 编辑
    5 X! g$ p1 S! C& q/ a( N
    GL_n 发表于 2019-2-27 05:34
    4 D) d6 u" a: [+ E* o& ~) B; Pzotero不可能不支持PDF啊。任何一个不支持PDF的文献管理软件,都不是真正的文献管理软件。可以说,几乎所 ...
    * Z3 ^1 {) ]: y  T9 D
    PDF可以拖进去,双击也可以调用内置的Preview软件打开。9 S  t) J) S% o& e; g8 M6 K& m, z
    但搜索不了PDF内容… ! P. x6 [# _2 I1 Z
    通过File的Import选项导入不了pdf。需要建个item,然后pdf拖进这个item里。6 Q  u" Z( K, S$ z4 f) T) G8 b2 p
    现在通过pdfgrep命令临时解决了全文搜索pdf…4 R7 e7 k+ T2 N- n4 [
  • TA的每日心情

    3 天前
  • 签到天数: 112 天

    [LV.6]常住居民II

     楼主| 发表于 2019-2-28 20:37:35 | 显示全部楼层
    jonah_w 发表于 2019-2-26 23:40
    & D9 t0 A/ ^9 D8 a5 f7 s) LPDF可以拖进去,双击也可以调用内置的Preview软件打开。
    1 ?  H) a$ }, ]8 A但搜索不了PDF内容…
    , p7 r8 P" P, t通过File的Import选项导入 ...

    9 z$ J& v; o0 `5 L. o你这个方法也不快吧?几秒?
  • TA的每日心情
    奋斗
    2019-4-14 02:12
  • 签到天数: 93 天

    [LV.6]常住居民II

    发表于 2019-2-28 21:23:35 | 显示全部楼层
    孤影 发表于 2019-2-28 20:37# C# M" g7 N, q. D) G9 f
    你这个方法也不快吧?几秒?
    : B; `& `: c6 ~$ A7 K: Q. U
    还挺快的,比rg稍慢点
  • TA的每日心情

    3 天前
  • 签到天数: 112 天

    [LV.6]常住居民II

     楼主| 发表于 2019-3-1 00:15:37 | 显示全部楼层
    jonah_w 发表于 2019-2-28 12:23
    + ^% a7 a6 P! y1 \/ s/ L5 O还挺快的,比rg稍慢点

    8 i2 g8 H% Z9 O$ B5 t0 s  O& w其实都慢,不能秒的都慢,感觉要自己写程序才能实现。
  • TA的每日心情
    奋斗
    2019-4-14 02:12
  • 签到天数: 93 天

    [LV.6]常住居民II

    发表于 2019-3-1 00:29:08 | 显示全部楼层
    孤影 发表于 2019-3-1 00:15( q' _3 a  j  y* Z% h# }6 E- ]
    其实都慢,不能秒的都慢,感觉要自己写程序才能实现。

    ! h9 s, X" O. N; p& p! ]rg 1秒内是肯定的了,可能pdfgrep要多过1秒,也很快,至少比查词典要快
  • TA的每日心情

    3 天前
  • 签到天数: 112 天

    [LV.6]常住居民II

     楼主| 发表于 2019-3-1 00:30:33 | 显示全部楼层
    jonah_w 发表于 2019-2-28 15:29; T* \9 M8 H: A- P
    rg 1秒内是肯定的了,可能pdfgrep要多过1秒,也很快,至少比查词典要快

    & ^# [' Z1 t1 W4 l! j( Z1 w: ]j几个pdf呀,200个吗?弄个动图看看。
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    顶部qrcode底部
    关注公众号送论坛充值码
    关注微信公众平台
    关注微信公众号 pdawiki,获取邀请码,看文抢积分,抽奖得浮云! Follow our Wechat official account "pdawiki", get invitation codes, and play the lottery to earn points (积分)!

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2019-7-19 03:12 , Processed in 0.133561 second(s), 11 queries , MemCache On.

    Powered by Discuz! X3.4

    © 2001-2017 Comsenz Inc.

    快速回复 返回顶部 返回列表