掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1464|回复: 4

[讨论] 【尝试四】语料库提取例句

[复制链接]

该用户从未签到

发表于 2016-8-10 06:49:50 | 显示全部楼层 |阅读模式
从6月30日提出NLTK+Python的问题后,断断续续的琢磨着,毕竟不是程序猿。
6 `0 v" Y: T, \, p( G% J" ]
5 h0 Q+ ~1 B+ J/ F: u1 w( E- S代码不美丽,只是完成了想实现的功能而已。
( Q- n6 O: k8 V* q5 @0 S/ V

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

x

本帖被以下淘专辑推荐:

该用户从未签到

发表于 2016-8-10 14:01:10 | 显示全部楼层
本帖最后由 迪克特 于 2016-8-10 14:02 编辑
* Q: s5 Q; J" r. l- g7 A9 `
  U6 H5 g7 H5 I. u' G. ^3 n楼主630重要思考在此,供各位坛友跳转学习:% Z# J7 n# F2 @6 X2 M8 ]% Q
https://www.pdawiki.com/forum/fo ... hread&tid=17378: T2 e0 h7 D$ W8 k6 f
此贴微言大义,机巧深藏,如果解释的细致点就更好了。

该用户从未签到

 楼主| 发表于 2016-8-10 18:06:37 | 显示全部楼层
迪克特 发表于 2016-8-10 14:01
7 G$ F; t; E; s1 E, L# n7 h楼主630重要思考在此,供各位坛友跳转学习:3 @! |; O( k. B& f8 ]7 P4 R
https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid ...

. j% t2 i8 D6 t3 b- N4 Q思路其实简单   对会编程的来说应该不难* d0 i& v+ \( z0 L
( p: d# Y  ^$ O0 Y
1. 收集适合自己的语料,贴图用的是古登堡的Austen-Emma.txt9 ~+ U8 D, M- |4 Y7 v! r
2. 用Python/NLTK读入语料,每句做个索引
0 P4 p+ R1 F$ [/ t+ a& O( ?* m) T3. 建一个Web服务器, Python可以用Bottle/Flask/Django,配置好路径: b* X: a# I' V# S0 o
4. 配置GoldDict在线词典查询
5 @- B1 T2 U4 ]* a; e5 q$ l6 V5 T) R! V+ I- V* u" K6 D
效果如贴图

该用户从未签到

发表于 2016-8-10 19:58:14 | 显示全部楼层
贴条广告: 我的例句提取脚本 https://coding.net/u/fnaviwwo1/p/words/git/archive/master

该用户从未签到

 楼主| 发表于 2016-8-10 21:43:27 | 显示全部楼层
fnaviwwo1 发表于 2016-8-10 19:58
7 E0 U  z1 f: u6 R: m" |( G贴条广告: 我的例句提取脚本 https://coding.net/u/fnaviwwo1/p/words/git/archive/master

* @7 d/ ?6 G; W* e9 l; S4 v好啊  要收广告费喔  哈哈
2 M( I1 H2 l- f2 z5 A; f5 L% T
! C! }" R1 k7 B, p' g方式有点不同。没有用你的代码喔,但学习过。0 n! c3 ?4 y. C' y* g' T

; |- g+ u* g; W) t3 B目前建索引的速度太慢,还在看怎么去优化,也许直接写到数据库还比较快,不用NLTK每次去读取。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

小黑屋|手机版|Archiver|PDAWIKI |网站地图

GMT+8, 2025-5-8 07:03 , Processed in 0.021343 second(s), 24 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表