掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 1498|回复: 5

[讨论] 语音库软件的想法

[复制链接]

该用户从未签到

发表于 2014-10-11 17:05:30 | 显示全部楼层 |阅读模式
首先,抱歉这个贴子与Mdict无关。  S$ W6 |/ c4 G
纯提个建议,希望引起软件大神的注意。) \8 X4 z: i5 k
如果不符合发贴要求,麻烦版主删除即可。
! m$ @0 W) {2 }$ h8 C+ g
+ O, Z* ]1 {! _9 t7 _/ [  g去年发过一个帖子《 柯林斯、朗文、牛津、剑桥双解TXT版-【自备语料库】》,很意外受到大家的欢迎。
! o5 N/ p; A" R( k! \3 e当时想的只是利用一些权威词典的例句,做一个庞大的语料库。
8 v! |' D$ a+ p; l这只是一定程度上便于提高“读”和“写”的能力。4 D% @' w! Q- l  J. }+ v
2 b8 H1 P2 Z( k/ y
现在想立足于“听”和“说”的能力。) I* r6 M7 c, X: V6 [5 M; [
( V1 `+ D7 w! K9 o' H2 ~5 N
因为手头上有朗文词典2005的真人例句朗读文件(近10万个例句),同时也获得了国外一个Tatoeba项目12万的真人例句发音。
4 d2 p( Q3 a& E4 s5 E* F& U这对于练习英语听说是个好材料,可惜缺少一个方便的检索工具。+ @2 j  I7 F( @! {  e$ w
* \" @- j5 n4 F4 c9 w& e% ^# ?
不管是朗文那个也好,还是Tatoeba,下载的音频都是以数字编号命名的MP3文件。文本存在于其他文件下。
+ K3 E- Y' N% `; [7 H这样检索起来就有点麻烦。1 Q9 ?$ W2 `- c; ?1 d5 u& g
如果我想查找有关school的真人朗读,首先需要查找文本,得到数字编号。再后数字编号去找到相应的音频。; \' a1 u+ O1 [+ M

% c( W" j5 v4 e- M* }如果可以将TXT文本与MP3联系起来,在查找某个单词时一步到位,这就方便多了。
; S$ C8 K. T7 u0 Z' y! W
' o9 }7 w* T$ L- y& ~4 D在听说方面,我一直在用一个叫Aboboo的软件。% t, u9 @7 g8 D/ ~. t' J* R
它里面有个句库功能,可以依照规定格式批量导入这些音频。倒是可以通过文本搜索,直接查找到相应的音频例句。
1 [, O4 S% ~& x( p8 |9 n  `/ D但是,它的功能略显简单,不管是查找,还是查找结果的呈现,都不大令我满意。
# H* [( L3 ]$ B* t3 S% R; u8 Q" K+ o6 ]3 t6 s6 V
我希望能有这么一款语音库的软件:7 t( e& u2 Q& s; K! O3 ^5 X0 n4 }8 h$ O5 l
1、批量导入文本和相应音频。7 G" ]  o( m6 i
2、通过检索某个单词,得到所有句子及音频。( C& O$ R3 q, w5 G+ X2 f
3、不需要借助第三方播放器就可以听句子。
$ Y$ o8 Q1 u1 v# Z: Q0 o4、检索方面最好引入正则表达式,以便于更精确搜索。! Q3 x/ m$ i, R0 m4 [
5、因为以后还打算通过电影音频及字幕、VOA、EnglisPod、新概念等听力材料制作成更多语音语料,所以最好也可以通过MP3歌词文件LRC直接导入。
" T; y$ ]# r' w8 R' v
' ]0 C3 p" k* R& Y8 \9 `* h$ Z以上是我的一点想法,因为不懂制作软件,一直实现不了。
) r+ a, q* w7 F& \( z1 [如果大神有意,可参照Aboboo的相关功能。

该用户从未签到

发表于 2014-10-16 14:52:53 | 显示全部楼层
使用 fastwiki 即可实现这个功能, 详见最新的发布:- R+ K: u, `: d1 a
https://www.pdawiki.com/forum/thread-13207-1-1.html

该用户从未签到

 楼主| 发表于 2014-10-17 05:53:20 | 显示全部楼层
fastwiki 发表于 2014-10-16 14:52
* V& T5 f  x( |' ?使用 fastwiki 即可实现这个功能, 详见最新的发布:
) \& S; e" a9 d% I3 x) h0 f9 W' }. \https://www.pdawiki.com/forum/thread-13207-1-1.html

0 G  }5 q" c) }# r$ z唉,对我来说,太复杂了,看得一头雾水

该用户从未签到

发表于 2014-10-17 08:05:03 | 显示全部楼层
LYX1692 发表于 2014-10-17 05:53/ c( I& w1 w: m5 {! v# w
唉,对我来说,太复杂了,看得一头雾水

, w" \, ^" }6 y9 K& E! o1. 不会有一款软件直接能满足你说的功能的,
- P! u* L# G, E0 r' k' fFastwiki 能实现这个功能, 但是需要写上那么几行的 lua 代码.' ~# Y  ~6 m8 l+ G, i$ c
这是因为, 文本格式是有无穷种的, 比如你的文本格式很可能是:
$ ]3 L# e. A% _( d! W- d
2 k8 F. N' r$ @& c7 @xxx.mp3  一条句子
: J: c6 R8 d/ \) q8 [: Y; U$ Q) t' h/ K; S, g! \
那么别的文本格式很可能又是:
8 K3 ?# l, _- f6 F( ?0 gxxx.mp3:% W+ L0 C( u% C1 u1 B4 M& @6 G
一条句子5 {7 J$ r. L  d2 _
又一条句子
8 Q0 m0 M+ O+ D
; t( U* k8 a, O6 f: T要实现如此多种格式是很困难的.
2 a( G1 d. H# H& N
! D0 M( v3 f- c2 ]# V4 B2. fastwiki 已经把大家从编辑器中解放出来了, 大家要做的只是学一下几行 lua,5 j$ p. m7 y  ]; _& `
大家只要相信我, 花上几个小时, 很容易就学会了. 很多时候就在于你相信或不相信,5 t( s; u( y; S) ~4 s: R# t
你相信, 然后去做, 就得到了. 我的 "lua 语言入门" 也是花了一天的时间来写的,
; w  M0 e# H5 P" J% D6 h% W 目的就是为了让大家制作任意格式的词典, 也是为了让大家自由发挥.
; e) E% c* E! W, E' y8 W! p8 n
8 ]( Z$ J- l0 s; J  L3. 如果你觉得 fastwiki 的工具太复杂了, 也没有看过 https://fastwiki.me/index.php/Howto_learn_lua/zh
9 U) K9 v. P/ D' a3 ]1 S- P6 X0 }又想实现这个功能的话, 唯一的方法就是把你的 mp3, 以及文本, 和功能要求,+ Z. [0 V  o" j) Y. X; e+ T
打包共享出来,  才有可能有网友帮你制作.  另外, 可以加入 :
6 Q  }  r' t0 r, k/ V8 z3 n    fastwiki 数据制作 & 使用 qq 群: 173327815, E9 b% v; M; \4 i7 s0 n

该用户从未签到

 楼主| 发表于 2014-10-17 15:27:47 | 显示全部楼层
fastwiki 发表于 2014-10-17 08:05! Q% c( I, v0 V5 i- I
1. 不会有一款软件直接能满足你说的功能的,( s" I( [  F3 H
Fastwiki 能实现这个功能, 但是需要写上那么几行的 lua 代码 ...
# H! ^1 q7 Z+ _: F; Q) X5 M
谢谢,今天静下心来,好好摸索了一下,比明天稍有进步了,知道如何测试lua了。# }0 Q5 ~7 s+ e# W* c7 x% q
但还是碰到许多问题。
$ i; z* l. s! r/ s0 r! Q- c) N* v( J7 ^! S' }0 T
可否以7个mp3文件来作一个简单说明呢?0 o  C- ?# c7 h. ^

4 s# B  @4 U. l; y语音包我正在上传,以后会共享出来。
. E5 V2 p+ V4 p; }- r% r6 c: D6 C
5 A2 h/ f! s( ^/ ^但我还是希望可以自己学到实际的操作方法,因为我只要听英语材料,自建的语音库随时都在增加。1 I! j  d: p: ~* T% t
) |/ F9 B) a. m
http://pan.baidu.com/s/1nt7KSyt
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

小黑屋|手机版|Archiver|PDAWIKI |网站地图

GMT+8, 2025-5-10 17:16 , Processed in 0.020992 second(s), 21 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表