本帖最后由 小明爱单词 于 2020-1-22 13:40 编辑
, [ J9 m( Q ]( V
- M2 Q8 H# h( ~7 U: z; e- H! O( A Text-to-speech就是常说的tts服务,常见的应用场景如电子书机器朗读、智能助手(siri)等。' Y1 f* j* K. \1 y
完美的tts服务意味着所有的文本都是理想的听力资源,是不是非常梦幻?
3 ~4 @6 a) r$ c2 S% }" J (题外话,我自己算是英语终生学习者,日常高频看论文、各类pdf、网站,再为了英语学习单独找听力素材基本不现实,素材也不一定都理想,比如the economist很好,但也却是英英。TTS可以说是最高效、全面、可持续的学习方式。)/ W: c: b) T% \+ N4 ?
开发alpha-go的Deepmind团队采用深度学习方法Wavenet革新了tts技术(https://deepmind.com/blog/wavenet-generative-model-raw-audio/),效果惊人!& f2 \: ^$ ]6 z7 ]
# ]% i& p/ D) G+ p
鉴于很多朋友并没有范强工具,我这里随便做了个sample大家感受一下。' C) V5 H9 y- Z! n: W! I9 O
Sample:Longman Dictionary of Contemporary English is an advanced learner's dictionary, providing definitions by using a restricted vocabulary, helping non-native English speakers to understand meanings easily. 7 c8 `( }$ W# J9 @" e2 n1 ^4 o
链接:https://pan.baidu.com/s/1Yv88OFBCoaAcOsIynuqgpQ
3 u/ o1 ]8 F- A! Y9 J1 O/ Y) b) J3 Q0 x2 \
2018年3月底该api的beta版本正式上线(https://cloud.google.com/text-to-speech/),我就持续关注,4月下旬终于在chrome上出现了可以调用该api的插件Speechy,经过一周左右的体验使用,非常理想!( f2 R/ w% c+ [$ P1 O8 R5 @
* E4 Z" Y' O: ]* I+ x! G对谷歌来说,本文内容的大范围使用极可能属于滥用行为,请各位不要转载该教程,像Mdict一样低调的造福真正需要的人。详细教程(非必要,流程很简明)在二楼。 6 W0 X+ V/ C2 W5 e* k% B
) _* x [5 F! Q. K
更新: 由于speechy插件暂时不支持pdf和word文件的识别,所以这两类文件的语音阅读要借助html转换。对于排版简单的文件,可以直接使用word或acrobat pro中自带的“导出到html”功能,对于排版比较复杂的pdf(如英文论文、杂志)建议使用迅捷等较为专业的转化工具,可以完全保留原始排版样式。
5 E- S# F! R0 sAlert:暂时不要升级Speechy至v0.1.3版本,部署了变速功能,但是可能作者没留意,取消了插件访问文件网址的授权,不能识别本地html文件。( {1 h; L' L3 T5 A: C% x
安卓手机上目前只能通过使用 Yandex浏览器安装插件来实现该功能。2 o G3 O5 @0 a5 ^: v: k
目前最好用的调用插件是wavenet for chrome。8 H* E3 J! Z: v3 Q' R4 d5 {& d
|