掌上百科 - PDAWIKI

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 788|回复: 10

[求助] 可否实现例句或短语的真人发音?

[复制链接]

该用户从未签到

发表于 2016-6-17 08:34:10 来自手机 | 显示全部楼层 |阅读模式
本帖最后由 qiuhao1112 于 2016-6-17 08:35 编辑
9 @9 ?: @2 p7 g$ A# C. a5 g8 d! i9 S
遇到一个真人发音的问题,比如:) s, w1 K/ ?9 Y! {2 |# A# S
derogatory term.
3 b0 I& f$ w' Y) s! K  p真人语音库里面有真人发音的 derogatory和term单独音频文件,用什么方法才能实现把这两个单词的独立发音联合起来按 derogatory term先后顺序一起发音呢?
" t6 O! Q) z$ t3 k+ [) f  W$ x
& u" Y& H$ s0 o( k3 \* T1.软件自动识别,先后按顺序在语音库里查找音频文件然后播放# \; [" Z. t  {! n8 z
2.音频文件合并,然后实现联合发音
" [* C0 j: O2 X7 J7 h9 R+ a9 y( T; P# M3 O6 q: O6 M
有什么方法能实现吗?
# y" ?5 Z" i9 k- ]8 ~* ~1 d; G
  • TA的每日心情
    慵懒
    2023-2-4 11:26
  • 签到天数: 579 天

    [LV.9]以坛为家II

    发表于 2016-6-18 08:49:27 | 显示全部楼层
    小白一个。只能帮楼主顶帖

    该用户从未签到

    发表于 2016-6-18 10:05:53 | 显示全部楼层
    本帖最后由 idict 于 2016-6-18 10:11 编辑
    5 ]2 e  l) u( Y. I6 U: h$ z4 s9 b1 P2 V& c& I
    尝试理解楼主的问题, 不知是否正确.
    . w0 X# u' W) K7 L" g(如果用单词发音文件组成例句或短语. 可能有语调的问题吧. 因单词的发音多数是降调)8 u; g; b9 ^2 L: n. ]7 |" ^2 E6 K4 n
    楼主提到的方法一, 如果会写代码. 当然是好啦. 那将是真人TTS引擎. 很是期待." U  @" G9 ^0 f* k2 J
    方法二, 有很多软件可以做到音频文件的合并. Audacity是一个开源软件, 对录音和编辑的功能都很强. 对mp3的编辑是没有问题的./ N! O% q4 T( y) [, l4 s5 A0 E) \
    http://www.audacityteam.org/download/
    + v1 G0 I) |- v, W1 b" b
    & w. _+ w; z8 R4 A如果用DOS的copy命令b选项也相当简单, 但前提必须是相同编码率和采样率, 而且没有标签信息等的纯音频mp3
    9 }$ n2 d* A  N+ p因为不同编码率的音频文件以二进制方式合并后, 很是考验播放器的容错能力的. 所以方法二里好的合并软件编辑完之后的音频输出都是重新编码的.! i( i9 K! T/ d# d4 J+ n4 H
    (刚才试了一下spx, 也可用拷贝合并. 用foobar2000也可以播放. 只是编码信息和时间等就显示不正确了)  Z3 m! P5 @, E2 K: \

    . d$ J0 w/ M( s) E/ Y假设: 在目录 r:\downloads\data 里有相同的44.1kHz, 128kbps的derogatory.mp3和term.mp3, 而且没有任何的标签信息的纯mp3文件. (相同的22.05kHz, 24kbps的也可以的, 只要是全部一致, 合并后就可以正常播放的.)
    % r' N7 ]) h: F) o. V3 Q打开cmd.exe命令行窗口, 输入命令copy带b选项(二进制), 拷贝合并到derogatory term.mp39 q: z. `2 r$ b1 ^
    1. copy "r:\downloads\data\derogatory.mp3" /b + "r:\downloads\data\term.mp3" /b "r:\downloads\data\derogatory term.mp3"
    复制代码

    该用户从未签到

     楼主| 发表于 2016-6-24 11:55:21 来自手机 | 显示全部楼层
    本帖最后由 qiuhao1112 于 2016-6-24 11:57 编辑
    0 b/ ?5 I8 [8 w6 v; a; V6 N
    idict 发表于 2016-6-18 10:05
    5 J% E$ y- v5 T/ M% K( q尝试理解楼主的问题, 不知是否正确.
    0 w1 A1 x) m" p(如果用单词发音文件组成例句或短语. 可能有语调的问题吧. 因单词的发 ...
    : b2 h) a) T: o7 q, c- P+ ?

    / j5 w0 ]/ `* ^* x# d4 [不好意思,回复晚了。。谢谢认真回答。. Z" ?- T& O8 n* {, F, ]
    2 ~7 |* x# S. U( y: C* C8 L; W9 y
    音频合并这个办法我觉得太笨拙,产生语音发音过程缓慢繁琐,不考虑这种方式8 x1 d7 d" ?. a6 w0 e  Y: w% l

    + o) S0 w# g8 K' M9 r1 K我的构思是:用Python写代码 + 语音文件 + 文字文本txt  应该能实现真人发音,不过暂时没有精力研究这个,以后有闲暇时间l会考虑尝试一下

    该用户从未签到

    发表于 2016-6-28 11:21:00 | 显示全部楼层
    你客气了. 没有关系.
    * v9 _9 d" Q& }0 \$ P: B# s6 w确实是没有透彻理解你的核心内容.

    该用户从未签到

    发表于 2016-7-9 14:56:25 | 显示全部楼层

    ! d, f/ D  Y! f/ ], e; S+ z. K谢谢分享啊
  • TA的每日心情
    开心
    2020-6-12 14:43
  • 签到天数: 67 天

    [LV.6]常住居民II

    发表于 2016-7-10 21:41:17 | 显示全部楼层
    小白一个。只能帮楼主顶帖

    该用户从未签到

    发表于 2016-7-15 13:24:41 | 显示全部楼层
    可以自动检索26个字母 随意组合。发出任意想要的单词 短语 句子。是这个意思么。曾经这样想过。。。比如presentation。。更地道一些。。
  • TA的每日心情

    2024-9-28 12:47
  • 签到天数: 34 天

    [LV.5]常住居民I

    发表于 2016-11-23 20:18:44 | 显示全部楼层
    这个我之前用CMD实现过,但是出现一个问题,就是两个单词的时间间隔以及语气,比如A是男声,B是女生,AB一起就不是了。
    1 R, {& B0 u* D! L9 y另外,因为权限比较低,想看你发布的30权限的贴子,不知道怎么看。
  • TA的每日心情

    2024-9-28 12:47
  • 签到天数: 34 天

    [LV.5]常住居民I

    发表于 2016-11-23 20:26:49 | 显示全部楼层
    我是用ffmpeg分析音频,然后把音频都保存为tmp文件,然后用,ffmpeg再组合成一个音频。  f2 Q% Y9 [0 {
    您需要登录后才可以回帖 登录 | 免费注册

    本版积分规则

    小黑屋|手机版|Archiver|PDAWIKI |网站地图

    GMT+8, 2025-5-11 07:12 , Processed in 0.020848 second(s), 21 queries .

    Powered by Discuz! X3.4

    © 2001-2023 Discuz! Team.

    快速回复 返回顶部 返回列表