转换python espeak + subprocess代码直接播放输出音频

问题描述:

我正在使用现有的程序,从套接字读取xml,将文本转换为wav文件,然后通过音频输出设备播放它。转换python espeak + subprocess代码直接播放输出音频

我想剥去它,所以它只是直接播放文本到音频。

现在我很难搞清楚我是否已经得到了正确的代码并且了解它是否真的创建了wav文件。

函数调用调用文本到语音功能

def generate_audio(self, language, voice=None): 
    info = self.get_first_info(language, bestmatch=False) 
    if info is None: 
     self.media_info[language] = None 
     return False 

    truncate = not self.broadcast_immediately() and bcastplayer.Config.setting('alerts_truncate') 
    message_text = info.get_message_text(truncate) 

    location = bcastplayer.ObData.get_datadir() + "/alerts" 
    if os.access(location, os.F_OK) == False: 
     os.mkdir(location) 
    filename = self.reference(self.sent, self.identifier) + "-" + language + ".wav" 

    resources = info.get_resources('audio') 
    if resources: 
     if resources[0].write_file(os.path.join(location, filename)) is False: 
      return False 

    elif message_text: 
     self.write_tts_file(os.path.join(location, filename), message_text, voice) 

    else: 
     return False 

可以这样修改,直接播放音频?

def write_tts_file(self, path, message_text, voice=None): 
    if not voice: 
     voice = 'en' 
    proc = subprocess.Popen([ 'espeak', '-m', '-v', voice, '-s', '130', '--stdout' ], stdin=subprocess.PIPE, stdout=subprocess.PIPE, close_fds=True) 
    (stdout, stderr) = proc.communicate(message_text.encode('utf-8') + b" <break time=\"2s\" /> " + message_text.encode('utf-8') + b" <break time=\"3s\" /> ") 
    proc.wait() 

    with open(path, 'wb') as f: 
     f.write(stdout) 

我从来没有见过像这样使用processsubprocessstdoutPIPE代码。

将子进程代码更改为仅管道或将输出重定向到aplay而不创建wav文件很容易吗?

有可能给一个线索另一个答案 - 但是,我的新手的理解是不知道如何将此代码转换为这个问题的答案

How to use python Popen with a espeak and aplay

可以使用subprocess.PIPE这两个过程联系在一起。这里是write_tts_file功能的修改版本:

def write_tts_file(self, path, message_text, voice=None): 
    if not voice: 
     voice = 'en' 
    proc = subprocess.Popen(['espeak', '-m', '-v', voice, '-s', '130', '--stdout' ], stdin=subprocess.PIPE, stdout=subprocess.PIPE, close_fds=True) 
    aplay = subprocess.Popen(['aplay', '-D', 'sysdefault'], stdin=proc.stdout) 
    proc.stdin.write(message_text.encode('utf-8') + b" <break time=\"2s\" /> " + message_text.encode('utf-8') + b" <break time=\"3s\" /> \n") 
    proc.stdin.close() 
    proc.wait() 

它关闭是重要的procstdin您发送待所说的消息后。这将使proc在发送其数据时退出,并将其输出关闭到aplay,然后在完成播放后退出。如果proc的输入未关闭,则它们都不会退出。

+0

谢谢 - 我会试试看。我真的很难理解语言和子流程 – dbmitch