Android添加百度语音合成API使用(亲测踩坑)
今天要使我的app说话,因此要使用到语音合成,安卓自带的语音合成技术好像并不支持中文,因此采用国内的api,其中有百度,科大讯飞,文章是采用了百度的api,亲测踩坑之后已经可用。
1、注册开发者账号,百度开发者平台http://ai.baidu.com/tech/speech/tts,然后点击免费试用,里面可以有创建应用。
2、填写包名要写安卓项目的包名,注册之后会有AppID、API Key、Secret Key,这些要进行相应替换。
包名看这儿:
3、申请好了就进入SDK下载:
4、下载好了解压出来有一个demo文件,可以直接演示,这里直接使用源文件加入我们的安卓项目中,首先将百度的jar包导入,路径在app/libs,关于导jar包可以参考我另一篇文档https://blog.****.net/jyfbug/article/details/88421221。导入后如下:
5、接下来将app/src/main里面的assets和jniLibs复制到我们项目的文件夹下,将app/src/main/com.baidu.tts.sample下的control、util、listener文件夹和MainHandlerConstant.java复制到我们项目对应文件夹下,复制后我的项目结构如下所示:
6、这里有一个大坑就是在control、listener、util中的import的包都是原来的包,所以我们要手动进去改成我们的包的路径,这里以一个做演示:
改成自己的项目路径:
7、建立工具类SpeakVoiceUtil.java(在原来的MiniActivity.java中改变),此后可直接调用,需要注意的也是路径问题(改成自己项目路径),代码如下。
package com.example.jy.myapplication;
import android.Manifest;
import android.content.Context;
import android.content.pm.PackageManager;
import android.media.AudioManager;
import android.os.Bundle;
import android.os.Handler;
import android.os.Message;
import android.support.v4.app.ActivityCompat;
import android.support.v4.content.ContextCompat;
import android.support.v7.app.AppCompatActivity;
import android.util.Log;
import android.view.View;
import android.widget.Button;
import android.widget.TextView;
import com.baidu.tts.auth.AuthInfo;
import com.baidu.tts.chainofresponsibility.logger.LoggerProxy;
import com.baidu.tts.client.SpeechSynthesizer;
import com.baidu.tts.client.SpeechSynthesizerListener;
import com.baidu.tts.client.TtsMode;
import com.example.jy.myapplication.control.InitConfig;
import com.example.jy.myapplication.listener.MessageListener;
import com.example.jy.myapplication.listener.UiMessageListener;
import com.example.jy.myapplication.util.AutoCheck;
import java.io.File;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.Map;
public class SpeakVoiceUtil {
private static final String TEXT = "欢迎使用百度语音合成,请在代码中修改合成文本";
// ================== 初始化参数设置开始 ==========================
/**
* 发布时请替换成自己申请的appId appKey 和 secretKey。注意如果需要离线合成功能,请在您申请的应用中填写包名。
* 本demo的包名是com.baidu.tts.sample,定义在build.gradle中。
*/
protected String appId = "15739764";
protected String appKey = "F1rdyysEveEd9ojhUcfNm3Fk";
protected String secretKey = "7HS2Gcq9QVp9xGTuNU6C1adunodnYX9W";
/**
* TtsMode.MIX; 离在线融合,在线优先; TtsMode.ONLINE 纯在线; 没有纯离线
*/
private TtsMode ttsMode = TtsMode.ONLINE;
/**
* ================选择TtsMode.ONLINE 不需要设置以下参数; 选择TtsMode.MIX 需要设置下面2个离线资源文件的路径
* 重要!请手动将assets目录下的3个dat 文件复制到该目录
*/
private static final String TEMP_DIR = "/sdcard/baiduTTS";
/**
* 请确保该PATH下有这个文件
*/
private static final String TEXT_FILENAME = TEMP_DIR + "/" + "bd_etts_text.dat";
/**
* 请确保该PATH下有这个文件 ,m15是离线男声
*/
private static final String MODEL_FILENAME = TEMP_DIR + "/" +
"bd_etts_common_speech_m15_mand_eng_high_am-mix_v3.0.0_20170505.dat";
/**
* ===============初始化参数设置完毕,更多合成参数请至getParams()方法中设置 =================
*/
protected SpeechSynthesizer mSpeechSynthesizer;
// =========== 以下为UI部分 ==================================================
private static SpeakVoiceUtil speakVoiceUtil;
public static SpeakVoiceUtil getInstance(Context context) {
if (speakVoiceUtil == null) {
synchronized (SpeakVoiceUtil.class) {
if (speakVoiceUtil == null) {
speakVoiceUtil = new SpeakVoiceUtil(context);
}
}
}
return speakVoiceUtil;
}
public SpeakVoiceUtil(final Context context) {
initTTs(context);
}
/**
* 注意此处为了说明流程,故意在UI线程中调用。
* 实际集成中,该方法一定在新线程中调用,并且该线程不能结束。具体可以参考NonBlockSyntherizer的写法
*
* @param context
*/
private void initTTs(Context context) {
// 日志打印在logcat中
LoggerProxy.printable(true);
boolean isMix = ttsMode.equals(TtsMode.MIX);
boolean isSuccess;
if (isMix) {
// 检查2个离线资源是否可读
isSuccess = checkOfflineResources();
if (!isSuccess) {
return;
} else {
print("离线资源存在并且可读, 目录:" + TEMP_DIR);
}
}
// 日志更新在UI中,可以换成MessageListener,在logcat中查看日志
SpeechSynthesizerListener listener = new MessageListener();
// 1. 获取实例
mSpeechSynthesizer = SpeechSynthesizer.getInstance();
mSpeechSynthesizer.setContext(context);
// 2. 设置listener
mSpeechSynthesizer.setSpeechSynthesizerListener(listener);
// 3. 设置appId,appKey.secretKey
int result = mSpeechSynthesizer.setAppId(appId);
checkResult(result, "setAppId");
result = mSpeechSynthesizer.setApiKey(appKey, secretKey);
checkResult(result, "setApiKey");
// 4. 支持离线的话,需要设置离线模型
if (isMix) {
// 检查离线授权文件是否下载成功,离线授权文件联网时SDK自动下载管理,有效期3年,3年后的最后一个月自动更新。
isSuccess = checkAuth();
if (!isSuccess) {
return;
}
// 文本模型文件路径 (离线引擎使用), 注意TEXT_FILENAME必须存在并且可读
mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_TTS_TEXT_MODEL_FILE, TEXT_FILENAME);
// 声学模型文件路径 (离线引擎使用), 注意TEXT_FILENAME必须存在并且可读
mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_TTS_SPEECH_MODEL_FILE,
MODEL_FILENAME);
}
// 5. 以下setParam 参数选填。不填写则默认值生效
// 设置在线发声音人: 0 普通女声(默认) 1 普通男声 2 特别男声 3 情感男声<度逍遥> 4 情感儿童声<度丫丫>
mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_SPEAKER, "0");
// 设置合成的音量,0-9 ,默认 5
mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_VOLUME, "9");
// 设置合成的语速,0-9 ,默认 5
mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_SPEED, "5");
// 设置合成的语调,0-9 ,默认 5
mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_PITCH, "5");
mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_MIX_MODE, SpeechSynthesizer
.MIX_MODE_DEFAULT);
// 该参数设置为TtsMode.MIX生效。即纯在线模式不生效。
// MIX_MODE_DEFAULT 默认 ,wifi状态下使用在线,非wifi离线。在线状态下,请求超时6s自动转离线
// MIX_MODE_HIGH_SPEED_SYNTHESIZE_WIFI wifi状态下使用在线,非wifi离线。在线状态下, 请求超时1.2s自动转离线
// MIX_MODE_HIGH_SPEED_NETWORK , 3G 4G wifi状态下使用在线,其它状态离线。在线状态下,请求超时1.2s自动转离线
// MIX_MODE_HIGH_SPEED_SYNTHESIZE, 2G 3G 4G wifi状态下使用在线,其它状态离线。在线状态下,请求超时1.2s自动转离线
mSpeechSynthesizer.setAudioStreamType(AudioManager.MODE_IN_CALL);
// x. 额外 : 自动so文件是否复制正确及上面设置的参数
Map<String, String> params = new HashMap<>();
// 复制下上面的 mSpeechSynthesizer.setParam参数
// 上线时请删除AutoCheck的调用
if (isMix) {
params.put(SpeechSynthesizer.PARAM_TTS_TEXT_MODEL_FILE, TEXT_FILENAME);
params.put(SpeechSynthesizer.PARAM_TTS_SPEECH_MODEL_FILE, MODEL_FILENAME);
}
InitConfig initConfig = new InitConfig(appId, appKey, secretKey, ttsMode, params, listener);
AutoCheck.getInstance(context).check(initConfig, new Handler() {
@Override
/**
* 开新线程检查,成功后回调
*/ public void handleMessage(Message msg) {
if (msg.what == 100) {
AutoCheck autoCheck = (AutoCheck) msg.obj;
synchronized (autoCheck) {
String message = autoCheck.obtainDebugMessage();
// print(message); // 可以用下面一行替代,在logcat中查看代码
Log.w("AutoCheckMessage", message);
}
}
}
});
// 6. 初始化
result = mSpeechSynthesizer.initTts(ttsMode);
checkResult(result, "initTts");
}
/**
* 检查appId ak sk 是否填写正确,另外检查官网应用内设置的包名是否与运行时的包名一致。本demo的包名定义在build.gradle文件中
*
* @return
*/
private boolean checkAuth() {
AuthInfo authInfo = mSpeechSynthesizer.auth(ttsMode);
if (!authInfo.isSuccess()) {
// 离线授权需要网站上的应用填写包名。本demo的包名是com.baidu.tts.sample,定义在build.gradle中
String errorMsg = authInfo.getTtsError().getDetailMessage();
print("【error】鉴权失败 errorMsg=" + errorMsg);
return false;
} else {
print("验证通过,离线正式授权文件存在。");
return true;
}
}
/**
* 检查 TEXT_FILENAME, MODEL_FILENAME 这2个文件是否存在,不存在请自行从assets目录里手动复制
*
* @return
*/
private boolean checkOfflineResources() {
String[] filenames = {TEXT_FILENAME, MODEL_FILENAME};
for (String path : filenames) {
File f = new File(path);
if (!f.canRead()) {
print("[ERROR] 文件不存在或者不可读取,请从assets目录复制同名文件到:" + path);
print("[ERROR] 初始化失败!!!");
return false;
}
}
return true;
}
public void speak(String string) {
/* 以下参数每次合成时都可以修改
* mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_SPEAKER, "0");
* 设置在线发声音人: 0 普通女声(默认) 1 普通男声 2 特别男声 3 情感男声<度逍遥> 4 情感儿童声<度丫丫>
* mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_VOLUME, "5"); 设置合成的音量,0-9 ,默认 5
* mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_SPEED, "5"); 设置合成的语速,0-9 ,默认 5
* mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_PITCH, "5"); 设置合成的语调,0-9 ,默认 5
*
* mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_MIX_MODE, SpeechSynthesizer
* .MIX_MODE_DEFAULT);
* MIX_MODE_DEFAULT 默认 ,wifi状态下使用在线,非wifi离线。在线状态下,请求超时6s自动转离线
* MIX_MODE_HIGH_SPEED_SYNTHESIZE_WIFI wifi状态下使用在线,非wifi离线。在线状态下, 请求超时1.2s自动转离线
* MIX_MODE_HIGH_SPEED_NETWORK , 3G 4G wifi状态下使用在线,其它状态离线。在线状态下,请求超时1.2s自动转离线
* MIX_MODE_HIGH_SPEED_SYNTHESIZE, 2G 3G 4G wifi状态下使用在线,其它状态离线。在线状态下,请求超时1.2s自动转离线
*/
if (mSpeechSynthesizer == null) {
print("[ERROR], 初始化失败");
return;
}
int result = mSpeechSynthesizer.speak(string);
print("合成并播放 按钮已经点击");
checkResult(result, "speak");
}
private void print(String message) {
Log.d("SpeakVoiceUtil",message);
}
private void checkResult(int result, String method) {
if (result != 0) {
print("error code :" + result + " method:" + method + ", 错误码文档:http://yuyin.baidu" +
".com/docs/tts/122 ");
}
}
public void cancelResource() {
if (mSpeechSynthesizer != null) {
mSpeechSynthesizer.stop();
mSpeechSynthesizer.release();
mSpeechSynthesizer = null;
Log.d("SpeakVoiceUtil","释放资源成功");
}
}
}
8、直接在别的类里面使用方法SpeakVoiceUtil.getInstance(getApplicationContext()).speak(string);即可,string即为说的话。
9、项目打包可参考我的另一篇文章https://blog.****.net/jyfbug/article/details/88526965。