public class SpeechUnderstander
extends com.iflytek.cloud.msc.module.SpeechInterface
语义理解,分语音语义和文本语义,主要是把自然语言内容,转换为有一定结构的文本数
据,使应用能够抓取其中的重点数据,理解用户的使用意图,进行下一步的处理。语音语义,
是语义理解的一种,其先把音频数据转为听写结果数据,再进行文本语义理解。关于文本语义,
请参考TextUnderstander
。关于语义理解结果说明,请参考SDK文档中的
《Open Semantic Platform API Documents.pdf》。当前语义理解仅有在线模式。
本类使用单例,调用者使用本类的对象,只需要通过createUnderstander(Context, com.iflytek.cloud.InitListener)
创建
一次对象后,便可一直使用该对象,直到通过调用destroy()
进行单例对象销毁。调
用者可通过getUnderstander()
获取当前已经创建的单例。在销毁本类的单例对象后,
需要先通过createUnderstander(Context, com.iflytek.cloud.InitListener)
再次创建单例对象,方可再使用。
在当前应用生命周期第一次使用本类的任何函数前,须先调用
SpeechUtility.createUtility(Context, java.lang.String)
进行SDK初始化。
SpeechUtility.createUtility(Context, java.lang.String)
,
SpeechRecognizer
,
SpeechSynthesizer
限定符和类型 | 方法和说明 |
---|---|
void |
cancel()
取消会话
通过此函数取消当前的会话。
|
static SpeechUnderstander |
createUnderstander(Context context,
InitListener listener)
创建单例对象
使用此函数创建一个本类单例对象。
|
boolean |
destroy()
销毁单例对象
通过本函数,销毁由
createUnderstander(Context, com.iflytek.cloud.InitListener) 创建的单例对象。 |
java.lang.String |
getParameter(java.lang.String key)
获取参数
获取指定的参数的当前值。
|
static SpeechUnderstander |
getUnderstander()
获取单例对象
通过函数获取已创建的单例对象。
|
boolean |
isUnderstanding()
是否在会话中
通过此函数,获取当前SDK是否正在进行会话。
|
boolean |
setParameter(java.lang.String key,
java.lang.String value)
参数设置
可设置的参数有:
SpeechConstant.NET_TIMEOUT : 网络连接超时时间SpeechConstant.KEY_SPEECH_TIMEOUT :语音输入超时时间 SpeechConstant.LANGUAGE :语言SpeechConstant.ACCENT :语言区域SpeechConstant.DOMAIN :应用领域SpeechConstant.AUDIO_SOURCE :音频源SpeechConstant.VAD_BOS :前端点超时SpeechConstant.VAD_EOS :后端点超时SpeechConstant.SAMPLE_RATE :识别采样率SpeechConstant.RESULT_TYPE :识别结果类型SpeechConstant.ASR_AUDIO_PATH :识别录音保存路径
SpeechConstant.ENGINE_TYPE :引擎类型(目前语义仅支持在线模式);
当前语音语义支持未压缩的16位,单声道,采样率为16000或8000,字节顺序
为Little-Endian的Windows PCM音频。 |
int |
startUnderstanding(SpeechUnderstanderListener listener)
开始语音语义
调用此函数,开始语音语义理解。
|
void |
stopUnderstanding()
停止录音
调用本函数告知SDK,当前会话音频已全部录入。
|
int |
writeAudio(byte[] buffer,
int offset,
int length)
写入录音数据
通过调用此函数,把音频数据传给SDK。
|
public static SpeechUnderstander createUnderstander(Context context, InitListener listener)
使用此函数创建一个本类单例对象。当成功创建一次单例对象后,可一直使用此对象,
直到调用destroy()
销毁已创建的单例对象为止。若在当前应用生命周期内调用
destroy()
前再次调用本函数,则直接返回已创建的单例对象。可通过
getUnderstander()
获取已创建的单例对象。
destroy()
,
getUnderstander()
public static SpeechUnderstander getUnderstander()
通过函数获取已创建的单例对象。当单例对象未创建时,将返回null,此时应先通过
createUnderstander(Context, com.iflytek.cloud.InitListener)
创建单例对象。
createUnderstander(Context, com.iflytek.cloud.InitListener)
,
destroy()
public int startUnderstanding(SpeechUnderstanderListener listener)
调用此函数,开始语音语义理解。
目前SDK不支持多线程,所以在调用本函数开始一次会话后,直到结束前(结果返回 完毕,或出现错误),不能再调用本函数开始新的会话。一次会话,即从会话开始,到结 束为止。
在调用本函数开始会话前,通过setParameter(String, String)
设置相
应的参数。
调用本函数开始语音语义后,通过SDK的录音机录取用户通过麦克风读入的音频(当
SpeechConstant.AUDIO_SOURCE
值>=0时),或由应用层调用
writeAudio(byte[], int, int)
写入音频流,获取用于语音语义理解的音频。在完成音频
录入(包括麦克风或写音频流方式)后,通过调用stopUnderstanding()
告知SDK已完
成音频录入,或由SDK自带的VAD(Voice Activity Detection,静音抑制)自动结束音频录
入,见SpeechUnderstanderListener.onEndOfSpeech()
。(关于写入音流方式的SDK
自动结束录入应注意的地方,请参考writeAudio(byte[], int, int)
;VAD端点长度设置,请
参考setParameter(String, String)
)
可通过cancel()
取消当前的会话。
public boolean isUnderstanding()
通过此函数,获取当前SDK是否正在进行会话。应用层可通过此函数,查询能否 开始一路新的会话等。
调用了stopUnderstanding()
停止录音后,如果会话未出现错误或返回最后的结果,
当前状态依然处于会话中,即本函数会返回true。如果调用cancel()
取消了会话,
则当前状态处于不在会话中。
startUnderstanding(SpeechUnderstanderListener)
,
stopUnderstanding()
,
cancel()
public int writeAudio(byte[] buffer, int offset, int length)
通过调用此函数,把音频数据传给SDK。
仅在SpeechConstant.AUDIO_SOURCE
值为-1时,需要通过调用本函数,把
音频数据传给SDK。在写入音频数据前,应先通过
startUnderstanding(SpeechUnderstanderListener)
开启会话。在结束录音数据
写入后,调用stopUnderstanding()
告知应用层,当前会话音频数据已全部写入。
当SDK回调SpeechUnderstanderListener.onEndOfSpeech()
时,说明SDK已经
通过VAD检测到了静音末端点,应该立即停止写入音频数据。当SDK回调
SpeechUnderstanderListener.onResult(UnderstanderResult)
返回完结果,或回调
SpeechUnderstanderListener.onError(SpeechError)
返回错误时,也应该停止当次
会话的音频写入。
支持的音频格式,请参考setParameter(String, String)
的参数说明。
buffer
- 要写入的录音数据缓存offset
- 实际音频在传入缓存的起始点length
- 音频数据长度ErrorCode.SUCCESS
表示成功,其他值表示有错误,
具体错误码,请参考ErrorCode
。startUnderstanding(SpeechUnderstanderListener)
,
stopUnderstanding()
,
SpeechUnderstanderListener
public void stopUnderstanding()
调用本函数告知SDK,当前会话音频已全部录入。
在调用本函数后,已录入的音频还在继续上传到服务器,结果不会马上就返回,当前会 话还在继续,直到结果返回完毕,或出现错误。
要取消会话,请参考cancel()
函数。
当应用调用本函数结束停止录音时,SDK不会再回调
SpeechUnderstanderListener.onEndOfSpeech()
。相反的,当SDK回调
SpeechUnderstanderListener.onEndOfSpeech()
时,应用层可不必再调用本函数
通知SDK停止录音。
public void cancel()
通过此函数取消当前的会话。
在会话被取消后,当前会话结束,未返回的结果将不再返回。
public boolean setParameter(java.lang.String key, java.lang.String value)
可设置的参数有:
SpeechConstant.NET_TIMEOUT
: 网络连接超时时间
SpeechConstant.KEY_SPEECH_TIMEOUT
:语音输入超时时间
SpeechConstant.LANGUAGE
:语言
SpeechConstant.ACCENT
:语言区域
SpeechConstant.DOMAIN
:应用领域
SpeechConstant.AUDIO_SOURCE
:音频源
SpeechConstant.VAD_BOS
:前端点超时
SpeechConstant.VAD_EOS
:后端点超时
SpeechConstant.SAMPLE_RATE
:识别采样率
SpeechConstant.RESULT_TYPE
:识别结果类型
SpeechConstant.ASR_AUDIO_PATH
:识别录音保存路径
SpeechConstant.ENGINE_TYPE
:引擎类型(目前语义仅支持在线模式);
当前语音语义支持未压缩的16位,单声道,采样率为16000或8000,字节顺序 为Little-Endian的Windows PCM音频。
setParameter
在类中 com.iflytek.cloud.msc.module.SpeechInterface
key
- 参数名称value
- 参数值getParameter(String)
,
startUnderstanding(SpeechUnderstanderListener)
public java.lang.String getParameter(java.lang.String key)
获取指定的参数的当前值。
某些有默认的值的参数,如SpeechConstant.SAMPLE_RATE
,在应用层未
调用setParameter(String, String)
来设置参数值前,可能获取到的是null值,
但在实际会话会始时,SDK会使用默认值传给服务器。
getParameter
在类中 com.iflytek.cloud.msc.module.SpeechInterface
key
- 参数名称,所有支持参数,参考setParameter(String, String)
SpeechConstant
对各参数的说明。setParameter(String, String)
public boolean destroy()
通过本函数,销毁由createUnderstander(Context, com.iflytek.cloud.InitListener)
创建的单例对象。
在调用本函数进行销毁前,应先保证当前不在会话中,否则,本函数将尝试取消当前
会话,并返回false,此时销毁失败。关于当前是否在会话中,请参考函数
isUnderstanding()
。若销毁失败,请在取消当前会话后,再次调用本函数重试。
当本函数返回true时,销毁成功。此时,之前创建的单例对象已不能再使用,否则,
将会报错。此时需要再使用,应先通过createUnderstander(Context, com.iflytek.cloud.InitListener)
创建一个新的单例
对象。
createUnderstander(Context, com.iflytek.cloud.InitListener)
,
cancel()