科大訊飛線上語音識別音訊來源為【檔案】的java接入實現，適用於初學者

阿新 • • 發佈：2018-11-08

 ****科大訊飛的語音識別提供了兩種音訊來源方式，一個是通過麥克風，一個是來自音訊檔案。這裡介紹本人自己寫的通過音訊
 檔案識別的java程式碼。****

【離線識別參考我的另一篇】用java呼叫科大訊飛的離線語音識別dll實現離線識別（JNA實現）

之前的註冊、獲得註冊碼、以及SDK的下載這裡不再贅述，直接上程式碼：

注意：
1、msc.jar一定要匯入啊
2、本功能實現是在線上情況下，離線情況下暫時用不了。

package com.iflytek;

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;

import com.iflytek.cloud.speech.RecognizerListener;
import com.iflytek.cloud.speech.RecognizerResult;
import com.iflytek.cloud.speech.Setting;
import com.iflytek.cloud.speech.SpeechConstant;
import com.iflytek.cloud.speech.SpeechError;
import com.iflytek.cloud.speech.SpeechRecognizer;
import com.iflytek.cloud.speech.SpeechUtility;


public class VoiceTest {
	
	private static final String APPID="5a******1";//這裡是自己的APPID
	private static VoiceTest mObject;
	private static StringBuilder mResult=new StringBuilder();
	private String fileName="test.pcm";//這裡要將檔案拷貝至根目錄下，必須是.pcm檔案
	
	//main方法，是否顯示日誌，語音實用程式驗證程式的id
	public static void main(String[] args) {
		if(null!=args&&args.length>0&&args[0].equals("true")) {
			//顯示日誌
			Setting.setShowLog(true);
		}
		
		SpeechUtility.createUtility("appid="+APPID);
		getVoiceObj().Recognize();
	}
	
	//單例模式，建立物件
	private static VoiceTest getVoiceObj() {
		if(mObject==null) {
			mObject=new VoiceTest();
		}
		return mObject;
	}
	

	//建立語音識別物件
	private boolean mIsEndOfSpeech=false;
	private void Recognize() {
		if(SpeechRecognizer.getRecognizer()==null) {
			SpeechRecognizer.createRecognizer();
		}
		mIsEndOfSpeech=false;
		RecogizePcmFileBite();
	}

	//識別音訊檔案
	private void RecogizePcmFileBite() {
		//獲取語音識別物件
		SpeechRecognizer recognizer=SpeechRecognizer.createRecognizer();
		//設定基本的識別引數,聲音來源是音訊，結果是自然語言文字
		recognizer.setParameter(SpeechConstant.AUDIO_SOURCE, "-1");
		recognizer.setParameter(SpeechConstant.RESULT_TYPE, "plain");
		//開始監聽,引數是監聽器物件
		recognizer.startListening(recListener);
		//建立檔案輸入流
		FileInputStream fis=null;
		//建立位元組陣列，長度為64K
		byte[] data=new byte[64*1024];
		try {
			fis=new FileInputStream(new File("./"+fileName));
			//檔案剩餘長度如果沒有，就顯示沒有了
			if(0==fis.available()) {
				mResult.append("no audio avaible!");
				//取消語音識別
				recognizer.cancel();
			//否則有語音檔案
			}else {
				int len=data.length;//此時為64*1024即有這麼長
				while(data.length==len&&!mIsEndOfSpeech) {
					//讀取檔案
					len=fis.read(data);
					//寫出檔案
					recognizer.writeAudio(data, 0, len);
				}
				//停止語音識別
				recognizer.stopListening();
			}
		
		}catch(Exception e) {
			e.printStackTrace();
		}finally {
			try {
				if(null !=fis) {
					fis.close();
					fis=null;
					}
				} catch (IOException e) {
					e.printStackTrace();
				}
		}
	}
	
	//聽寫監聽器
	private RecognizerListener recListener=new RecognizerListener() {
		@Override
		public void onBeginOfSpeech() {
			DebugLog.Log("onBeginOfSpeech enter");
			DebugLog.Log("*****開始錄音*****");
			
		}
		
		@Override
		public void onVolumeChanged(int volume) {
			DebugLog.Log( "onVolumeChanged enter" );
			if (volume > 0)
				DebugLog.Log("*************音量值:" + volume + "*************");
			
		}
		
		@Override
		public void onResult(RecognizerResult result, boolean isLast) {
			DebugLog.Log( "onResult enter" );
			//獲取監聽結果的字串
			mResult.append(result.getResultString());
			//如果是結尾
			if(isLast) {
				DebugLog.Log("識別結果為："+mResult.toString());
				mIsEndOfSpeech=true;
				mResult.delete(0, mResult.length());
			}
			
		}
		
		@Override
		public void onEvent(int arg0, int arg1, int arg2, String arg3) {
			// TODO Auto-generated method stub
			
		}
		
		@Override
		public void onError(SpeechError arg0) {
			// TODO Auto-generated method stub
			
		}
		
		@Override
		public void onEndOfSpeech() {
			DebugLog.Log("onEndOfSpeech enter");
			DebugLog.Log("*****結束錄音*****");
			mIsEndOfSpeech=true;
			
		}
		
	};
	
	

}

這裡如果需要顯示日誌，記得把工具類粘上（裡面的程式碼都不用動）

package com.iflytek;
import java.text.SimpleDateFormat;

public class DebugLog {
	
	public static void Log(String tag,String log)
	{
		if(true)
		    System.out.println(log);
	}
	
	public static void Log(String log)
	{
		SimpleDateFormat dateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); 
		String date=dateFormat.format(new java.util.Date());
		if(true)
		    System.out.println("<" + date + ">" + log);
	}
	
	public static boolean isEmpty(String string){
		if(string == null)
		{
			return true;
		}
		if(string.isEmpty())
		{
			return true;
		}
		return false;
	}
}

最後直接run起來，就會將test.pcm這個音訊檔案的內容變為漢字輸出到控制檯
結果如下:

<2018-09-12 16:25:23>語音識別的結果是：漢堡包多少錢？一個英文怎麼說？

test.pcm這個檔案，SDK包裡面有啊，不用問我要，在這

這裡寫圖片描述

科大訊飛線上語音識別音訊來源為【檔案】的java接入實現，適用於初學者

****科大訊飛的語音識別提供了兩種音訊來源方式，一個是通過麥克風，一個是來自音訊檔案。這裡介紹本人自己寫的通過音訊檔案識別的java程式碼。**** 【離線識別參考我的另一篇】用java呼叫科大訊飛的離線語音識別dll實現離線識別（JNA實現）之前的註冊、獲得註冊碼、

接入高德 SDK 遇到的問題 01：語音導航中科大訊飛線上語音合成次數限制

需求：採用高德導航SDK實現路線導航，並且實現語音播報導航問題：高德導航語音合成開發指南中，建議採用的科大訊飛線上語音合成存在次數限制，遠遠達不到生產環境的需求量解決：採用百度離線上語音識別 Android SDK 一、科大訊飛語音合成使用次數有限

ios開發科大訊飛的語音識別

1、新建工程不說了 2、匯入庫：xcode工程下沒有Frameworks目錄了，可以自己newgroup一個出來，然後在重新命名一下，注意大小寫，不然匯入後不在該目錄下，當然沒有強迫症的可以忽略，直接匯入就好了，新建目錄是結構看起來舒服點。。。第三方庫，即iFly的庫，

科大訊飛離線語音命令詞識別的使用說明

最近因為專案的需求，需要在無網路的情況下實現語音識別的功能，因為之前線上識別一直用的科大的，所以經理就和我說，你花半天時間簡單熟悉一下，然後出一個Demo，下午有人過來看；因為之前科大線上SR也是別人做的，準確的說我只是瞭解過一點，也寫過相關的blog——百度語音

Android 科大訊飛線上和離線語音聽寫

效果圖：參考資料專案裡要用語音聽寫，想到了科大訊飛，參考上面的資料完成了最簡單的線上有UI的語音識別，後面想要改成離線也可以使用。參考下面的文章下載好語記和離線資源之後，想要改成有UI的RecognizerDialog離線語音聽寫，但是沒

C#調用科大訊飛離線語音SDK合成TTS

zha http post ref top 代碼來源內容 lib bin目錄下有msc.dll動態庫。c#調用科大訊飛的語音合成，需要引用該文件。該文件是C語言生成的dll，C#沒辦法直接引用。所有需要用C#重新封裝一個TTS.dll，然後再在C#項目中引用封裝的TT

科大訊飛（語音合成和語音聽寫）

由於google的自帶的TTS不支援中文轉語音。所以很無奈的只能選擇語音龍頭中的科大訊飛了本文章只是簡單的實現語音合成和語音聽寫 package com.example.viocedemo; import com.iflytek.cloud.speech.Rec

Unity接入科大訊飛的語音sdk

在Unity中新增語音識別功能方法有許多，這裡像大家介紹怎麼接入科大訊飛的語音sdk 2.登入上之後選擇控制檯，進入後選擇建立新應用。 3. 建立完成後新增新服務，這時候我們可以看到APPID，一會我們會用到。 4.選擇語音聽寫 5.

ROS下使用科大訊飛SDK進行線上語音識別

以線上命令詞識別為例：主要步驟、易產生的錯誤其解決辦法如下： 1、下載SDK，解壓； 2、在ROS工作空間下建立一個Package； catkin_create_pkg xfei_asr roscpp rospy std_msgs 3、將SDK資料夾中的標頭檔案，即

手把手的操作——用java呼叫科大訊飛的離線語音識別dll實現離線識別（JNA實現）（一）

#用java呼叫科大訊飛的離線語音識別dll實現離線識別（JNA實現）（一）本人接的任務，做離線語音識別，用的是科大訊飛的離線識別，java不支援離線了，所以下載了windows的離線包，用JNA進行呼叫。之前用的是jni，但是一直沒有測試通過，本人又不會C++，研究了一個星期終究

手把手的操作——用java呼叫科大訊飛的離線語音識別dll實現離線識別（JNA實現）（二）

上一篇講到了最難的地方，引數的轉換，這裡單獨寫出來 ** 三、引數的轉換（難點） ** 注：本文是以訊飛提供的C語言例子作為模板改寫，語音來源於檔案 1、先分析提供的例子本人使用的是VS2010 下載連結連結：https://pan.baidu.com/s/

unity接科大訊飛語音識別Windows平臺（補充前面的文章，添加了錄音功能）

其他操作就不在一一贅述了，直說一下新增的負責錄音的那段程式碼 1、首先利用Microphone類開始錄製和結束錄製音訊 2、利用AudioSource類播放錄製的音訊 3、然後用自己寫的方法Float2Byte將錄製的音訊轉成byte資料，供訊飛語音識別方法呼叫詳細

使用科大訊飛最新版SDK在樹莓派上搭建語音識別服務

本人的SDK是2017年1月30號左右下載的，可以在http://www.xfyun.cn/科大訊飛官網註冊，選擇相應的Linux SDK下載。 1、因為最新版SDK不支援樹莓派了，所以要下載個RaspberryPi檔案來支援在樹莓派上使用： 2、解壓好SDK後，如圖。

科大訊飛語音識別時字串中特殊字元的處理

比如口算遊戲：訊飛會返回：請回答[n2]78+11=? 此時我們要去掉[n2] 可做如下操作 String results = "[n2]78+11=?"; results = results.replaceAll("\\[" + "n2" + "\\]", "");

科大訊飛語音識別使用過程中踩過的坑

眨眼之間又是好久沒有寫部落格了，佩服那些寫了很多部落格的大神，堅持和耐心值得我學習這次寫的是一個知名的語音識別sdk，就是科大訊飛的語音識別，其實也沒有多複雜，但是由於我是用swift語言，期間出了很多差錯，搞了好久，在這裡就慢慢記錄下來吧。使用步驟: （有很多步驟

Android 科大訊飛語音識別金額數字

最近要在應用裡面使用語音識別功能，老闆選擇了科大訊飛的技術，小可也就開始看文件啦；這裡只嵌入了語音識別，其他的語法什麼的沒有研究，有需要的各位看文件唄；需要的資料：只識別數字，若不過濾則把LSpeechManager中的onResult方法中的LDataFormat過

科大訊飛和百度語音平臺語音識別Java呼叫記錄

1、科大訊飛平臺：http://www.xfyun.cn/doccenter/java 註冊並建立應用，下載SDK，選擇語音聽寫+Java+建立的應用(APPID)；未提交稽核的應用，服務量會有500次/日的限制，開發完成後提交稽核解除限制；

Cordova外掛(語音識別--科大訊飛)

cordova-plugin-IFlyspeech 科大訊飛的語音聽說讀寫的cordova外掛最近在做一個hybrid webapp的時候需要用到語音識別的功能，網上找到科大訊飛的語音cordova外掛，因為還沒開始使用這個外掛，先總結一下在配置科大

語音識別介面webAPI-python測試：百度和科大訊飛

概述目前市場上有很多家的語音識別介面可用，簡單測試都不要錢。國內的BAT和科大訊飛，國外的微軟和谷歌都提供了中文的語音識別介面，既有sdk又有webAPI。我的測試都是在python3環境下進行的。最終選擇百度和科大訊飛的介面。主要是考慮中文識別應該國內

Android 科大訊飛語音識別金額數字

最近要在應用裡面使用語音識別功能，老闆選擇了科大訊飛的技術，小可也就開始看文件啦；這裡只嵌入了語音識別，其他的語法什麼的沒有研究，有需要的各位看文件唄；需要的資料：只識別數字，若不過濾則把LSpeechManager中的onResult方法中的LDataFormat過濾去掉即可 1，首先要在科

科大訊飛 線上語音識別 音訊來源為【檔案】的java接入實現， 適用於初學者

相關推薦

科大訊飛線上語音識別音訊來源為【檔案】的java接入實現，適用於初學者