1. 程式人生 > >【百度語音識別】JavaAPI方式語音識別示例 MP3轉PCM檔案Java實現

【百度語音識別】JavaAPI方式語音識別示例 MP3轉PCM檔案Java實現


【百度語音識別】JavaAPI方式語音識別示例MP3轉PCM

  • Java-API合成語音示例:http://ai.baidu.com/forum/topic/show/496727
  • REST-API文件地址:http://ai.baidu.com/docs#/TTS-API/top
  • 注意:需要下載MP3外掛jar。才可以進行MP3CONVERTPCM 連結: https://pan.baidu.com/s/1i5pJxpb 密碼: 8w4x
  • 遇到的坑:HTTPUtil工具類中。不需要拼接access_token引數。大家注意一下。ContentType也改一下。

----------------------------------開始程式碼示例----------------------------------

  • MP3轉PCM的方法 需要下載注意的jar才可以正確轉換哦

第一步就是語音合成的MP3檔案轉換PCM格式檔案

package com.xs.audio.tns;

import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStream;

import javax.sound.sampled.AudioFormat;
import javax.sound.sampled.AudioInputStream;
import javax.sound.sampled.AudioSystem;
/**
 * MP3轉PCM Java方式實現
 * @author 小帥丶
 * @date 2017年12月6日
 */
public class MP3ConvertPCM { /** * MP3轉換PCM檔案方法 * @param mp3filepath 原始檔案路徑 * @param pcmfilepath 轉換檔案的儲存路徑 * @throws Exception */ public static void mp3Convertpcm(String mp3filepath,String pcmfilepath) throws Exception{ File mp3 = new File(mp3filepath); File pcm = new File(pcmfilepath)
; //原MP3檔案轉AudioInputStream AudioInputStream mp3audioStream = AudioSystem.getAudioInputStream(mp3); //將AudioInputStream MP3檔案 轉換為PCM AudioInputStream AudioInputStream pcmaudioStream = AudioSystem.getAudioInputStream(AudioFormat.Encoding.PCM_SIGNED, mp3audioStream); //準備轉換的流輸出到OutputStream OutputStream os = new FileOutputStream(pcm); int bytesRead = 0; byte[] buffer = new byte[8192]; while ((bytesRead=pcmaudioStream.read(buffer, 0, 8192))!=-1) { os.write(buffer, 0, bytesRead); } os.close(); pcmaudioStream.close(); } }
  • HttpUtil工具類新增加一個postASR的方法

/**
     * 獲取語音識別內容
     * @param requestUrl
     * @param params
     * @return
     * @throws Exception
     */
    publicstatic String postASR(String requestUrl, String params)throws Exception {
    	System.out.println(params);
    	String generalUrl = requestUrl;//這裡不需要對介面地址拼接access_token引數 切記!!!
        System.out.println("傳送的連線為:"+generalUrl);
        URL url = new URL(generalUrl);
        // 開啟和URL之間的連線
        HttpURLConnection connection = (HttpURLConnection) url.openConnection();
    	System.out.println("開啟連結,開始傳送請求"+new Date().getTime()/1000);
        connection.setRequestMethod("POST");
        // 設定通用的請求屬性
        connection.setRequestProperty("Content-Type", "application/json");
        connection.setRequestProperty("Connection", "Keep-Alive");
        connection.setUseCaches(false);
        connection.setDoOutput(true);
        connection.setDoInput(true);
        // 得到請求的輸出流物件
        DataOutputStream out = new DataOutputStream(connection.getOutputStream());
        out.writeBytes(params);
        out.flush();
        out.close();
        // 建立實際的連線
        connection.connect();
        // 獲取所有響應頭欄位
        Map<String, List<String>> headers = connection.getHeaderFields();
        // 遍歷所有的響應頭欄位
        for (String key : headers.keySet()) {
            System.out.println(key + "--->" + headers.get(key));
        }
        // 定義 BufferedReader輸入流來讀取URL的響應
        BufferedReader in = null;
        if (requestUrl.contains("nlp"))
            in = new BufferedReader(new InputStreamReader(connection.getInputStream(), "GBK"));
        else
            in = new BufferedReader(new InputStreamReader(connection.getInputStream(), "UTF-8"));
        String result = "";
        String getLine;
        while ((getLine = in.readLine()) != null) {
            result += getLine;
        }
        in.close();
        System.out.println("請求結束"+new Date().getTime()/1000);
        System.out.println("result:" + result);
        return result;
    }
  • 下面就是語音識別的示例程式碼哦

package com.xs.audio.tns;

import java.io.File;
import java.util.HashMap;

import com.xs.util.baidu.Base64Util;
import com.xs.util.baidu.FileUtil;
import com.xs.util.baidu.HttpUtil;
import com.xs.util.baidu.RandomStringGenerator;
/**
 * 語音識別Java-API JSON上傳方式示例程式碼
 * @author 小帥丶
 *
 */
public class Audio2Text {
	//介面地址
	private static final String AUDIO2TEXT_URL = "http://vop.baidu.com/server_api";
	publicstaticvoidmain(String[] args)throws Exception {
		//合成的MP3語音檔案
		String path = "C:/Users/Administrator/text2audio/VOICE1512521962.mp3";
		//MP3轉pcm要儲存的路徑和檔名
		String path2 = "C:/Users/Administrator/text2audio/VOICE1512521962.pcm";
		MP3ConvertPCM.mp3Convertpcm(path, path2);
		// 對語音二進位制資料進行識別   
	    byte[] data = FileUtil.readFileByBytes(path2);    //readFileByBytes僅為獲取二進位制資料示例
	    String speech = Base64Util.encode(data);
	    File file = new File(path2);
	    long len = file.length();
	    String result = Audio2text("pcm", 16000,RandomStringGenerator.getRandomStringByLength(60),"自己獲取的AccessToken", speech, len);
	    System.out.println(result);
	}
	/**
	 * JSON方式上傳
	 * @param format	必填	語音檔案的格式,pcm 或者 wav 或者 amr。不區分大小寫。推薦pcm檔案
	 * @param rate	必填	取樣率, 8000 或者 16000, 推薦 16000 採用率
	 * @param channel	必填	聲道數,僅支援單聲道,請填寫固定值 1
	 * @param cuid	必填	使用者唯一標識,用來區分使用者,計算UV值。建議填寫能區分使用者的機器 MAC 地址或 IMEI 碼,長度為60字元以內。
	 * @param token	必填	開放平臺獲取到的access_token, 見上面的“鑑權認證機制”段落
	 * @param lan	選填	語種選擇,預設中文(zh)。 中文=zh、粵語=ct、英文=en,不區分大小寫
	 * @param url	選填	可下載的語音下載地址,與callback連一起使用,確保百度伺服器可以訪問。
	 * @param callback	選填	使用者伺服器的識別結果回撥地址,確保百度伺服器可以訪問
	 * @param speech	選填	本地語音檔案的的二進位制語音資料 ,需要進行base64 編碼。與len引數連一起使用。
	 * @param len	選填	本地語音檔案的的位元組數,單位位元組
	*/
	publicstatic String Audio2text(String format,Integer rate,String cuid,String token,String speech,long len)throws Exception{
		HashMap<String, Object> paramMap = new HashMap<String, Object>();
		paramMap.put("speech",speech);
		paramMap.put("format", format);
		paramMap.put("rate", rate);
		paramMap.put("channel",1);
		paramMap.put("cuid",cuid);
		paramMap.put("token", token);
		paramMap.put("len", len);
		net.sf.json.JSONObject params = net.sf.json.JSONObject.fromObject(paramMap);
		String data = HttpUtil.postASR(AUDIO2TEXT_URL,params.toString());
		System.out.println("語音檔案識別的內容:"+data);
		return data;
	}
}

看看返回的內容

{
    "corpus_no": "6496262443167631439", 
    "err_msg": "success.", 
    "err_no": 0, 
    "result": [
        "開發者小帥你好,"
    ], 
    "sn": "74778487111512528965"
}

以上就是語音識別Java-API呼叫示例程式碼哦。難點是MP3轉PCM會卡殼開發者們。


相關推薦

語音識別JavaAPI方式語音識別示例 MP3PCM檔案Java實現

【百度語音識別】JavaAPI方式語音識別示例MP3轉PCM Java-API合成語音示例:http://ai.baidu.com/forum/topic/show/496727REST-API文

語音合成JavaAPI方式語音合成示例

Java-SDK合成語音示例:http://ai.baidu.com/forum/topic/show/492725REST-API文件地址:http://ai.baidu.com/docs#/TTS

地圖API如何使用suggestion--下拉列表方式的搜尋建議

                摘要:  百度地圖上有一個很強大的搜尋建議功能,以下拉列表的方式展示出來。比如,輸入“百度”,下拉列表中就會出現“北京市海淀區百度線上網路技術(北京)有限公司”。這個如何實現呢?讓我們一步一步來學習。---------------------------------------

雲破解Aria2GUI使用教程

兩個工具: Aria2GUI 下載地址 Aria2GUI Chrome外掛 下載地址 Chrome外掛設定:下載後文件解壓一下,開啟chrome瀏覽器-》更多工具-》擴充套件程式,直接將資料夾拖入即可;下面為成功例項 先開啟Aria2GUI, 找到自己網盤對應資源介面,重新整理

LOGO許可權三天時間從獲取LOGO許可權到稽核通過

  一、百度LOGO許可權是什麼?   在百度站長平臺的介紹中有關於網站logo許可權的說明:官網LOGO旨在幫助站點提升百度搜索的優質展示。因此,獲得logo許可權也可以說是百度對於我們網站質量的認可。   二、如何獲取LOGO許可權?   在百度站長平臺有關於L

運營部面試記錄

1. 投遞概況 投遞部門:百度運維部(睿思內推)8月初投遞 投遞崗位:智慧平臺研發工程師 崗位描述: 負責百度運維智慧平臺(智慧運維機器人)的研究,設計與實現 負責百度超大規模系統,產品運維資料分析和機器學習模型/策略/演算法的設計和實現 參與產品系統

群面2017年春招-實習產品經理-群面覆盤

本來以為掛掉的群面,突然收到了二面的通知。緊張、興奮、一頭霧水。。。 不知道bd每年的春招hc和每輪面試的淘汰率,在準備群面前確實是相對輕鬆的,正常準備,而且如此大公司的群面淘汰率是很高的,我對自己的

地圖高階例項1-如何利用地圖API,製作房產酒店地圖?(中)

<!DOCTYPE html><html><head><meta http-equiv="Content-Type" content="text/html; charset=gb2312"/><title>酷訊酒店地圖</title>

地圖api之獲取當前使用者地理位置-瀏覽器定位

<script> var x=document.getElementById("demo"); function getLocation() { if (navigator.geolocation) { navigator.geolocation.getCurrentPos

地圖API交你如何用地圖搜尋自己的資料!不需資料庫

<html><head><meta http-equiv="Content-Type" content="text/html; charset=gb2312"/><title>自家資料+前端搜尋</title><script type="tex

PHP獲取兩個經緯度之間的距離地圖API

/** * @param int $lat1 緯度1 * @param int $lng1 經度1 * @param int $lat2 緯度2 * @param int $lng2 經度2

Android地圖API經緯度轉換地址超簡單方法!

第一種方式:  public static void reverseGeoCode(LatLng latLng) { // 建立地理編碼檢索例項 GeoCoder geoCoder = GeoCoder.newInstance();

地圖API如何進行地址解析與反地址解析?——模糊地址能搜尋到精確地理資訊!

摘要:   什麼是地址解析?   什麼是反地址解析?   如何運用地址解析,和反地址解析?   可以同時運用地址解析,和反地址解析麼?答案是,可以的。詳見最後一個示例與程式碼。 ------------------------------------------------

資料結構與演算法之樹的基本概念及常用操作的Java實現(二叉樹為例) --- 第十二篇

樹是一種非線性資料結構,這種資料結構要比線性資料結構複雜的多,因此分為三篇部落格進行講解: 第一篇:樹的基本概念及常用操作的Java實現(二叉樹為例) 第二篇:二叉查詢樹 第三篇:紅黑樹 本文目錄: 1、基本概念 1.1  什麼是樹 1.2  樹的

語音rest API文字轉換成語音,以及語音轉化成文字

通過rest API,呼叫百度語音介面,將其接入智慧客服。 百度語音:http://ai.baidu.com/docs/#/ASR-API/top #!/usr/bin/python3 import urllib.request import urllib import

圖表頁面引入多個圖表,讓其只適應

++ i++ top color win setoption 實例 get logs 【百度圖表】頁面引入多個圖表,讓其只適應 網上發現有個這樣的方法讓圖表自適應,window.onresize = myChart.resize; 但是發現好像只有最後一個有效,於是就有了

搜索框

add size nts on() post 百度搜索 aid style left html樣式 <div class="img"></div> <div class="yi"> <input type="text" id

ARAndroiddemo工程使用手記

AR【百度AR】【Android】demo工程使用手記 demo工程獲取和註意事項 百度AR平臺地址:https://ar.baidu.com/testapply 技術文檔地址:https://ai.baidu.com/docs#/DuMixAR-Android-SDK/top AR內容管理地址:https

大型網站的HTTPS實踐(一)——HTTPS協議和原理

大型網站的HTTPS實踐(一)——HTTPS協議和原理 原創 網路通訊/物聯網 作者:AIOps智慧運維 時間:2018-11-09 15:07:39  349  0   前言

大型網站的HTTPS實踐(二)——HTTPS加密演算法介紹

大型網站的HTTPS實踐(二)——HTTPS加密演算法介紹 原創 網路通訊/物聯網 作者:AIOps智慧運維 時間:2018-11-09 15:09:43  358  0   前言