語音輸入是根據(jù)操作者的講話,電腦識別成漢字的輸入方法(又稱聲控輸入)。它是用與主機(jī)相連的話筒讀出漢字的語音,利用語音識別系統(tǒng)分析辯識漢字或詞組,把識別后的漢字顯示在編輯區(qū)中,再通過“發(fā)送”功能將編輯區(qū)的文字傳到其他文檔的編輯中。
語音識別技術(shù)的原理是將人的話音轉(zhuǎn)換成聲音信號,經(jīng)過特殊處理,與計算機(jī)中已存儲的已有聲音信號進(jìn)行比較,然后反饋出識別的結(jié)果。其關(guān)鍵在于將人的話音轉(zhuǎn)換成聲音信號的準(zhǔn)確性,以及與原有聲音信號比較時的智能化程度。語音識別技術(shù)是人工智能的有機(jī)組成部分。
這種輸入法的好處是不再用手去輸入,把雙手解放出來,只要會讀出漢字的讀音即可,但是受每個人漢字發(fā)音的限制,不可能都滿足語音識別軟件的要求,因此在實(shí)際應(yīng)用中錯誤率較鍵盤輸入高。特別是一些專業(yè)技術(shù)方面的語言,識別系統(tǒng)幾乎不能確認(rèn),錯誤率較高。
還記得一兩年前曾經(jīng)流行過一段時間語音輸入軟件(如IBM ViaVioce),其中大多數(shù)都是以IBM語音錄入軟件為內(nèi)核的,不過由于當(dāng)時計算機(jī)的處理速度還沒有達(dá)到很高的水平,所以并沒有形成氣候?,F(xiàn)在隨著計算機(jī)主頻不斷提高,就連Windows XP也內(nèi)置了語音錄入軟件,它用起來如何呢?讓我們一起來感受一下吧。
語音識別是操作系統(tǒng)將口頭語言轉(zhuǎn)換為書面文字的能力。內(nèi)部驅(qū)動程序(稱為SR引擎) 識別這些語言并能夠?qū)⑺鼈冝D(zhuǎn)換為文字。Windows XP語音識別系統(tǒng)需要揚(yáng)聲器或其他聲音輸入設(shè)備來接收聲音。通常,揚(yáng)聲器應(yīng)該是帶有集成噪音過濾器的高質(zhì)量設(shè)備。語音識別率直接與輸入質(zhì)量相關(guān)。劣質(zhì)擴(kuò)音器的識別率非常低,有的甚至無法接收。
Microsoft語音識別訓(xùn)練向?qū)?語音訓(xùn)練向?qū)?會指導(dǎo)您完成所需步驟,并且推薦放置擴(kuò)音器的最佳位置(由您進(jìn)行測試,獲得最佳效果)。
一、使用Microsoft語音識別引擎
我們可以在任何Microsoft Office XP程序、Internet Explorer 5.0和Outlook Express 5.0中口述文本。其它軟件可能最終將支持Microsoft語音識別引擎,此時不能在寫字板中口述文本。就像語音引擎都有特定的語言一樣,它們可能還有特定的地區(qū)要求。例如,“Microsoft English ASR Version 5引擎”是供美國、英國、澳大利亞人使用,而由于發(fā)音不同,其他不講美國英語的人使用時很費(fèi)勁。
要使用語音識別,需要有高質(zhì)量近距離的麥克風(fēng)以及聲卡或USB端口。您可以使用“麥克風(fēng)向?qū)?#8221;配置麥克風(fēng)的位置。
培訓(xùn)語音識別引擎熟悉您的聲音非常重要。當(dāng)大聲朗讀訓(xùn)練文本時,引擎就會找到適合您講話的模式,以便幫助它解釋您所說的話。訓(xùn)練可以為每個講話者創(chuàng)建語音配置文件。
二、安裝語音識別系統(tǒng)
(一)、確定是否已安裝語音識別引擎。
1、單擊“開始”,指向“設(shè)置”,依次單擊“控制面板”、“聲音、語音和音頻設(shè)備”,然后單擊“語音”。2、如果“語音屬性”中的“語音識別”選項(xiàng)卡可用,則表明已安裝了語音識別引擎。否則,手寫識別引擎尚未安裝。
(二)、從Microsoft Word 2002安裝語音識別
1.安裝語音輸入法 先打開Word XP程序,然后點(diǎn)擊菜單命令“工具→語音”。如果您以前沒有安裝過語音識別組件,那么系統(tǒng)會要求你插入Office XP安裝光盤,之后,系統(tǒng)就開始自動安裝了。(注意:安裝了語音識別之后,您可以在所有的Office XP組件中使用,并不只局限于Word。)
安裝結(jié)束之后,單擊“下一步”就可以開始進(jìn)行語音適應(yīng)訓(xùn)練了。
2.調(diào)整麥克風(fēng) 首先,注意不要直接把麥克風(fēng)放在嘴的前方,并且不要直接對著麥克風(fēng)呼吸,應(yīng)該把麥克風(fēng)放在距嘴側(cè)約一拇指寬的地方。其次,保持一個安靜的環(huán)境也是非常重要的。先測試一下麥克風(fēng),我們只需要根據(jù)提示用平常的語調(diào)朗讀句子,然后看音量儀的計數(shù)是否穩(wěn)定在綠色區(qū)域內(nèi)就可以了。
待音量儀式穩(wěn)定后,點(diǎn)擊“下一步”測試麥克風(fēng)的安放位置,再次朗讀對話框中的例句,然后聽一下回放的錄音是否清晰。一切調(diào)整好后,點(diǎn)擊“完成”。
3.語音訓(xùn)練 麥克風(fēng)設(shè)置完成以后,系統(tǒng)會進(jìn)行語音識別的訓(xùn)練。首先要求您確認(rèn)一些聲音基本信息,接著點(diǎn)擊“下一步”,系統(tǒng)給出一個例句,您可以點(diǎn)擊“示例”按鈕聽一聽?wèi)?yīng)該如何朗讀這樣的句子。之后,再次點(diǎn)擊“下一步”就可以開始語音訓(xùn)練了。
語音訓(xùn)練的方式如圖2所示。您只要用平常的語調(diào)朗讀對話框的內(nèi)容即可。系統(tǒng)會對您的語音進(jìn)行識別,能夠識別的語句即呈現(xiàn)選中狀態(tài),否則會停留在不能識別的字詞那里等待您進(jìn)行重復(fù)。所有的語句都識別結(jié)束之后,系統(tǒng)會自動生成語音配置文件。
如果您以后想再次進(jìn)行語音訓(xùn)練,那么,可以點(diǎn)擊語言欄上的“語音工具”按鈕,然后單擊“訓(xùn)練”來對計算機(jī)進(jìn)行語音識別的訓(xùn)練(如圖3)。
目前,國際上正醞釀和進(jìn)行著一場所謂信息革命,在這場革命中,一種能摸擬人的智能的計算機(jī),即所謂第五代計算機(jī)將嶄露頭角。這種計算機(jī)能看,能聽,能說,具有分析、判斷、推理和思考的能力,是名符其實(shí)的電腦。就語臼學(xué)范疇而論,這種計算機(jī)應(yīng)能接收自然語音的輸入和能用語音輸出。顯然。人們用自己的語音跟計算機(jī)打交道,這將是十分方便的。下面,我們就扼要地介紹一下計算機(jī)的語音輸入的基本原理和現(xiàn)狀。
4.語音輸入
語音文件配置好了,現(xiàn)在是開始語音輸入的時候了。在Word語言欄中,點(diǎn)擊圖3中的“麥克風(fēng)”按鈕,然后單擊語言欄上的“聽寫”按鈕,Word就進(jìn)入“聽寫模式”,您就可以口述您要書寫的內(nèi)容了,注意那些標(biāo)點(diǎn)符號也要讀出來喲。如果您點(diǎn)擊“聲音命令模式”按鈕,就可以口述執(zhí)行命令了。比如您說“打開”,那么程序就為您打開“文件→打開”對話框。感覺不錯吧!當(dāng)然,語音輸入總會有一定的錯誤率,您可以通過多次語音訓(xùn)練的方法來提高系統(tǒng)識別率。
在使用聽寫模式時,您最好將當(dāng)前輸入法設(shè)置為微軟拼音輸入法。如果有時您的計算機(jī)對您的語音置之不理的話,那么不妨看看當(dāng)前是否是微軟拼音輸入法。
5.不同用戶的語音識別
如果有多人都使用一臺計算機(jī)的話,每個人的聲音都不一樣,那計算機(jī)聽誰的好呢?不用擔(dān)心,您可以為每一個用戶建立一個不同的語音配置文件。方法是:點(diǎn)擊“開始→控制面板”,雙擊其中的“語音”項(xiàng)目,打開“語音屬性”對話框,點(diǎn)擊“語音”選項(xiàng)卡,然后點(diǎn)擊“新建”按鈕,就可以建立一個新的用戶了。不同用戶的語音配置文件是不同的,只要先在這里選中自己的配置文件,然后在Word中就可以進(jìn)行語音輸入了。
好了,我就說這么多吧。快去試試這種動口不動手的新感覺吧!