霽彩華年,因夢同行—— 慶祝深圳霽因生物醫(yī)藥轉(zhuǎn)化研究院成立十周年 情緒益生菌PS128助力孤獨癥治療,權威研究顯示可顯著改善孤獨癥癥狀 PARP抑制劑氟唑帕利助力患者從維持治療中獲益,改寫晚期卵巢癌治療格局 新東方智慧教育發(fā)布“東方創(chuàng)科人工智能開發(fā)板2.0” 精準血型 守護生命 腸道超聲可用于檢測兒童炎癥性腸病 迷走神經(jīng)刺激對抑郁癥有積極治療作用 探索梅尼埃病中 MRI 描述符的性能和最佳組合 自閉癥患者中癡呆癥的患病率增加 超聲波 3D 打印輔助神經(jīng)源性膀胱的骶神經(jīng)調(diào)節(jié) 胃食管反流病患者耳鳴風險增加 間質(zhì)性膀胱炎和膀胱疼痛綜合征的臨床表現(xiàn)不同 研究表明 多語言能力可提高自閉癥兒童的認知能力 科學家揭示人類與小鼠在主要癌癥免疫治療靶點上的驚人差異 利用正確的成像標準改善對腦癌結果的預測 地中海飲食通過腸道細菌變化改善記憶力 讓你在 2025 年更健康的 7 種驚人方法 為什么有些人的頭發(fā)和指甲比其他人長得快 物質(zhì)的使用會改變大腦的結構嗎 飲酒如何影響你的健康 20個月,3大平臺,300倍!元育生物以全左旋蝦青素引領合成生物新紀元 從技術困局到創(chuàng)新錨點,天與帶來了一場屬于養(yǎng)老的“情緒共振” “華潤系”大動作落槌!昆藥集團完成收購華潤圣火 十七載“冬至滋補節(jié)”,東阿阿膠將品牌營銷推向新高峰 150個國家承認巴勒斯坦國意味著什么 中國海警對非法闖仁愛礁海域菲船只采取管制措施 國家四級救災應急響應啟動 涉及福建、廣東 女生查分查出608分后,上演取得理想成績“三件套” 多吃紅色的櫻桃能補鐵、補血? 中國代表三次回擊美方攻擊指責 探索精神健康前沿|情緒益生菌PS128閃耀寧波醫(yī)學盛會,彰顯科研實力 圣美生物:以科技之光,引領肺癌早篩早診新時代 神經(jīng)干細胞移植有望治療慢性脊髓損傷 一種簡單的血漿生物標志物可以預測患有肥胖癥青少年的肝纖維化 嬰兒的心跳可能是他們說出第一句話的關鍵 研究發(fā)現(xiàn)基因檢測正成為主流 血液測試顯示心臟存在排斥風險 無需提供組織樣本 假體材料有助于減少靜脈導管感染 研究發(fā)現(xiàn)團隊運動對孩子的大腦有很大幫助 研究人員開發(fā)出診斷 治療心肌炎的決策途徑 兩項研究評估了醫(yī)療保健領域人工智能工具的發(fā)展 利用女子籃球隊探索足部生物力學 抑制前列腺癌細胞:雄激素受體可以改變前列腺的正常生長 肽抗原上的反應性半胱氨酸可能開啟新的癌癥免疫治療可能性 研究人員發(fā)現(xiàn)新基因療法可以緩解慢性疼痛 研究人員揭示 tisa-cel 療法治療復發(fā)或難治性 B 細胞淋巴瘤的風險 適量飲酒可降低高危人群罹患嚴重心血管疾病的風險 STIF科創(chuàng)節(jié)揭曉獎項,新東方智慧教育榮膺雙料殊榮 中科美菱發(fā)布2025年產(chǎn)品戰(zhàn)略布局!技術方向支撐產(chǎn)品生態(tài)縱深! 從雪域高原到用戶口碑 —— 復方塞隆膠囊的品質(zhì)之旅
您的位置:首頁 >百科精選 >

語音識別系統(tǒng)是什么應用(語音識別系統(tǒng)是什么原理)

關于語音識別系統(tǒng)是什么應用,語音識別系統(tǒng)是什么原理這個問題很多朋友還不知道,今天小六來為大家解答以上的問題,現(xiàn)在讓我們一起來看看吧!

1、我們可以設想,在不久的將來坐在辦公司里的經(jīng)理會對電腦說:“嗨!伙計,幫我通知一下公司所有員工,今天下午3:00準時開會。

2、”這是科學家在幾十年前的設想,語音識別長久以來一直是人們的美好愿望,讓計算機領會人所說的話,實現(xiàn)人機對話是發(fā)展人機通信的主要目標。

3、進入2l世紀,隨著計算機的日益普及,怎樣給不熟悉計算機的人提供一個友好而又簡易的操作平臺,是我們非常感興趣的問題,而語音識別技術就是其中最直接的方法之一。

4、  20世紀80年代中期以來,新技術的逐漸成熟和發(fā)展使語音識別技術有了實質(zhì)性的進展,尤其是隱馬爾可夫模型(HMM)的研究和廣泛應用,推動了語音識別的迅速發(fā)展,同時,語音識別領域也正處在一個黃金開發(fā)的關鍵時期,各國的開發(fā)人員正在向特定人到非特定人,孤立詞匯向連接詞,小詞匯量向大詞匯量來擴展研究領域,可以毫不猶豫地說,語音識別會讓計算機變得“善解人意”,許多事情將不再是“對牛彈琴”,最終用戶的口述會取代鼠標,鍵盤這些傳統(tǒng)輸入設備,只需要用戶的嘴和麥克風就能實現(xiàn)對計算機的絕對控制。

5、  隱馬爾可夫模型HMM的引入  現(xiàn)在假定HMM是一個輸出符號序列的統(tǒng)計模型,具有N個狀態(tài)S1,S2?Sn,在一個周期內(nèi)從一個狀態(tài)轉(zhuǎn)到另一個狀態(tài),每次轉(zhuǎn)移時輸出一個符號,轉(zhuǎn)移到了哪個狀態(tài)以及輸出什么符號,分別由狀態(tài)轉(zhuǎn)移概率和轉(zhuǎn)移時的輸出概率來決定,由于只能觀測到輸出符號序列,不能觀測到狀態(tài)轉(zhuǎn)移序列,因此成為隱藏的馬爾可夫模型。

6、  2、語音識別的特點  語音識別的意思是將人說話的內(nèi)容和意思轉(zhuǎn)換為計算機可讀的輸入,例如按鍵、二進制編碼或者字符序列等。

7、與說話人的識別不同,后者主要是識別和確認發(fā)出語音的人而非其中所包含的內(nèi)容。

8、語音識別的目的就是讓機器聽懂人類口述的語言,包括了兩方面的含義:第一是逐字逐句聽懂而不是轉(zhuǎn)化成書面的語言文字;第二是對作者簡介:賈聰,中國地質(zhì)大學機械與電子信息學院。

9、口述語言中所包含的命令或請求加以領會,做出正確回應,而不僅僅只是拘泥于所有詞匯的正確轉(zhuǎn)換。

10、  3、語音識別系統(tǒng)的工作流程  一般來說,一套完整的語音識別系統(tǒng)其工作過程分為7步:①對語音信號進行分析和處理,除去冗余信息。

11、②提取影響語音識別的關鍵信息和表達語言含義的特征信息。

12、③緊扣特征信息,用最小單元識別字詞。

13、④按照不同語言的各自語法,依照先后次序識別字詞。

14、⑤把前后意思當作輔助識別條件,有利于分析和識別。

15、⑥按照語義分析,給關鍵信息劃分段落,取出所識別出的字詞并連接起來,同時根據(jù)語句意思調(diào)整句子構成。

16、⑦結合語義,仔細分析上下文的相互聯(lián)系,對當前正在處理的語句進行適當修正。

17、  4、音識別系統(tǒng)基本原理框圖及原理  語音識別系統(tǒng)基本原理結構如圖1所示。

18、語音識別原理有三點:①對語音信號中的語言信息編碼是按照幅度譜的時間變化來進行;②由于語音是可以閱讀的,也就是說聲學信號可以在不考慮說話人說話傳達的信息內(nèi)容的前提下用多個具有區(qū)別性的、離散的符號來表示;③語音的交互是一個認知過程,所以絕對不能與語法、語義和用語規(guī)范等方面分裂開來。

19、  預處理,其中就包括對語音信號進行采樣、克服混疊濾波、去除部分由個體發(fā)音的差異和環(huán)境引起的噪聲影響,此外還會考慮到語音識別基本單元的選取和端點檢測問題。

20、反復訓練是在識別之前通過讓說話人多次重復語音,從原始語音信號樣本中去除冗余信息,保留關鍵信息,再按照一定規(guī)則對數(shù)據(jù)加以整理,構成模式庫。

21、再者是模式匹配,它是整個語音識別系統(tǒng)的核心部分,是根據(jù)一定規(guī)則以及計算輸入特征與庫存模式之間的相似度,進而判斷出輸入語音的意思。

22、  前端處理,先對原始語音信號進行處理,再進行特征提取,消除噪聲和不同說話人的發(fā)音差異帶來的影響,使處理后的信號能夠更完整地反映語音的本質(zhì)特征提取,消除噪聲和不同說話人的發(fā)音差異帶來的影響,使處理后的信號能夠更完整地反映語音的本質(zhì)特征。

23、  5、當前亟待解決的問題  語音識別系統(tǒng)的性能受到許多因素的影響,包括不同說話人的發(fā)音方式、說話方式、環(huán)境噪音、傳輸信道衰落等等。

24、具體要解決的問題有四點:①增強系統(tǒng)的魯棒性,也就是說如果條件狀況變得與訓練時很不相同,系統(tǒng)的性能下降不能是突變的。

25、②增加系統(tǒng)的適應能力,系統(tǒng)要能穩(wěn)定連續(xù)的適應條件的變化,因為說話人存在著年齡、性別、口音、語速、語音強度、發(fā)音習慣等方面的差異。

26、所以,系統(tǒng)應該有能力排除掉這些差異。

27、達到對語音的穩(wěn)定識別。

28、③尋求更好的語言模型,系統(tǒng)應該在語言模型中得到盡可能多的約束,從而解決由于詞匯量增長所帶來的影響。

29、④進行動力學建模,語音識別系統(tǒng)提前假定片段和單詞是相互獨立的,但實際上詞匯和音素的線索要求對反映了發(fā)聲器官運動模型特點的整合。

30、所以,應該進行動力學建模,從而將這些信息整合到語音識別系統(tǒng)中去。

31、  6、統(tǒng)的組成和分類  根據(jù)識別的對象不同語音識別大致上可分為3類:對孤立詞識別,對關鍵詞識別和對連續(xù)語音識別。

32、其中,孤立詞識別的任務是識別事先已知的孤立的詞;連續(xù)語音識別的任務則是識別任意的連續(xù)語音;連續(xù)語音流中的關鍵詞檢測針對的是連續(xù)語音,但它并不識別全③部文字,而只是檢測已知的若干關鍵詞在何處出現(xiàn),根據(jù)針對的發(fā)音人,可以把語音識別技術分為特定人語音識別和非特定人語音識別,前者只能識別一個或幾個人的語音,而后者則可以被任何人使用。

33、  7、語音識別技術應用領域及前景展望  語音識別技術借助飛速發(fā)展的高速信息網(wǎng),可實現(xiàn)計算機的全球聯(lián)網(wǎng)和信息資源共享,因此被廣泛應用的系統(tǒng)有:語音輸入和控制系統(tǒng),語音撥號系統(tǒng)、智能家電及玩具,智能電話查詢系統(tǒng),數(shù)據(jù)庫檢索等方面,在咨詢服務、教育等行業(yè),正潛移默化地改變和便利著我們的生活。

34、此外,語音識別系統(tǒng)還在多媒體手機、個人掌上電腦、車載導航器GPS等方面有著巨大的應用和市場前景。

35、  8、結語  語音識別是非常有發(fā)展?jié)摿Φ囊婚T學科,你可以設想。

36、我們平時生活中很多地方都可以用到它,可以大大便利我們的生活和工作,比如智能手機,智能空調(diào)及冰箱,電動門,汽車導航,機器人控制,醫(yī)療設施,軍事設備等。

37、可以毫不夸張的說,21世紀將會是語音識別廣泛流行和普及的時代,而語音識別產(chǎn)品和設備也會以其獨特的魅力引領時代潮流,成為時代追逐的寵兒和焦點。

本文分享完畢,希望對大家有所幫助。

標簽:

免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關。財經(jīng)信息僅供讀者參考,并不構成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權請聯(lián)系刪除!

最新文章