《《聲音的合成》PPT課件》由會員分享,可在線閱讀,更多相關(guān)《《聲音的合成》PPT課件(65頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第 二 章 聲 音 的 合 成 l一 、 音 頻 信 號 1 .聲 音 是 一 種 波 聲 波 可 以 在 空 氣 中 傳 播 , 也 可 以 在 液 體 及固 體 中 傳 播 。 聲 音 三 要 素 (1) 音 調(diào) (高 低 ) (2) 音 強(qiáng) (強(qiáng) 弱 ) (3) 音 色 (特 質(zhì) ) 2 .音 質(zhì)音 質(zhì) 與 頻 率 范 圍 成 正 比 , 頻 率 范 圍越 寬 音 質(zhì) 越 好 3 .聲 音 采 樣 把 聲 音 信 號 按 固 定 的 時 間 間 隔 , 轉(zhuǎn)換 成 有 限 個 數(shù) 字 表 示 的 離 散 序 列 。 0000000100100011100110101011 常 用 聲 音
2、信 號 與 采 樣 頻 率 聲 音 信 號CD音 樂數(shù) 字 電 話 采 樣 頻 率 信 號 帶 寬數(shù) 字 電 話 44.1K16K8K 20K7K3.4K 4 .音 頻 文 件 的 種 類 及 特 點 (1)MIDI文 件 ( 電 子 樂 器 數(shù) 字 接 口 ) 是 用 于 在 音 樂 合 成 器 、 電 子 樂 器 、音 序 器 和 計 算 機(jī) 之 間 交 換 音 樂 信 息的 一 種 標(biāo) 準(zhǔn) 協(xié) 議 。 MIDI實 質(zhì) 上 是 由 MIDI控 制 器 ( 或 MIDI文 件 )產(chǎn) 生 的 指 示 電 子 音 樂 合 成 器 要 做 什 么 、 怎么 做 ( 如 演 奏 某 個 音 符 、
3、加 大 音 量 、 生 成音 響 效 果 ) 的 一 套 標(biāo) 準(zhǔn) 指 令 。 MIDI不 是 聲音 信 號 , 在 MIDI電 纜 上 傳 送 的 不 是 聲 音 ,而 是 動 作 指 令 。 由 于 MIDI只 是 記 錄 音 樂 信 息 的 數(shù) 字 代 碼 ,所 以 生 成 的 文 件 比 較 小 , 便 于 傳 播 , 也 便于 編 輯 修 改 與 Mp3、 Wav等 音 頻 格 式 不 同 的 是 MIDI的 播放 質(zhì) 量 很 大 程 度 上 取 決 于 硬 件 或 軟 件 的 音源 環(huán) 境 , 也 就 是 說 同 樣 的 MIDI文 件 在 不 同的 電 腦 上 可 能 有 非 常
4、明 顯 的 效 果 差 別 , 究其 原 因 是 因 為 它 們 調(diào) 用 的 波 表 音 色 庫 不 一樣 聲 音 文 件 :24.9K 聲 音 文 件 :16K (2) 標(biāo) 準(zhǔn) 格 式 的 WAV文 件 和 CD格 式 一 樣 , 也 是44.1K的 采 樣 頻 率 , 速 率 88K/秒 , 16位 量 化位 數(shù) WAV格 式 的 聲 音 文 件 質(zhì) 量 和 CD相 差 無 幾 MP3也 就 是 指 的 是 MPEG標(biāo) 準(zhǔn) 中 的 音 頻 部 分 ,也 就 是 MPEG音 頻 層 。 根 據(jù) 壓 縮 質(zhì) 量 和 編 碼處 理 的 不 同 分 為 3層 , 分 別 對 應(yīng)“ *.mp1” /
5、“ *.mp2” /“ *.mp3” 這 3種 聲音 文 件 。 MPEG音 頻 文 件 的 壓 縮 是 一 種 有 損 壓 縮 , MPEG3高 壓 縮 率 , 基 本 保 持 低 音 頻 部 分 不失 真 , 但 是 犧 牲 了 聲 音 文 件 中 12KHz到16KHz高 音 頻 這 部 分 的 質(zhì) 量 來 換 取 文 件 的 尺寸 相 同 長 度 的 音 樂 文 件 ,用 .mp3格 式 來 儲 存 ,一 般 只 有 .wav文 件的 1/10, 而 音 質(zhì) 要 次于 CD格 式 或 WAV格 式的 聲 音 文 件 。 文 件 尺寸 小 , 音 質(zhì) 好 二 、 錄 音 編 輯 1.基
6、于 句 子 和 單 詞 的 錄 音 編 輯 方 式 可 以 預(yù) 先 將 句 子 、 單 詞 作 為 錄 音 的 單 位 ,對 錄 音 、 講 話 所 涉 及 的 有 關(guān) 句 子 或 單 詞 逐 個進(jìn) 行 錄 音 并 保 存 為 了 實 現(xiàn) 這 種 錄 音 編 輯 方 式 , 應(yīng) 事 先 存入 大 量 的 有 關(guān) 單 詞 、 句 子 ( 即 需 要 大 量 的 存儲 空 間 ) , 聲 音 合 成 時 還 需 要 快 速 地 檢 出 和呈 現(xiàn) ( 需 要 高 速 的 檢 索 和 控 制 ) 。 2.基 于 音 節(jié) 的 編 輯 合 成 方 式在 任 何 語 言 中 , 音 節(jié) 的 數(shù) 量 比 單
7、詞 的 數(shù) 量 少很 多 ;基 于 音 節(jié) 的 編 輯 方 式 在 合 成 時 的 檢 索 、 控 制變 得 十 分 方 便 ;基 于 音 節(jié) 的 合 成 方 式 的 音 質(zhì) 較 差 , 很 難 表 現(xiàn)人 們 在 講 話 時 的 各 種 情 感 和 聲 調(diào) 的 變 化 ;根 據(jù) 發(fā) 音 耦 合 的 原 理 和 要 求 , 人 們 對 單 詞 的發(fā) 音 制 定 了 一 定 的 規(guī) 則 , 基 于 這 種 規(guī) 則 進(jìn)行 聲 音 合 成 , 可 以 得 到 較 好 的 聲 音 效 果 。 3.錄 音 編 輯 聲 音 合 成 的 分 析( 1) 以 錄 音 編 輯 的 方 式 進(jìn) 行 聲 音 合 成
8、, 需 要大 容 量 的 存 儲 設(shè) 備( 2) 為 了 讓 一 定 容 量 的 存 儲 設(shè) 備 能 存 儲 更 多的 聲 音 信 息 , 需 要 對 聲 音 信 息 的 數(shù) 據(jù) 量 進(jìn)行 壓 縮( 3) 通 過 編 碼 的 方 式 , 減 少 聲 音 信 息 中 的 冗余 性 是 實 現(xiàn) 聲 音 信 息 壓 縮 的 基 本 方 法 。 三 、 脈 沖 代 碼 調(diào) 制 PCM 脈 沖 代 碼 調(diào) 制 PCM( pulse code modulation)是 一 種 對 模 擬 信 號 的 編 輯聲 音 信 號 是 一 種 模 擬 信 號 , 經(jīng) PCM編 碼 后 , 變成 數(shù) 字 信 號通 常
9、 所 說 的 PCM錄 音 就 是 一 種 數(shù) 字 錄 音 。 1.基 本 原 理PCM編 碼 過 程 :( 1) 對 模 擬 聲 音 信 號 進(jìn) 行 采 樣 采 樣 周 期采 樣 信 號 t振幅 ( 2) 將 各 個 采 樣 點 的 聲 音 信 號 值 通 過 模 數(shù)變 換 ( A D轉(zhuǎn) 換 ) 變 換 成 由 0和 1組 成 的脈 沖 變 換 序 列 0011001000010000111111101101 正 值負(fù) 值 模 擬 信 號碼 字 序 列 ( 3) 在 PCM( 脈 沖 代 碼 調(diào) 制 ) 中 所 分 配 碼 字的 首 位 為 符 號 位 ,信 號 為 正 時 , 首 位 為
10、0信 號 為 負(fù) 時 , 首 位 為 1( 4) 對 聲 音 采 樣 的 頻 率 稱 為 采 樣 頻 率 : f經(jīng) 采 樣 后 對 每 一 個 采 樣 點 分 配 的 碼 字 為 a位 ,用 于 存 儲 1秒 鐘 的 聲 音 信 號 所 需 的 存 儲 容 量 為fa , 它 也 表 示 了 傳 遞 聲 音 信 號 所 需 的 速 率 。 例 :設(shè) 聲 音 信 號 的 采 樣 頻 率 為 10KHz, PCM編 碼 所分 配 碼 字 長 度 為 8bit, 傳 送 該 聲 音 信 號 所需 的 傳 遞 速 率 應(yīng) 不 低 于 10 103 8=8 104 bits ( 5) PCM錄 音 及
11、其 聲 音 合 成 系 統(tǒng) 揚 聲 器AD變 換 器 錄 音 話 筒 大 容 量存 儲 器 DA變 換 器 2.采 樣 與 量 化( 1) 在 PCM調(diào) 制 中 , 采 樣 頻 率 應(yīng) 是 聲 音 信 號中 最 高 頻 率 的 兩 倍 以 上( 2) 聲 音 信 號 中 包 括 有 多 種 不 同 的 頻 率 成 分 ,為 使 各 種 不 同 的 頻 率 成 分 都 能 很 好 地 傳 遞 、呈 現(xiàn) , 所 需 的 帶 寬 應(yīng) 是 20Hz-20KHz 采 樣 頻 率 應(yīng) 選 為 40Hz( 3) 對 于 連 續(xù) 的 聲 音 信 息 , 由 于 其 相 關(guān) 性 ,通 過 前 、 后 的 有 關(guān)
12、 信 息 可 以 實 現(xiàn) 信 息 的 預(yù)測 和 識 別 , 聲 音 合 成 時 采 樣 頻 率 選 為 8KHz就 足 夠 了 ( 至 多 10KHz) ( 4) PCM編 碼 中 , 除 需 要 以 一 定 的 頻 率 進(jìn) 行采 樣 外 , 還 需 要 對 每 一 個 樣 本 進(jìn) 行 量 化 ,分 配 一 定 的 碼 字( 5) 量 化 的 精 度 , 即 分 配 碼 字 的 長 度 , 對 聲音 的 失 真 度 有 很 大 影 響 。 聲 音 信 號 與 量 化 精 度 的 關(guān) 系 量 化 噪 音 與 量 化 精 度 , 即 分 配 碼 字 長 度 a之 間有 如 下 關(guān) 系 : 6( a
13、-1) dB 例 如 : 要 求 噪 音 的 信 噪 比 S N不 低 于 60dB 6( a-1) =60 a=11說 明 : 在 PCM編 碼 時 , 分 配 的 碼 字 長 度 應(yīng) 不 低于 11bit 如 采 樣 頻 率 為 10kHz 分 配 的 碼 字 長 度 為 11bit,記 錄 1秒 鐘 的 聲 音 信 息 所 需 要 的 存 儲 容 量 為 : 11 10 103=110( kb)若 以 字 節(jié) 計 算 , 記 錄 1分 鐘 的 聲 音 信 號 所 需 存儲 容 量 : 110 1038=14( KB)40KB的 存 儲 容 量 , 只 能 存 3秒 鐘 3.高 頻 濾 波
14、為 提 高 聲 音 合 成 效 果 , 進(jìn) 行 預(yù) 處 理 : 采 樣 頻 率 為 f 將 聲 音 信 號 中 高 于 f 2的高 頻 成 分 濾 掉 , 這 種 處 理 是 通 過 低 通 濾 波 器 完 成 低 通 濾 波 器 四 、 增 量 調(diào) 制 1.基 本 原 理 增 量 調(diào) 制 是 一 種 以 最 低 的 一 位 數(shù) 進(jìn) 行 數(shù) 據(jù)壓 縮 的 編 碼 方 式 在 DM系 統(tǒng) 中 , 應(yīng) 預(yù) 先 確 定 具 有 一 定 振 幅值 的 增 量 , 并 根 據(jù) 當(dāng) 前 信 號 與 基 于 預(yù) 測編 碼 的 預(yù) 測 值 之 間 的 差 值 進(jìn) 行 編 碼 。 設(shè) 當(dāng) 前 時 刻 n的 聲
15、音 信 號 值 為 Sn , 基 于 預(yù)測 編 碼 的 n-1時 刻 的 聲 音 信 號 預(yù) 測 值 為 Sn-1其 間 的 誤 差 值 en 為 en = Sn -Sn-1 e n為 預(yù) 測 誤 差 預(yù) 測 編 碼 是 按 照 不 斷 減 少 預(yù) 測 誤 差 的 方向 進(jìn) 行 編 碼 的 , 通 過 編 碼 , 使 預(yù) 測 值 Sn-1不斷 逼 近 Sn 在 DM方 式 中 , 預(yù) 測 值 是 以 Sn = Sn-1+ 確 定 的下 面 以 聲 音 信 號 采 樣 序 列 : 4, 5, 1, 0, 3 在 編 碼 前 , 應(yīng) 預(yù) 先 確 定 增 量 , 設(shè) =2, 并給 定 編 碼 的 初
16、 始 條 件 為 S0=0 n=1時 刻 : 聲 音 信 號 為 4, 由 于 初 始 條 件 為 S0=0 e1=S1 - S0 =4-0=4由 于 e1 0 分 配 增 量 =2, 以 碼 字 0表 示 , 預(yù) 測 值 為 S1= S0 + =2 n=2時 刻 : 聲 音 信 號 為 5, 預(yù) 測 誤 差 為 e2=S2 S1 =5-2=3由 于 e2 0 分 配 增 量 =2, 以 碼 字 1表 示 , 預(yù) 測 值 為 S2= S1 + =4 n=3時 刻 : 聲 音 信 號 為 1, 預(yù) 測 誤 差 為 e3=S3 S2 =1-4= -3由 于 e3 0 分 配 增 量 為 - , 以
17、 碼 字 0表 示 , 預(yù) 測 值 為 S3= S2 - =4-2=2聲 音 信 號 、 預(yù) 測 值 、 預(yù) 測 誤 差 與 碼 字 序 列 及其 相 互 間 的 關(guān) 系 如 下 圖 所 示 DM方 式 的 信 號 波 形 l 通 過 上 述 DM編 碼 的 過 程 , 可 得 到 聲 音 信 號的 DM編 碼 的 0、 1符 號 序 列 。 根 據(jù) 這 樣 的 符號 序 列 , 通 過 DM編 碼 的 逆 操 作 , 可 進(jìn) 行 解碼 , 恢 復(fù) 原 聲 音 信 號 。l 例 如 , =2的 情 況 下 , 接 收 的 碼 字 序 列 為“ 1101 1100” , 當(dāng) 碼 字 “ 1” 到
18、 來 時 , 進(jìn)行 +2的 操 作 , 當(dāng) 碼 字 “ 0” 到 來 時 , 進(jìn) 行 -2的 操 作 , 由 此 可 得 到 解 調(diào) 后 的 聲 音 信 號 為“ 2, 4, 2, 4, 6, 8, 6, 4” 。 2.粒 狀 噪 聲 與 超 載 噪 聲 增 量 調(diào) 制 是 一 種 一 位 數(shù) 的 編 碼 方 式 , 它根 據(jù) 預(yù) 測 誤 差 的 正 、 負(fù) 分 配 相 應(yīng) 的 在 很 多 情 況 下 , 信 號 的 變 化 很 小 , 甚 至不 變 , 在 這 種 情 況 下 , DM編 碼 仍 然 要 分 配+ 或 - . 2.粒 狀 噪 聲 與 超 載 噪 聲 l 如 上 圖 , 在 原
19、 聲 音 信 號 不 變 , 或 緩 慢 變 化時 , DM編 碼 的 碼 字 序 列 卻 是 010101 這 樣變 化 的 碼 字 序 列 。l 這 種 變 化 的 0、 1序 列 , 經(jīng) 解 碼 后 產(chǎn) 生 一 種 噪 聲 , 對 原 聲 音 符 號 的 音 質(zhì) 造 成 一 定 的 影響 , 稱 這 種 噪 聲 為 粒 狀 噪 聲(GranularNoise)。 為 了 減 小 粒 狀 噪 聲 的 影響 , 應(yīng) 減 小 增 量 的 幅 度 。 顯 然 , 的 幅 度越 小 , 粒 狀 噪 音 越 小 。 l 當(dāng) 增 量 的 幅 值 減 小 時 , 會 給 DM方 式 的 聲 音信 號 帶
20、 來 超 載 噪 聲 (OverloadNoise)l 對 于 一 定 的 增 量 幅 值 , 當(dāng) 聲 音 信 號 變 化 比較 大 時 , DM編 碼 信 號 值 的 變 化 跟 不 上 聲 音信 號 的 變 化 , 使 得 編 碼 信 號 值 的 變 化 比 原聲 音 信 號 產(chǎn) 生 一 種 延 遲 如 圖 所 示 超 載 噪 聲 為 了 減 少 超 載 噪 聲 應(yīng) 增 大 增 量 的 幅 值 ,這 與 減 小 粒 狀 噪 聲 是 相 矛 盾 的 。 一 般 地 , 人 們 對 超 載 噪 聲 噪 聲 的 感 知 不太 敏 感 , 而 粒 狀 噪 聲 在 整 個 頻 譜 范 圍 上 都會
21、產(chǎn) 生 一 定 的 影 響 , 它 對 音 質(zhì) 的 影 響 較 大 。因 此 , 在 決 定 增 量 的 幅 值 時 , 與 實 際 的 聲音 信 號 大 小 相 比 較 , 應(yīng) 選 擇 增 量 足 夠 小 的幅 值 增 量 的 幅 值 過 小 , 必 將 使 超 載 噪 聲 增加 , 為 減 少 超 載 噪 聲 , 可 增 加 采 樣 頻 率 ,使 得 在 一 定 的 采 樣 間 隔 內(nèi) 聲 音 信 號 的 變 化減 少 。 所 以 , 在 DM編 碼 時 , 應(yīng) 慎 重 選 擇 采樣 頻 率 和 增 量 幅 值 。 五 、 差 分 脈 沖 代 碼 調(diào) 制 基 本 原 理DPCM方 式 的 基 本 原 理 與 DM方 式 相 同 , 要 求 聲音 信 號 相 鄰 的 兩 個 采 樣 信 號 間 不 應(yīng) 有 很 大的 變 化 , 即 聲 音 信 號 是 一 種 連 續(xù) 性 的 信 號 。不 同 的 是 ,DM是 一 位 數(shù) 的 編 碼 , DPCM則 是 多 位數(shù) 的 編 碼 。 DPCM編 碼 解 碼 的 原 理 圖 DPCM編 碼 中 的 各 信 號 波 形