專利背景
傳統的音頻
播放器或者
音樂下載器中,常常通過與音頻檔案綁定的身份數據信息來識別
音頻檔案,這部分身份數據信息通常設定在音頻檔案的開頭或末尾的若干位元組內,稱為ID3信息,所述ID3信息常常記載了所述音頻檔案的歌手、標題、專輯名稱、年代、風格等信息。播放器或者下載器在音頻檔案中提取這部分身份數據信息,然後顯示給用戶查看。然而,如今通過相關的軟體可以輕易地修改音頻檔案中的所述身份數據信息,在網路上傳播的音頻檔案,所述身份數據信息在多次轉載的過程中可能會被不同的用戶修改甚至刪除,導致所述音頻檔案的身份數據信息與實際不符甚至無法識別,給用戶使用帶來不便。
發明內容
專利目的
《一種音頻檔案的旋律提取方法及旋律識別系統》提供一種較準確的音頻檔案的旋律提取方法,其不依賴於音頻檔案中綁定的身份數據信息,能夠準確地識別音頻檔案的身份。
技術方案
一種音頻檔案的旋律提取方法,包括以下步驟:對所有
用戶保存的所述音頻檔案的身份數據信息進行統計,將最多用戶保存或者使用的身份數據信息確定為所述音頻檔案標準的身份數據信息,將所述標準的身份數據信息與所述音頻檔案的第一數字標籤建立一一對應的關係,建立標籤庫,保存所述標籤庫,其中,所述標籤庫中預先保存多個音頻檔案的第一數字標籤以及所述音頻檔案的身份數據信息;在一個音頻檔案中截取若干個音頻片段,分別提取所述若干個音頻片段的音頻特徵生成所述音頻檔案的第二數字標籤;根據所述第二數字標籤查找所述標籤庫,獲取與所述第二數字標籤相匹配的第一數字標籤及其對應的身份數據信息;將所述身份數據信息與所述音頻檔案相匹配。
《一種音頻檔案的旋律提取方法及旋律識別系統》要解決的技術問題還在於提供一種較準確的音頻檔案的旋律識別系統。所述音頻檔案的旋律識別系統包括
客戶端和
伺服器,所述客戶端用於在一個音頻檔案中截取若干個音頻片段;分別提取所述若干個音頻片段的音頻特徵,生成所述音頻檔案的第二數字標籤,然後將所述第二數字標籤傳送至所述伺服器;接收所述伺服器傳送的身份數據信息,將所述身份數據信息與所述音頻檔案相匹配。所述伺服器用於對所有用戶保存的所述音頻檔案的身份數據信息進行統計,將最多用戶保存或者使用的身份數據信息確定為所述音頻檔案標準的身份數據信息,將所述標準的身份數據信息與所述音頻檔案的第一數字標籤建立一一對應的關係,建立標籤庫,保存所述標籤庫,其中,所述標籤庫中預先保存多個音頻檔案的第一數字標籤以及所述音頻檔案的身份數據信息;接收所述客戶端傳送的第二數字
標籤,根據所述第二數字標籤查找所述標籤庫,獲取與所述第二數字標籤相匹配的第一數字標籤及其對應的身份數據信息,並將所述身份數據信息傳送至所述客戶端。
改善效果
與2010年11月之前的技術相比較,《一種音頻檔案的旋律提取方法及旋律識別系統》的音頻檔案的旋律提取方法及旋律識別系統中,對一個音頻檔案截取音頻片段,提取所述音頻片段的特徵生成所述第二數字標籤,查找所述標籤庫,獲取與所述第二數字標籤對應的音頻檔案身份數據信息並匹配至對應的音頻檔案。因為在識別音頻檔案的過程中不依賴於所述音頻檔案上附帶的身份數據信息,而是直接根據其本身的音頻特徵來識別所述音頻檔案,因為每個所述音頻檔案都有其唯一的音頻特徵,所以該發明的音頻檔案的旋律提取方法及旋律識別系統能夠準確地識別各個不同的音頻檔案,不會因為在轉載過程中身份數據信息的修改而導致無法識別。並且,由於不是對整個音頻檔案生成所述第二數字標籤,而是截取音頻檔案中的音頻片段來生成所述第二數字標籤,所以,所述第二數字標籤的數據量比較小;通過截取數據片段的過程篩選出非靜音的音頻片段,還可以在生成所述第二數字標籤時過濾掉連續靜音的音頻片段,進一步減小所述數字標籤的數據量,因此可以加快在所述標籤庫中查找數字標籤的速度,從而提高整個音頻檔案識別過程的效率;另外,還可以使所述標籤庫中儲存更多的數字標籤,增強對音頻檔案的識別能力。
附圖說明
圖1是《一種音頻檔案的旋律提取方法及旋律識別系統》音頻檔案的旋律提取方法的步驟流程圖;
圖2是《一種音頻檔案的旋律提取方法及旋律識別系統》音頻檔案的旋律識別系統的結構示意圖;
圖3是《一種音頻檔案的旋律提取方法及旋律識別系統》音頻檔案的旋律識別系統中客戶端的結構示意圖。
權利要求
1.一種音頻檔案的旋律提取方法,其特徵在於包括以下步驟:對所有用戶保存的所述音頻檔案的身份數據信息進行統計,將最多用戶保存或者使用的身份數據信息確定為所述音頻檔案標準的身份數據信息,將所述標準的身份數據信息與所述音頻檔案的第一數字標籤建立一一對應的關係,建立標籤庫,保存所述標籤庫,其中,所述標籤庫中預先保存多個音頻檔案的第一數字標籤以及所述音頻檔案的身份數據信息;在一個音頻檔案中截取若干個音頻片段,分別提取所述若干個音頻片段的音頻特徵生成所述音頻檔案的第二數字標籤;根據所述第二數字標籤查找所述標籤庫,獲取與所述第二數字標籤相匹配的第一數字標籤及其對應的身份數據信息;將所述身份數據信息與所述音頻檔案相匹配。
2.如權利要求1所述的音頻檔案的旋律提取方法,其特徵在於,查找所述標籤庫,獲取與所述第二數字標籤相匹配的第一數字標籤及其對應的身份數據信息的步驟包括:在預設的誤差範圍內,查找與所述第二數字標籤相似度最高的所述第一數字標籤,獲取所述第一數字標籤及其對應的音頻檔案身份信息。
3.如權利要求1所述的音頻檔案的旋律提取方法,其特徵在於,在一個音頻檔案中截取若干個音頻片段的步驟包括:將所述音頻檔案分成多個幀,幀與幀之間互相重疊,將每一幀作為一個所述音頻片段。
4.如權利要求1、2或者3所述的音頻檔案的旋律提取方法,其特徵在於,分別提取所述若干個音頻片段的音頻特徵生成所述音頻檔案的第二數字標籤的步驟包括:檢測所述音頻片段的下述各種音頻特徵參數中的一種或多種,通過採樣、量化和編碼生成所述第二數字標籤:響度、亮度、音調、短時平均能量、過零率、能量譜、Mel倒譜係數以及線性預測係數。
5.如權利要求4所述的音頻檔案的旋律提取方法,其特徵在於:在檢測所述音頻片段的過零率時,預先設定一門限值,如果在單位時間內樣點值改變符號,並且差值的絕對值大於所述門限值,則所述過零率加1。
6.一種音頻檔案的旋律識別系統,包括客戶端和伺服器,其特徵在於:所述客戶端用於在一個音頻檔案中截取若干個音頻片段;分別提取所述若干個音頻片段的音頻特徵,生成所述音頻檔案的第二數字標籤,然後將所述第二數字標籤傳送至所述伺服器;接收所述伺服器傳送的身份數據信息,將所述身份數據信息與所述音頻檔案相匹配;所述伺服器用於對所有用戶保存的所述音頻檔案的身份數據信息進行統計,將最多用戶保存或者使用的身份數據信息確定為所述音頻檔案標準的身份數據信息,將所述標準的身份數據信息與所述音頻檔案的第一數字標籤建立一一對應的關係,建立標籤庫,並保存所述標籤庫,其中,所述標籤庫中預先保存多個音頻檔案的第一數字標籤以及所述音頻檔案的身份數據信息;接收所述客戶端傳送的第二數字標籤,根據所述第二數字標籤查找所述標籤庫,獲取與所述第二數字標籤相匹配的第一數字標籤及其對應的身份數據信息,並將所述身份數據信息傳送至所述客戶端。
7.如權利要求6所述的音頻檔案的旋律識別系統,其特徵在於:所述伺服器在預設的誤差範圍內,查找與所述第二數字標籤相似度最高的所述第一數字標籤,獲取所述第一數字標籤及其對應的音頻檔案身份信息。
8.如權利要求6所述的音頻檔案的旋律識別系統,其特徵在於:所述客戶端將所述音頻檔案分成多個幀,幀與幀之間互相重疊,將每一幀作為一個所述音頻片段。
9.如權利要求6、7或者8所述的音頻檔案的旋律識別系統,其特徵在於:所述客戶端檢測所述音頻片段的下述各種音頻特徵參數中的一種或多種,通過採樣、量化和編碼生成所述第二數字標籤:響度、亮度、音調、短時平均能量、過零率、能量譜、Mel倒譜係數以及線性預測係數。
10.如權利要求9所述的音頻檔案的旋律識別系統,其特徵在於:所述客戶端在檢測所述音頻片段的過零率時,預先設定一門限值,如果在單位時間內樣點值改變符號,並且差值的絕對值大於所述門限值,則所述過零率加1。
實施方式
參閱圖1,圖1是《一種音頻檔案的旋律提取方法及旋律識別系統》音頻檔案的旋律提取方法的步驟流程圖。所述音頻檔案的旋律提取方法包括以下步驟:
在步驟S101,保存預先建立的標籤庫。其中,所述標籤庫中預先保存多個音頻檔案的第一數字標籤以及所述音頻檔案的身份數據信息。
在該步驟中,可以先對音頻庫中的音頻檔案進行音頻片段的截取,然後根據所述音頻片段的音頻特徵生成所述音庫中所有音頻檔案的第一數字標籤,然後將所述音頻檔案標準的身份數據信息與所述第一數字標籤建立一一對應的關係,建立所述標籤庫。所述第一數字標籤根據所述音頻檔案的音頻特徵生成,其生成步驟可與步驟S102中所述第二數字標籤的生成方法相同。在所述標籤庫中,對於一個音頻檔案,可以保存根據所述音頻檔案的一個音頻片段的音頻特徵生成的第一數字標籤,也可以同時保存分別根據所述音頻檔案的多個音頻片段的音頻特徵生成的多個第一數字標籤。所述音頻檔案的身份數據信息的確定可以採用趨勢算法,即,在多個用戶的音頻庫中,所述音頻檔案可能對應保存有不同的身份數據信息,此時,對所有用戶保存的所述音頻檔案的身份數據信息進行統計,將最多用戶保存或者使用的身份數據信息確定為所述音頻檔案標準的身份數據信息,則,將所述標準的身份數據信息與所述音頻檔案的第一數字標籤建立一一對應的關係,建立所述標籤庫。其中,所述身份數據信息包括:歌手、歌詞、所屬專輯、流派等。在步驟S102,在一個音頻檔案中截取若干個音頻片段,分別根據所述若干個音頻片段的音頻特徵生成所述音頻檔案的第二數字標籤。在該步驟中,首先獲取用戶指定的音頻檔案,然後根據用戶選定的範圍在所述音頻檔案中截取相應的音頻片段,然後分析提取所述音頻片段的音頻特徵,生成相應的第二數字標籤。
其中,該步驟中的所述第二數字標籤和步驟S101中的第一數字標籤可以根據所述音頻檔案的某種音頻特徵或者多種音頻特徵組合形成,例如:響度、亮度、音調、短時平均能量、過零率、能量譜、Mel倒譜係數、線性預測係數等。通過對上述各種音頻特徵的檢測、採樣、量化、編碼,從而生成對應的數字標籤。
所述音頻檔案的音頻特徵分為時域特徵和頻域特徵。時域特徵如:短時平均能量、過零率。其中,短時平均能量反映了音頻能量幅度的變化,而過零率則表示語音信號波形超過橫軸(零電平)的次數。短時平均能量和過零率結合常常用來區分靜音、非靜音、清音、濁音,以及音樂的開始和結束。特別地,在提取所述音頻檔案的過零率特徵時,為了避免靜音段的隨機噪聲帶來過高的過零率,預先設定一個門限值,如:delta=0.02,如果在單位時間內樣點值改變符號,並且差值的絕對值大於0.02,則過零率加1。而音頻檔案的頻域特徵包括:能量譜、倒譜值等。在提取所述音頻檔案的頻域特徵時,可以先對音頻信號進行傅立葉變換,分析出組成該信號的不同頻率和不同幅值的諧波,然後分別對這些諧波進行頻域特徵係數的提取。其中,能量譜用於分析該音頻檔案的能量分布,可獲得構成該音頻檔案的主要頻率;而檢測倒譜值則可以獲得聲門波的頻率(音調)和聲道的特徵(共振峰)。
再者,某些音頻信號具有很強的時變特性,即在一段時間內表現出周期信號的特性,而在另一段時間段則表現出噪音特性。對於這些時變劇烈的音頻信號,既要考慮其時域特性,也要考慮其頻域特性,則,可以採取短時傅立葉變換思想:假定非平穩的音頻信號x(t)在分析窗函式g(t)的一個短時間間隔內是平穩的,移動分析窗函式g(t),使x(t)g(t-τ)在不同的有限時間寬度內是平穩信號,從而計算出所述音頻信號x(t)在各個不同時刻的能量譜。
在生成所述第一數字標籤或者所述第二數字標籤時,可以根據實際需要,單獨提取所述音頻檔案的時域特徵來生成所述第一數字標籤或者所述第二數字標籤,或者單獨提取所述音頻檔案的頻域特徵來生成所述第一數字標籤或者所述第二數字標籤,也可以同時提取音頻檔案的時域特徵和頻域特徵,將兩者互相結合來生成所述第一數字標籤或者所述第二數字標籤。進一步地,在所述音頻檔案中截取所述音頻片段時,可以預先根據隱馬爾科夫模型建立分割所述音頻檔案的音頻片段篩選模板,由於隱馬爾科夫模型具有良好的隨機時序性,並且不依賴於具體的閾值,因此,通過所述音頻片段篩選模板可以篩選出所述音頻檔案中用戶套用較多或者檢索較多的音頻片段,例如含有音樂高潮部分的音頻片段;同時過濾掉所述音頻檔案中用戶套用較少或者檢索較少的音頻片段,例如靜音部分的音頻片段,從而大大提高生成所述第一數字標籤或者所述第二數字標籤的速度,也提高了音頻檔案識別的準確率。進一步地,在該步驟中,將所述音頻檔案分成多個幀,幀與幀之間互相重疊,每一幀即為對所述音頻檔案截取的音頻片段,則,對所述音頻檔案截取的若干個音頻片段覆蓋了整個所述音頻檔案所有部分的音頻特徵,如此可以提高識別音頻檔案的準確率。
在步驟S103,根據所述第二數字標籤查找所述標籤庫,獲取與所述第二數字標籤相匹配的第一數字標籤及其對應的音頻檔案身份數據信息。在查找所述標籤庫時,因為截取音頻片段和提取音頻片段的音頻特徵時可能會有誤差,導致所述第一數字標籤和所述第二數字標籤可能並不完全相同,因此在該步驟中,可對所述第一數字標籤和所述第二數字標籤採取模糊類聚算法來對比,即在預設的誤差範圍內查找與所述第二數字標籤相似度最高的所述第一數字標籤,並獲取所述第一數字標籤及其對應的音頻檔案身份數據信息。
在步驟S104,將所述身份數據信息與所述音頻檔案相匹配。在該步驟中,可以將上述步驟S103中獲取的所述音頻檔案身份數據信息,替換原來混亂的或者錯誤的身份數據信息。
與2010年11月之前的技術相比較,該發明的音頻檔案的旋律提取方法中,對一個音頻檔案截取音頻片段,提取所述音頻片段的特徵生成所述第二數字標籤,查找所述標籤庫,獲取與所述第二數字標籤對應的音頻檔案身份數據信息並匹配至對應的音頻檔案。因為在識別音頻檔案的過程中不依賴於所述音頻檔案上附帶的身份數據信息,而是直接根據其本身的音頻特徵來識別所述音頻檔案,因為每個所述音頻檔案都有其唯一的音頻特徵,所以該發明的音頻檔案的旋律提取方法及旋律識別系統能夠準確地識別各個不同的音頻檔案,不會因為在轉載過程中身份數據信息的修改而導致無法識別。並且,由於不是對整個音頻檔案生成所述第二數字標籤,而是截取音頻檔案中的音頻片段來生成所述第二數字標籤,所以,所述第二數字標籤的數據量比較小;通過截取數據片段的過程篩選出非靜音的音頻片段,還可以在生成所述第二數字標籤時過濾掉連續靜音的音頻片段,進一步減小所述數字標籤的數據量,因此可以加快在所述標籤庫中查找數字標籤的速度,從而提高整個音頻檔案識別過程的效率;另外,還可以使所述標籤庫中儲存更多的數字標籤,增強對音頻檔案的識別能力。
參閱圖2和圖3,圖2是該發明音頻檔案的旋律識別系統的結構示意圖;圖3是該發明音頻檔案的旋律識別系統中客戶端的結構示意圖。所述音頻檔案的旋律識別系統包括:客戶端21和伺服器22;所述客戶端21用於在一個音頻檔案中截取若干個音頻片段;分別提取所述若干個音頻片段的音頻特徵,生成所述音頻檔案的第二數字標籤,然後將所述第二數字標籤傳送至所述伺服器22;接收所述伺服器22傳送的身份數據信息,將所述身份數據信息與所述音頻檔案相匹配;所述伺服器22用於保存預先建立的標籤庫,其中,所述標籤庫中預先保存多個音頻檔案的第一數字標籤以及所述音頻檔案的身份數據信息;接收所述客戶端21傳送的第二數字標籤,根據所述第二數字標籤查找所述標籤庫,獲取與所述第二數字標籤相匹配的第一數字標籤及其對應的身份數據信息,並將所述身份數據信息傳送至所述客戶端21。所述伺服器22中儲存所述標籤庫,在該實施方式中,可以先對連線所述伺服器22各個所述客戶端21的音頻庫中的音頻檔案進行音頻片段的截取,然後根據所述音頻片段的音頻特徵生成所述音頻庫中所有音頻檔案的第一數字標籤,將所述第一數字標籤保存在所述伺服器22中,與所述第一數字標籤建立一一對應的關係,建立所述標籤庫。所述第一數字標籤根據所述音頻檔案的音頻特徵生成,其生成方式可與所述第二數字標籤的生成方法相同。在所述標籤庫中,對於一個音頻檔案,可以保存根據所述音頻檔案的一個音頻片段的音頻特徵生成的第一數字標籤,也可以同時保存分別根據所述音頻檔案的多個音頻片段的音頻特徵生成的多個第一數字標籤。所述音頻檔案的身份數據信息的確定可以採用趨勢算法,即,在多個所述客戶端21的音頻庫中,所述音頻檔案可能對應保存有不同的身份數據信息,此時,對所有所述客戶端21的音頻庫中保存的所述音頻檔案的身份數據信息進行統計,將最多客戶端21保存或者使用的身份數據信息確定為所述音頻檔案標準的身份數據信息,則,將所述標準的身份數據信息與所述音頻檔案的第一數字標籤建立一一對應的關係,在所述伺服器22中建立所述標籤庫。其中,所述身份數據信息包括:歌手、歌詞、所屬專輯、流派等。
在所述客戶端21包括音頻庫211和數字標籤生成模組212。所述數字標籤生成模組212用於獲取所述音頻庫211中用戶指定的音頻檔案,然後根據用戶選定的範圍在所述音頻檔案中截取相應的音頻片段,分析提取所述音頻片段的音頻特徵,生成相應的第一數值標籤或者第二數字標籤。
其中,所述第二數字標籤和所述第一數字標籤可以根據所述音頻檔案的某種音頻特徵或者多種音頻特徵組合形成,例如:響度、亮度、音調、短時平均能量、過零率、能量譜、Mel倒譜係數、線性預測係數等。所述數字標籤生成模組212通過對上述各種音頻特徵的檢測、採樣、量化、編碼,從而生成對應的數字標籤。
所述音頻檔案的音頻特徵分為時域特徵和頻域特徵。時域特徵如:短時平均能量、過零率。其中,短時平均能量反映了音頻能量幅度的變化,而過零率則表示語音信號波形超過橫軸(零電平)的次數。短時平均能量和過零率結合常常用來區分靜音、非靜音、清音、濁音,以及音樂的開始和結束。特別地,所述數字標籤生成模組212在提取所述音頻檔案的過零率特徵時,為了避免靜音段的隨機噪聲帶來過高的過零率,預先設定一個門限值,如:delta=0.02,如果在單位時間內樣點值改變符號,並且差值的絕對值大於0.02,則過零率加1。而音頻檔案的頻域特徵包括:能量譜、倒譜值等。所述數字標籤生成模組212在提取所述音頻檔案的頻域特徵時,可以先對音頻信號進行傅立葉變換,分析出組成該信號的不同頻率和不同幅值的諧波,然後分別對這些諧波進行頻域特徵係數的提取。其中,能量譜用於分析該音頻檔案的能量分布,可獲得構成該音頻檔案的主要頻率;而檢測倒譜值則可以獲得聲門波的頻率(音調)和聲道的特徵(共振峰)。
再者,某些音頻信號具有很強的時變特性,即在一段時間內表現出周期信號的特性,而在另一段時間段則表現出噪音特性。對於這些時變劇烈的音頻信號,所述數字標籤生成模組212在提取其音頻特徵時既要考慮其時域特性,也要考慮其頻域特性,則,可以採取短時傅立葉變換思想:假定非平穩的音頻信號x(t)在分析窗函式g(t)的一個短時間間隔內是平穩的,移動分析窗函式g(t),使x(t)g(t-τ)在不同的有限時間寬度內是平穩信號,從而計算出所述音頻信號x(t)在各個不同時刻的能量譜。
所述數字標籤生成模組212在生成所述第一數字標籤或者所述第二數字標籤時,可以根據實際需要,單獨提取所述音頻檔案的時域特徵來生成所述第一數字標籤或者所述第二數字標籤,或者單獨提取所述音頻檔案的頻域特徵來生成所述第一數字標籤或者所述第二數字標籤,也可以同時提取音頻檔案的時域特徵和頻域特徵,將兩者互相結合來生成所述第一數字標籤或者所述第二數字標籤。
進一步地,所述數字標籤生成模組212中可以根據隱馬爾科夫模型建立音頻檔案數字標籤提取的音頻片段篩選模板,由於隱馬爾科夫模型具有良好的隨機時序性,並且不依賴於具體的閾值,因此,通過所述音頻片段篩選模板可以篩選出所述音頻檔案中用戶套用較多或者檢索較多的音頻片段,例如含有音樂高潮部分的音頻片段;同時過濾掉所述音頻檔案中用戶套用較少或者檢索較少的音頻片段,例如靜音部分的音頻片段,從而大大提高生成所述第一數字標籤或者所述第二數字標籤的速度,也提高了音頻檔案識別的準確率。
進一步地,所述數字標籤生成模組212中,將用戶選定的所述音頻檔案分成多個幀,幀與幀之間互相重疊,每一幀即為對所述音頻檔案截取的音頻片段,使所述數字標籤生成模組212對所述音頻檔案截取的若干個音頻片段覆蓋了整個所述音頻檔案所有部分的音頻特徵,如此可以提高識別音頻檔案的準確率。
所述伺服器22在查找所述標籤庫時,因為截取音頻片段和提取音頻片段的音頻特徵時可能會有誤差,可能會導致所述第一數字標籤和所述第二數字標籤不完全相同,因此所述伺服器22可對所述第一數字標籤和所述第二數字標籤採取模糊類聚算法,即在預設的誤差範圍內查找與所述第二數字標籤相似度最高的所述第一數字標籤,獲取所述第一數字標籤及其對應的音頻檔案身份數據信息,並將所述身份數據信息傳送至所述客戶端21。所述客戶端21接收所述伺服器22傳送的所述身份數據信息,將所述音頻檔案身份數據信息,替換原來保存在所述音頻庫211中的混亂的或者錯誤的身份數據信息。
與2010年11月之前的技術相比較,該發明的音頻檔案的旋律識別系統中,所述客戶端21中的數字標籤生成模組212根據音頻片段的特徵生成所述第二數字標籤,所述伺服器22根據所述第二數字標籤查找所述標籤庫,獲取與所述第二數字標籤對應的音頻檔案身份數據信息並匹配至對應的音頻檔案。因為在識別音頻檔案的過程中不依賴於所述音頻檔案上附帶的身份數據信息,而是直接根據其本身的音頻特徵來識別所述音頻檔案,又因為每個所述音頻檔案都有其唯一的音頻特徵,所以該發明的音頻檔案的旋律提取方法及旋律識別系統能夠準確地識別各個不同的音頻檔案,不會因為在轉載過程中對身份數據信息的修改而導致無法識別。並且,由於所述客戶端21不是對整個音頻檔案生成所述第二數字標籤,而是截取音頻檔案中的音頻片段來生成所述第二數字標籤,所以,所述第二數字標籤的數據量比較小;通過截取數據片段的過程篩選出非靜音的音頻片段,還可以在生成所述第二數字標籤時過濾掉連續靜音的音頻片段,進一步減小所述數字標籤的數據量,因此可以加快所述數字標籤在所述客戶端21和所述伺服器22之間傳輸的速度,同時加快所述伺服器22在所述標籤庫中查找匹配數字標籤的速度,從而提高整個音頻檔案的旋律識別系統的工作效率;另外,因為數字標籤的數據量較小,所以所述伺服器22保存的所述標籤庫中可以儲存更多的數字標籤,增強所述音頻檔案的旋律識別系統對音頻檔案的識別能力。
榮譽表彰
2017年12月11日,《一種音頻檔案的旋律提取方法及旋律識別系統》獲得第十九屆中國專利優秀獎。