Analiza Cepstralna
Wprowadzenie |
Uwagi |
Zastosowania |
Przykłady
Wprowadzenie
Definicje cepstrum widma mocy:
a) pierwsza definicja:
przy czym SAA(f) reprezentuje dwuwstęgowe widmo mocy sygnału f(t), czyli:
b) druga definicja (nowsza):
W implementacji, dwuwstęgowe widmo może być zastąpione widmem jednowstęgowym SA(f), obliczonym w wyniku następującego przekształcenia:
c) postać zespolona cepstrum:
gdzie X(f) jest widmem zespolonym.
Powrót
Uwagi
Występującego w powyższych równaniach symbolu dziedziny czasu związanego ze współczynnikami cepstralnymi nie należy utożsamiać z czasem bezwzględnym. Jest to specyficzna dziedzina odpowiadająca odwrotności częstotliwości, stąd nazwa cepstrum:
Powrót
Zastosowania
Metody wyznaczania i wygładzania cepstrum zostały wykorzystane w Katedrze Inżynierii Dźwięku i Obrazu Politechniki Gdańskiej do analizy sygnału wadliwej wymowy (m.in. program KASM).
W przypadku analizy sygnału mowy, analiza cepstralna jest szczególnie przydatna w procesie detekcji tonu krtaniowego w sygnałach reprezentujących głoski dźwięczne.
Cepstrum zespolone pobudzenia (tonu krtaniowego) zawiera impulsy występujące w odstępach odpowiadających okresowi tonu krtaniowego. Cepstrum zespolone odpowiedzi impulsowej kanału głosowego jest natomiast skupione wokół wartości współczynników cepstralnych bliskich zeru. Ponieważ cepstra zespolone tonu krtaniowego oraz odpowiedzi impulsowej kanału głosowego zajmują różne obszary na osi odciętych, istnieje możliwość rozplotu obu sygnałów. Dokonuje się tego za pomocą układu liniowego, poprzez okienkowanie reprezentacji cepstralnej.
Niskie współczynniki cepstralne są związane z ogólnym charakterem widma i służą do realizacji widma wygładzonego, obrazującego istnienie formantów, a także umożliwiającego estymację wartości ich poziomów i częstotliwości. Wyższe współczynniki cepstralne mogą wskazywać na cechę dźwięczności. Objawia się to przez wyraźne maksimum na wykresie cepstrum. W istocie rzeczy jest to efekt okresowości widma, lecz z uwagi na charakter tonu krtaniowego, zawierającego szereg składowych harmonicznych, maksimum to może być użyte jako wskaźnik dźwięczności.
Powrót
Przykłady
Przykłady analiz cepstralnych wykonanych z wykorzystaniem programu KASM.
Detekcja tonu krtaniowego dla głoski ‘a’
z wykorzystaniem
analizy cepstralnej (okno programu KASM).
Widmo głoski ‘a’ wygładzone cepstralnie
– detekcja formantów
(okno programu KASM).
Powrót