Analiza Widmowa
Wprowadzenie |
Parametry Widmowe |
Sonogram
Wprowadzenie
Analiza widmowa sygnału mowy umożliwia reprezentację fragmentu sygnału w dziedzinie częstotliwości. W programie KASM, w celu uzyskania widma sygnału, wykorzystuje się algorytm FFT (ang. Fast Fourier Transform). Wygładzone widmo sygnału pozwala na detekcję i lokalizację formantów głoski.
Widmo głoski 'a' w stanie ustalonym (okno programu KASM)
Powrót
Parametry Widmowe
W analizie widmowej w programie KASM możliwe do uzyskania są wartości następujących parametrów:
- moment widmowy rzędu zerowego
- unormowany moment widmowy rzędu pierwszego
- centralny unormowany moment widmowy rzędu drugiego
- centralny unormowany moment widmowy rzędu trzeciego
- centralny unormowany moment widmowy rzędu czwartego
- spectral flatness measure
Powrót
Sonogram
Typowa analiza widmowa daje obraz sygnału w dziedzinie częstotliwości dla pewnego określonego fragmentu sygnału. Z punktu widzenia analizy sygnału mowy, szczególnie cenne jest uzyskanie informacji o ewolucji widma sygnału w czasie. Możliwość taką daje m.in. dostępna w programie KASM analiza sonograficzna. Przykład sonogramu wyrazu 'dziewięć' przedstawiony został na poniższym rysunku.
Oś x sonogramu reprezentuje czas, natomiast oś y reprezentuje częstotliwość. Amplitudy poszczególnych składowych widma przedstawione są na sonogramie w postaci kolorów zależnych od poziomu danej składowej widma.
Powrót