Anàlisi acústic de la veu. (2014)

Ejercicio Catalán
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Logopedia - 1º curso
Asignatura Física acústica
Profesor D.
Año del apunte 2014
Páginas 6
Fecha de subida 23/03/2015
Descargas 9

Descripción

Anàlisi acústica de la veu d'un "pacient" en concret. Valoració de freq. fonamental, atac vocal, jitter, shimmer, VHR, etc., mordent, rogall i buf, entre d'altres coses.

Vista previa del texto

ÀNALISI ACÚSTICO-PERCEPTIU: Pacient: Alba Perona Navarro Edat: 20 anys Data: 21/03/15 Freqüència fonamental: A partir de l’enregistrament 1358802_100315_11_lp, el qual pertany a la lectura en veu parlada espontània, determinarem la freqüència fonamental de la mostra de veu. El motiu pel qual escollim una nota de veu de lectura i no de la producció d’una /a/ és que, en aquest últim cas, solem emetre-les a un to més elevat i, per tant no ens resultaria representatiu.
La seva freqüència fonamental és de 240 Hz (aprox.).
Atac vocal: Per tal de determinar el tipus d’atac vocal (dur o suau), ens fixem en l’enregistrament anterior i també en el següent: 1358802_100315_04_ap, que pertany a una /a/ en veu parlada.
També hem calculat la freqüència fonamental de la producció d’aquesta vocal i observem, que al contrari del que pensàvem aquesta és més baixa. Correspon aproximadament a uns 230 Hz.
Si observem les dues gravacions arribem a la conclusió que no es tracta d’un atac vocal dur, ja que en l’inici de la fonació no percebem cap barra d’explosió en l’espectrograma, per tant el considerem suau.
1358802_100315_11_lp 1358802_100315_04_ap Anàlisi dels paràmetres acústics: A partir de l’enregistrament de la /a/ anterior, i extraient-ne un segon central d’aquest (aproximadament), en canviem el nom i a partir d’aquí treballem amb el fitxer: 1358802_210315_avoice.
En seleccionem el segon i dins de l’opció “Pulses” seleccionem “Show pulses” i obtenim els valors següents: - Fraction of locally unvoiced frames: es tracta de la fracció de períodes dins del segment analitzat on hi ha manca de fonació = (0/96) = 0 Number of Voice breaks: el nombre de trencaments que s’han produït en la fonació durant el segon analitzat = 0 Degree of Voice breaks: el percentatge del temps amb trencament de la fonació = 0% Si els tres paràmetres anteriors expressen un valor diferent a 0, considerem que té disfonia, per tant, com més elevat és el nombre major grau de disfonia presenta el pacient. En aquest cas, com que tots els nombres ens donen 0, ens trobem davant d’una absència de disfonia.
- Jitter (local%): és la tremolar en la freqüència fonamental entre oscil·lacions consecutives = 0.219%.
En una veu sana, aquest nombre ha de ser com a màxim de l’1%, per tant en aquest cas no considerem el resultat com a “patològic”.
- Shimmer (local%): es tracta de la titil·lació de la intensitat entre oscil·lacions consecutives = 2.047%.
En una veu sana, aquest nombre ha de ser com a màxim del 3.8%, per tant en aquest cas no considerem el resultat com a “patològic”.
- NHR (dB): és la relació harmònic/soroll = 21.84 dB.
Considerem que en el cas d’una veu sana el quocient ha de ser igual o superior a 20 dB. En la presència de rogall el valor sol ser anormal i afecta més a aquest valor. En canvi en el cas del buf (sense rogall), es solen donar valors propers a la normalitat.
*En aquest anàlisis acústic, en el cas del Jitter i, comparant el nombre de la veu analitzada amb la d’altres patològiques, podem observar que el nombre obtingut (0.219%), té una petit tendència a acostar-se a rogall tipus aspror (d’un valor aproximat de 0.370% en el cas d’una veu patològica) i a al buf (d’un valor aproximat de 0.319% en el cas d’una veu patològica). En tot cas no podem donar-ho per fet ja que ho hem d’analitzar profundament, i els altres valors tampoc s’aproximen a un nombre que ens pugui fer preocupar.
Resultats obtinguts a través de l’opció “Show pulses”: Time range of SELECTION Jitter: From 0.000099 to 0.998480 seconds (duration: 0.998380 seconds) Jitter (local): 0.219% Pitch: Jitter (rap): 0.119% Jitter (local, absolute): 9.719E-6 seconds Median pitch: 224.914 Hz Jitter (ppq5): 0.136% Mean pitch: 225.113 Hz Jitter (ddp): 0.358% Standard deviation: 1.619 Hz Shimmer: Minimum pitch: 222.498 Hz Shimmer (local): 2.047% Maximum pitch: 228.713 Hz Shimmer (local, dB): 0.177 dB Pulses: Shimmer (apq3): 1.101% Number of pulses: 218 Shimmer (apq5): 1.282% Number of periods: 217 Shimmer (apq11): 1.785% Mean period: 4.442228E-3 seconds Shimmer (dda): 3.303% Standard deviation of period: 0.032879E-3 seconds Voicing: Harmonicity of the voiced parts only: Mean autocorrelation: 0.993065 Fraction of locally unvoiced frames: 0 (0 / 96) Mean noise-to-harmonics ratio: 0.006990 Number of voice breaks: 0 Mean harmonics-to-noise ratio: 21.842 dB Degree of voice breaks: 0 (0 seconds / 0.998380 seconds) AVALUACIÓ TÍMBRICA DE LA VEU: El mordent: Seguim treballant amb el tall d’un segon de la /a/, però ara en comptes de treballar amb l’oscil·lograma, com hem fet fins ara, generem l’espectre de freqüències. En aquest cas ens fixarem en els formants F3, F4 i F5, que són els que corresponen al mordent.
F1 Espectre de freqüències F2 F3 F4 F5 Per poder comparar l’espectre corresponent a la veu que estem analitzant, hem recuperat espectres que corresponen als diferents tipus de mordent: Veu sense mordent Mordent estrident Mordent compacte Considerem que la veu analitzada té un mordent compacte ja que percebem certa ressonància en els formants F3, F4, i F5, els quals es troben en freqüències molt pròximes a 4000 Hz. Tot i així el cinquè formant es troba a uns 4500 Hz (no se si considerar-ho lluny dels 4000 Hz), per tant i com a molt, podríem dir que (potser) té falta de mordent en el formant 5, però acústicament no ens preocupa ja que no presenta el perfil d’una veu sense mordent.
Per altre banda, el fet de no tenir mordent no és patològic, però sempre hi ha un marge de millora i una possibilitat d’educació d’aquest.
El buf: Per determinar si hi ha presència d’aquest primer escoltem la /a/ sencera i després l’escoltem entre les freqüències de 0 i 5000Hz.
D’aquesta manera, hem arribat a percebre un petit canvi, ja que hem aïllat la zona on es troba el buf, que és a parir de 5000 Hz. Per altre banda si observem l’espectre de freqüències veiem que a partir d’aquesta freqüència hi ha una presència de soroll.
5022.16 Hz Observat l’espectre de freqüències arribem a la conclusió que és una veu amb una mica de buf (grau 1 de GRBAS), per tant, presenta una fuita indeguda d’aire expirat durant la fonació per incompetència glotal.
El rogall: Podem trobar-nos amb dos tipus de rogall, que són el rogall amb aspror i el rogall amb ronquera, que en l’espectre produeixen una destrucció d’hermonicitat. En el cas de la primera es forma principalment en la regió del mordent, per tant en F3, F4, F5 i, per altre banda; en el cas del segon tipus de rogall es destrueixen en la regió 1 que correspon a F1 i F2.
Si observem l’espectre percebem que això no es produeix i per tant, no hi ha presència de rogall en la seva veu.
*Per tal de comparar el fitxer amb el qual hem treballat, hem utilitzat l’enregistrament: 1358802_100315_apr, que correspon a una /a/ projectada. I també n’hem creat l’espectre de freqüències. Amb aquesta hem analitzat el mordent, el buf i el rogall, i podem observar que s’obtenen les mateixes hipòtesis. També hem analitzat els paràmetres acústics (Jitter, Shimmer..) i ens surten uns valors molt iguals que en l’anàlisi de la /a/ no projectada.
...

Tags: