1. Introducción
La espirantización de las oclusivas sonoras /b, d, ɡ/ es un fenómeno fonológico muy común en castellano. Se caracteriza por hacer que las oclusivas sonoras pierdan su oclusión y ocurran como aproximantes: [β, ð, ɣ] (Hualde 2005; Martínez Celdrán 1984, 1991, 2006; Quilis 1981; Romero Gallego 1995). La espirantización en castellano puede ocurrir en ambientes intervocálicos, así como también en posición de coda silábica al interior de palabra. Sin embargo, mientras las variedades de castellano difieren en qué contextos de coda permiten que se dé la espirantización, el contexto intervocálico, tanto dentro de las palabras como en la frontera entre palabras, es por excelencia el lugar donde siempre ocurre. Podemos ver algunos ejemplos de espirantización intervocálica en los datos en (1).
a. /labo/ → [laβo] ‘lavo’
b. /la bota/ → [la͜ βota] ‘la bota’
c. /lado/ → [laðo] ‘lado’
d. /la dona/ → [la͜ ðona] ‘la dona’
e. /laɡo/ → [laɣo] ‘lago’
f. /la ɡota/ → [la͜ ɣota] ‘la gota’
El presente estudio examina la espirantización de /b, d, ɡ/ en el ambiente intervocálico en el castellano hablado en la ciudad de Lima (Perú). En particular, se investiga la influencia que tienen el acento y la sílaba inicial dentro de la palabra. Las sílabas acentuadas y aquellas que ocurren en posición inicial de palabra ocupan posiciones prominentes dentro de la estructura prosódica (Alderete 1999; Beckman 1995, 1997, 1998; de Lacy 2006; Gonzalez 2003; Zoll 1998, 2004)1. Las sílabas que ocupan posiciones de prominencia pueden mostrar comportamientos fonéticos y fonológicos diferentes a aquellas sílabas que no son privilegiadas prosódicamente. Esto se debe a que las posiciones de privilegio poseen ventajas perceptuales. Por ejemplo, las sílabas iniciales de morfema son psicolingüísticamente prominentes, ya que juegan un papel importante en el acceso y reconocimiento de los ítems léxicos (Beckman 1997, 1998; Hayes y Steriade 2004; Steriade 1995). Las sílabas acentuadas tienen prominencia fonética, la cual se realiza por medio de una mayor duración, una amplitud de onda más alta; también pueden atraer y albergar acentos tonales y tonos (de Lacy 1997, 1999; Hayes y Steriade 2004; Kirchner 1996). Las posiciones prominentes en la estructura prosódica pueden también atraer tonos que no se permiten en otras posiciones, pueden conservar contrastes fonológicos que se neutralizan en otros ambientes. De relevancia para este estudio es que las posiciones prominentes en la estructura prosódica también pueden bloquear o aminorar los efectos de los fenómenos de debilitamiento, como es el caso de la espirantización. Estos efectos aún no han sido investigados en el castellano de Lima. La combinación de acento y sílaba inicial de palabra dan cuatro posibles contextos, los cuales se listan en (2). Obsérvese que mientras los tres primeros contextos poseen algún tipo de privilegio prosódico en virtud de ser acentuados, de ser parte de la sílaba inicial de la palabra o de ambas propiedades, el último contexto, el de las sílabas medias inacentuadas, está totalmente desprotegido, sin ningún tipo de prominencia que lo resguarde de procesos de debilitamiento.
a. Sílaba inicial acentuada
b. Sílaba no inicial acentuada2
c. Sílaba inicial inacentuada
d. Sílaba no inicial inacentuada
A fin de poder examinar los efectos del acento y de la sílaba inicial de palabra en las realizaciones de las oclusivas sonoras, se conduce dos tipos de análisis. En el primero, se ve si los factores prosódicos bajo estudio pueden inhibir el proceso de espirantización. Para ello, se ve si la interacción del acento y la sílaba inicial de palabra influye en qué tan frecuentemente ocurren los alófonos oclusivos y aproximantes de las oclusivas sonoras /b, d, ɡ/. En seguida, se pasa a investigar si la interacción de dichos factores prosódicos tiene algún efecto en las realizaciones de los alófonos aproximantes [β, ð, ɣ]. Para poder llevar a cabo esta segunda etapa del estudio, se aplica un tipo de medición acústica conocida como proporción de intensidad (intensity ratio), la cual se ha probado que es bastante eficaz en correlacionarse con el grado de constricción articulatoria que muestra la producción de una consonante (Parrell 2010). Cuanto más alto el valor de la proporción de intensidad, la consonante oclusiva sonora se realiza más débil, con una constricción muy tenue en la cavidad oral. Por el contrario, cuanto más bajo sea el valor de la proporción de intensidad, la consonante oclusiva sonora se realiza con una mayor constricción en la cavidad oral.
El artículo está organizado del siguiente modo. En la sección 2 se presenta la información concerniente al recojo de datos y a los participantes que se entrevistaron. La sección 3 presenta evidencia de cómo la interacción del acento y la sílaba inicial de palabra puede inhibir, en cierta medida, la espirantización de las oclusivas sonoras. En la sección 4 se presentan los resultados del análisis de mediciones de la proporción de intensidad y se muestra que las oclusivas sonoras que ocurren dentro de sílabas acentuadas se realizan con una mayor constricción que aquellas que aparecen en sílabas inacentuadas. En la sección 5 se discuten los resultados y se les compara con estudios anteriores de la espirantización de oclusivas sonoras en otras variedades de castellano. La sección 6 presenta las conclusiones del estudio. Por último, la sección 7 es un apéndice que contiene los resultados de los análisis estadísticos.
2. Información sobre los participantes, la recolección de datos y el diseño del proyecto
Los datos de este estudio se recolectaron originalmente para un estudio sobre los patrones de entonación del castellano peruano entre los años 2012 y 2013. A los participantes se les pidió que realizaran una tarea de “narrativa ensayada” en la cual ellos primero leían un número pequeño de historias cortas e indicaban si tenían alguna duda o pregunta sobre ellas. Una vez que los participantes determinaron que habían entendido las historias y que no tenían ninguna pregunta sobre las palabras o frases en ellas, se les pidió que leyeran cada historia como si las hubiesen presenciado y se las estuvieran contando a un amigo. Todos los participantes, al igual que sus padres, eran hablantes monolingües de castellano peruano de la variedad hablada en la ciudad de Lima. Todos ellos, así también como sus padres, nacieron, crecieron y fueron a la escuela en Lima. Se entrevistó un total de 21 hablantes (11 mujeres y 10 hombres). En el momento de la entrevista, todos eran estudiantes universitarios a inicios de sus veinte.
Se recolectó 120 ejemplares de oclusivas sonoras intervocálicas por cada hablante (40 por cada uno de los tres tipos de oclusivas sonoras /b, d, ɡ/). Todas pertenecían a raíces o bases léxicas de sustantivos, adjetivos y verbos. Se tomó en cuenta si las oclusivas sonoras ocurrían en posición de sílaba inicial de palabra (por ejemplo, la b otella, la v íbora), o en posición de sílaba media o no inicial de palabra (re g alo, ami g o) y si estaban situadas en una sílaba acentuada (lle g amos, dijo que D ébora...) o no (esa g allina, mone d a). La Tabla 1 presenta el número de muestras que se recolectó en los cuatro contextos prosódicos en que se analizaron las oclusivas sonoras.
Los estudios de Carrasco, Hualde y Simonet (2012); Cole, Hualde y Iskarous (1999); Ortega-Llebaria (2004); y Simonet, Hualde y Nadeu (2012) han determinado, para diferentes variedades del castellano, que la altura de la vocal que precede a una oclusiva sonora puede influenciar el grado de constricción que esta muestra al realizarse como un alófono espirantizado. Ya que el principal objetivo de este estudio es examinar el rol que tiene la interacción del acento y la sílaba inicial de palabra en la realización de las oclusivas sonoras, se controló cualquier efecto que pudiera tener la altura de las vocales adyacentes a las oclusivas sonoras seleccionando contextos en que las oclusivas sonoras ocurrían entre vocales medias o bajas. Así, se evitó tanto como se pudo oclusivas sonoras que ocurriesen precedidas por una vocal alta. Sin embargo, ya que los datos utilizados para este estudio fueron originalmente recolectados para un estudio de entonación, no siempre se pudo encontrar suficientes contextos intervocálicos rodeados de vocales medias y bajas por cada contexto prosódico. Esto ocurrió, por ejemplo, en uno de los casos en que /b/ aparece en una sílaba no inicial inacentuada: /ˈbibora/ ‘víbora’. Afortunadamente, el número de veces en que se tuvo que seleccionar una oclusiva sonora precedida por una vocal alta es mínimo: solo en 5 de las 120 muestras tomadas por cada hablante. Se recolectó un total de 2520 muestras de oclusivas sonoras intervocálicas de los 21 hablantes entrevistados, 630 por cada uno de los contextos prosódicos.
Las grabaciones se llevaron a cabo en ambientes de la Facultad de Letras de la Universidad Nacional Mayor de San Marcos que eran particularmente silenciosos. Se les pidió a los participantes usar un micrófono Shure WH30XLR, el cual estaba conectado a una grabadora digital Zoom H4n. Los archivos de audio se grabaron en formato PCM WAV de 16 bit con una frecuencia de muestreo de 44.1 KHz. Una vez terminado el recojo de datos, se procedió a transcribir los audios usando el programa de análisis acústico Praat (Boersma y Weenink 2020). Las transcripciones de las oclusivas sonoras se hicieron mediante la inspección visual de los espectrogramas. Si la oclusiva sonora se realizaba con una barra de voz, una fase de cerrazón y una explosión, entonces se le transcribía como [b], [d] o [ɡ], según fuese apropiado. Si no se observaba esas marcas acústicas en el espectrograma y, en vez de ello, se notaba la presencia de formantes, entonces se le transcribía como una aproximante [β], [ð], o [ɣ].
Con respecto a las mediciones de proporción de intensidad, en la Figura 1, vemos la realización de la secuencia /abe/ que fue extraída de la frase /loɾena bebe/ ‘Lorena bebe…’. La /b/ inicial de la palabra ‘bebe’ se ha realizado como una aproximante [β]. El panel encima del espectrograma muestra el contorno de intensidad de la secuencia. En él, podemos observar una caída de la intensidad la cual indica el momento de la articulación de la consonante. Parrell (2010) evalúa una serie de mediciones de intensidad que han sido propuestas en la literatura para medir el grado de constricción que muestra una consonante en su realización (ver también Cole, Hualde y Iskarous 1999; Hualde, Simonet, Shosted y Nadeu 2010; Kingston 2008; Martínez Celdrán y Regueira 2008; Ortega-Llebaria 2004; Romero, Parrell y Riera 2007; Soler y Romero 1999). Parrell muestra que la proporción de intensidad ofrece la medida más precisa que se correlaciona con el grado de constricción articulatoria involucrada en la producción de una consonante (contrástese con Figueroa Candia y Evans 2015). La proporción de intensidad se calcula dividiendo la intensidad mínima de la consonante entre la intensidad máxima de la siguiente vocal (Colantoni y Marinescu 2010; Hualde, Simonet y Nadeu 2011). De este modo, por ejemplo, en la Figura 1, la intensidad mínima durante la articulación de [β] es 63 dB y la intensidad máxima durante la articulación de [e] es 65 dB. Por lo tanto, la proporción de intensidad es 0.97. Cuanto más se acerque la proporción de intensidad a 1, el grado de constricción de la consonante se aproxima más al de una vocal. Por el contrario, un valor bajo de la proporción de intensidad indica que la consonante oclusiva sonora se ha realizado menos espirantizada. Las medidas de proporción de intensidad han sido utilizadas en varios estudios de espirantización del castellano (véase, por ejemplo, Carrasco 2008; Colantoni y Marinescu 2010; Cole, Hualde y Iskarous 1999; Eddington 2009; Hualde, Simonet y Nadeu 2011; Lavoie 2001; O’Rourke y Fafulas 2015; Ortega-Llebaria 2004; Soler y Romero 1999).
3. La interacción del acento y las sílabas iniciales de palabra y su tendencia a inhibir la espirantización
Como se indicó al inicio, el primer tipo de análisis que se ofrece es el de la frecuencia de ocurrencia de los alófonos oclusivos y aproximantes de las oclusivas sonoras /b, d, ɡ/. El objetivo de este análisis es ver si la interacción del acento y la sílaba inicial de palabra tiene alguna capacidad de inhibir la espirantización de las oclusivas sonoras en el castellano de Lima. Los resultados obtenidos muestran que las oclusivas sonoras intervocálicas /b, d, ɡ/ normalmente se realizan como aproximantes en el castellano de Lima. Sin embargo, se observa un cierto grado de inhibición de la espirantización cuando la sílaba que alberga la oclusiva sonora ocupa una posición acentuada e inicial de palabra. Cuando esto sucede, las oclusivas sonoras intervocálicas se realizan como oclusivas en vez de aproximantes. En este contexto se advierte que la espirantización se inhibe hasta en un 25% de los casos. Por otro lado, este efecto no afecta por igual a todas las oclusivas sonoras. El efecto de la interacción del acento y de la sílaba inicial de palabra como inhibidor de la espirantización solo ocurre en las oclusivas sonoras /b/ y /d/, pero no en /ɡ/. Este comportamiento se puede apreciar en los gráficos de barras de la Figura 2 y de la Figura 3 para /b/ y /d/, respectivamente. En todos los gráficos de barras, las oscuras representan las realizaciones oclusivas, mientras que las barras blancas, las realizaciones aproximantes.
En contraste, la oclusiva sonora /ɡ/ se espirantiza uniformemente en alrededor del 95% de las veces en todos los contextos prosódicos examinados en este estudio. Este comportamiento se muestra en el gráfico de barras de la Figura 4.
El análisis estadístico3, el cual consistió en llevar a cabo análisis de modelos de regresión logística de efectos mixtos, así como también estadísticas descriptivas de la frecuencia de ocurrencia de los alófonos oclusivos [b, d, ɡ] y aproximantes [β, ð, ɣ], respalda lo que los gráficos de barra muestran: hay una diferencia entre el comportamiento de la espirantización de /b, d/ y el de /ɡ/. Mientras el efecto de la interacción entre el acento y la sílaba inicial de palabra es altamente significativo en la inhibición de la espirantización en /b, d/, ese mismo efecto no se encuentra en /ɡ/. La oclusiva /ɡ/ se espirantiza sin importar si ocurre en una sílaba acentuada, o en posición inicial de palabra. El análisis estadístico también muestra que los chances de inhibir la espirantización de /b, d/ aumentan solo cuando ambos factores confluyen en la misma sílaba; es decir, cuando la sílaba que alberga a dichas oclusivas sonoras es acentuada e inicial de palabra.
¿Podría ser que la resistencia a espirantizar /b, d/ en sílabas acentuadas iniciales de palabra fuera solo el reflejo de unos pocos hablantes, los cuales estarían ejerciendo una influencia desproporcionada en los resultados? Los siguientes gráficos en la Figura 5 y la Figura 6 indican que ese no es el caso. La Figura 5 contiene un gráfico de burbujas que exhibe el comportamiento de los 21 hablantes nativos de castellano limeño que participaron en el estudio. Cada hablante aparece etiquetado con un código de tres letras. El gráfico muestra cuánto espirantiza /b, d/ cada hablante por contexto prosódico. De este modo, por ejemplo, si la burbuja de un participante en la Figura 5 se encuentra en el 80%, esto significa que de las 20 muestras de la oclusivas sonoras /b, d/ que corresponden a ese hablante (recuérdese que se recolectó 10 muestras de cada oclusiva sonora por cada participante en cada contexto), 16 se realizaron como aproximantes [β, ð]. Las burbujas presentan un mayor tamaño de acuerdo con cuántos hablantes coincidieron en tener el mismo porcentaje de espirantización. Observamos, entonces, que la mayoría de los participantes del estudio mostró una mayor resistencia a espirantizar las oclusivas sonoras /b, d/ en sílabas acentuadas iniciales de palabra. Las espirantizaron en menos de 80% de los casos. En contraste, en otras posiciones, la mayoría de los participantes espirantizó /b, d/ en más de un 80% de los casos. De hecho, como lo señala el gráfico de la Figura 5, la mayoría de los participantes espirantizó /b, d/ cerca al 100% de los casos en sílabas que no eran acentuadas iniciales de palabra.
La Figura 6 muestra el mismo tipo de gráfico de burbujas, pero esta vez para la oclusiva sonora /ɡ/. De modo similar a lo observado para /b, d/, también vemos que los 21 hablantes entrevistados tienden a espirantizar /ɡ/ entre 80% y 100% de los casos. Sin embargo, en contraste con /b, d/, esta vez no se observa ninguna resistencia a espirantizar /ɡ/ en sílabas acentuadas iniciales de palabra. De este modo, la espirantización de /ɡ/ se produce por igual sin importar el contexto prosódico donde ocurra.
La Figura 7 ilustra la realización típica de las consonantes oclusivas sonoras /b/, /d/, y /ɡ/ como aproximantes en el castellano de Lima. En las transcripciones, las sílabas acentuadas aparecen en itálicas y la realización aproximante de las consonantes oclusivas en discusión se presentan en negritas. La figura contiene el espectrograma de la frase /la bodeɡa/ ‘la bodega’ realizada como [la͜ βo.ˈðe.ɣa]. Sabemos que /b, d, ɡ/ se han realizado como aproximantes porque durante sus articulaciones se observa la presencia de formantes. Como es típico en el castellano de Lima, y muchas otras variedades de castellano en general, el debilitamiento de las oclusivas sonoras por medio de la espirantización no produce ningún tipo de fricción.
La Figura 8 presenta una sílaba acentuada inicial de palabra en la cual se puede observar la inhibición de la espirantización en una oclusiva sonora intervocálica. Se trata de la consonante oclusiva /d/ en la palabra /deboɾa/ ‘Débora’. Esta ocurre como una consonante oclusiva y no como una aproximante. El espectrograma fue extraído de la frase “cuando Débora llegó a la casa de la tía Margarita, le contó todo lo que había hecho en el día”.
4. Mediciones de proporción de intensidad: el acento y la aminoración de los efectos de la espirantización
Ahora veamos el análisis de las mediciones de proporción de intensidad. Este tipo de análisis se realiza para poder determinar el grado de constricción que muestra una consonante durante su producción. Así, por ejemplo, cuando una oclusiva sonora se realiza como oclusiva, su grado de obstrucción en la cavidad oral es mucho mayor a cuando se realiza como una aproximante. Esto puede confirmarse en la Tabla 2, donde se muestra las medidas de proporción de intensidad de las oclusivas sonoras realizadas como oclusivas y como aproximantes sin tener en cuenta el contexto prosódico en el que aparecen. Cuando se realizan como oclusivas, la proporción de intensidad que muestran en promedio es de alrededor de 0.77. Cuando se realizan como aproximantes, esta sube hasta alrededor de 0.93.
Las mediciones de proporción de intensidad también pueden utilizarse para saber si hay diferencias en el grado de constricción que muestran las oclusivas sonoras cuando se realizan como aproximantes. De este modo, por ejemplo, se puede investigar si la implementación articulatoria del alófono espirantizado [β] en una sílaba acentuada (como, por ejemplo, en la palabra [ka.ˈβe.sa] ‘cabeza’) es diferente en su grado de constricción con respecto a la articulación de ese mismo alófono en una sílaba inacentuada (como, por ejemplo, en la palabra [ˈsa.βa.ðo] ‘sábado’). Los resultados de este análisis para las oclusivas sonoras del castellano de Lima se muestran gráficamente a través de los diagramas de caja que aparecen en la Figura 9 para [β], la Figura 10 para [ð] y la Figura 11 para [ɣ]. Cada caja indica dónde se encuentra el 50% de los datos entre el primer cuartil y el tercer cuartil. La línea horizontal en el medio de cada caja indica dónde está ubicada la mediana de las mediciones, la cual en los datos examinados se encuentra muy cercana al promedio. Los bigotes que salen de cada caja muestran la distribución de los datos más allá del primer y tercer cuartil, excluyendo cualquier dato de valor atípico. Los valores atípicos aparecen como círculos negros que se encuentran más allá de los bigotes de las cajas. Para interpretar los diagramas de caja correctamente, recuérdese que, por cada contexto prosódico, se recolectaron 210 muestras de cada oclusiva sonora. Los diagramas de caja solo muestran el comportamiento de la proporción de intensidad en aquellas muestras que se realizaron como aproximantes (véase también el gráfico de barras de la Figura 2 para obtener una idea de cuántas muestras, las barras blancas, están representadas en los diagramas de caja).
Los diagramas de caja nos presentan una vez más con una asimetría entre la realización de las oclusivas sonoras no velares, por un lado, y la de la velar, por el otro. En el caso de los alófonos espirantizados [β, ð] (ver Figura 9 y Figura 10), la proporción de intensidad distingue entre sílabas acentuadas e inacentuadas. Las primeras muestran una proporción de intensidad alrededor de 0.91 mientras las sílabas inacentuadas manifiestan una proporción de intensidad más alta que fluctúa alrededor de 0.95. Esto quiere decir que las realizaciones aproximantes [β, ð] se realizan con una menor constricción en la cavidad oral cuando ocurren en sílabas inacentuadas mientras que dicha constricción se incrementa cuando ocurren en sílabas acentuadas. En contraste, el comportamiento de la proporción de intensidad para las realizaciones espirantizadas de la oclusiva sonora /g/ (ver Figura 11) no muestra ninguna diferencia entre los ambientes prosódicos. La mediana de la proporción de intensidad en [ɣ] se encuentra en 0.94 en todos los contextos prosódicos examinados. El análisis estadístico4, el cual consistió en llevar a cabo análisis de modelos de regresión lineal de efectos mixtos, así como también las estadísticas descriptivas del comportamiento de la proporción de intensidad en las aproximantes [β, ð, ɣ], también apoya esta interpretación. La distancia entre la proporción de intensidad en [β, ð] cuando estas ocurren en sílabas acentuadas y cuando ocurren en sílabas inacentuadas es estadísticamente significativa. No se encontró ninguna diferencia estadística en el caso de [ɣ].
5. Discusión de los resultados
El presente estudio analizó el fenómeno de espirantización de las oclusivas sonoras, /b, d, ɡ/, en el castellano de Lima (Perú). El estudio buscaba conocer el efecto que tiene en la espirantización el que la sílaba que alberga a la consonante oclusiva sonora sea acentuada o no, o el que la sílaba sea inicial de palabra o no. Dos generalizaciones se desprenden de los resultados encontrados en este estudio.
Mientras que las sílabas acentuadas de inicio de palabra muestran una tendencia modesta pero estadísticamente significativa a inhibir la espirantización de las oclusivas /b/ y /d/ en un 25% de los casos, la oclusiva /ɡ/ se espirantiza por igual en todos los contextos sin importar si ocurre en sílabas acentuadas o inacentuadas, o en sílabas de inicio de palabra. La influencia de las sílabas acentuadas de inicio de palabra en la inhibición de la espirantización de oclusivas sonoras /b, d/ es un descubrimiento que no se ha reportado en otras variedades del castellano.
Las realizaciones de /b/ y /d/ como aproximantes, [β] y [ð], muestran un grado mayor de constricción en su articulación cuando pertenecen a una sílaba acentuada. En este caso, la posición inicial de palabra no muestra ningún efecto estadísticamente significativo. Por su parte, las realizaciones de /ɡ/ como aproximante, [ɣ], se realizan con el mismo grado de constricción sin importar el contexto prosódico en que ocurren.
Los resultados de la investigación confirman los resultados de estudios similares en otras variedades de castellano, pero también presentan una novedad. Como se esperaba, los resultados muestran que la espirantización de las oclusivas sonoras es un fenómeno prevalente en el castellano de Lima. También se encontró que el acento es un factor que influye en que los alófonos espirantizados tengan un mayor grado de constricción en su articulación, lo cual confirma los resultados conseguidos en los estudios de Carrasco, Hualde y Simonet (2012); Cole, Hualde y Iskarous (1999); Eddington (2011); Henriksen, Fafulas y O’Rourke (2020); O’Rourke y Fafulas (2015); Ortega-Llebaria (2004); Rao (2015); entre otros5. Asimismo, el presente estudio confirma el hallazgo de Eddington (2011) que indica que las oclusivas sonoras pueden ser afectadas de modo diferente por la espirantización y el acento dependiendo de su punto de articulación. De este modo, se encontró una asimetría en los patrones de espirantización de las consonantes oclusivas sonoras no velares, /b/ y /d/, y los de la oclusiva sonora velar, /ɡ/. Las oclusivas sonoras no velares son más propensas a ser afectadas por factores prosódicos mientras que la oclusiva sonora velar no.
Sin embargo, a diferencia de otros estudios, se encontró que, en el castellano de Lima, las sílabas que son acentuadas e iniciales de palabra muestran una tendencia estadísticamente significativa no solo a lograr que los alófonos espirantizados de las oclusivas sonoras tengan un mayor grado de constricción, sino también a bloquear la espirantización en las oclusivas sonoras. Este fenómeno abre una serie de interrogantes con respecto a cómo es posible que la estructura prosódica pueda inhibir la espirantización si la fonología de este proceso no hace referencia al acento o a las sílabas iniciales de palabra. ¿Por qué la inhibición de las oclusivas sonoras en sílabas acentuadas iniciales se da solo como una tendencia estadística y no como un fenómeno categórico? ¿Y por qué la inhibición de la espirantización no afecta a la oclusiva sonora velar? En los siguientes párrafos intento dar respuestas a estas preguntas.
¿Por qué hay una asimetría en el comportamiento de las oclusivas sonoras /b, d/ en comparación a /ɡ/ con respecto a la inhibición de la espirantización en el castellano de Lima? Siguiendo los trabajos de Ohala (1983, 1997); y Ohala y Riordan (1979) (también véase Jesus y Costa 2020, Keating 1984, Stathopoulos y Weismer 1983, Westbury 1983, Westbury y Keating 1986), la explicación a la asimetría entre /b, d/ versus /ɡ/ se encuentra en los principios aerodinámicos que gobiernan la voz en las consonantes oclusivas sonoras. Para conseguir que las cuerdas vocales vibren en segmentos sonantes, el aire debe fluir sin interrupción de los pulmones a través de la laringe y luego hacia fuera de la boca sin encontrar ningún obstáculo significativo en la cavidad oral. Es también necesario que las cuerdas vocales se encuentren en una posición aducida, la cual hace que se incremente la presión subglótica. Es la diferencia entre la presión subglótica y supraglótica lo que hace que las cuerdas vocales vibren espontáneamente.
En el caso de las oclusivas sonoras, el aire no puede fluir ininterrumpidamente, ya que hay una obstrucción substancial en la cavidad oral creada por los articuladores para realizar la oclusión en el punto de articulación de la consonante. Sin embargo, es aún posible hacer que las cuerdas vocales vibren haciendo que el aire que viene de los pulmones fluya hasta que llene la pequeña cavidad que se crea entre las cuerdas vocales y la cerrazón de la oclusiva. Tan pronto como se igualen la presión subglótica y la supraglótica, se detiene la vibración de las cuerdas vocales. De este modo, el tiempo que se puede mantener vibrando las cuerdas vocales en esas condiciones depende de cuán grande es la cavidad oral creada entre las cuerdas vocales y el lugar de oclusión de la consonante. Cuanto más grande sea, se puede mantener la vibración de las cuerdas vocales por más tiempo. Ya que las cavidades creadas para /b/ y /d/ son mayores a la que se crea para /ɡ/, se sigue que es más fácil poder mantener las cuerdas vocales vibrando para las oclusivas no velares que para la oclusiva velar.
Las lenguas del mundo reaccionan de modo diferente a esta restricción aerodinámica. Algunas como, por ejemplo, el quechua cusqueño (Rodríguez Champi 2006) evitan las consonantes oclusivas sonoras en su inventario de segmentos. Otras lenguas, como las germánicas (Davidson 2016; Docherty 1992; Jessen 1998; Jesus y Costa 2020), permiten la presencia de oclusivas sonoras en sus inventarios segmentales y, además, exigen que se realice su especificación [-continua], pero al momento de realizarlas, las oclusivas sonoras ocurren parcial o totalmente sordas. En otras lenguas, como la mayoría de las variedades del castellano, la fonología demanda que se realice el rasgo [+sonoro] de las oclusivas sonoras; es decir, las cuerdas vocales deben vibrar durante su articulación, pero el costo de cumplir con ese requerimiento fonológico es que las oclusivas sonoras deben perder su especificación [-continua] y realizarse como aproximantes para poder lidiar con las restricciones aerodinámicas.
Algunas veces las oclusivas sonoras pueden ser presionadas a realizarse como oclusivas, por ejemplo, por influencia de las posiciones prominentes de la estructura prosódica. Cuando esto sucede, las restricciones aerodinámicas pueden causar asimetrías entre las oclusivas sonoras: aquellas con cavidades mayores en el tracto oral, como /b/ y /d/, van a ser ligeramente más fáciles de realizar como oclusivas y sonoras que aquellas que tienen una cavidad más pequeña, como ocurre para /ɡ/. Esto es lo que observamos en el caso del castellano de Lima. Las sílabas acentuadas iniciales, en virtud de su estatus prosódico privilegiado, pueden requerir que las consonantes oclusivas sonoras se realicen como tales, pero la satisfacción de este requerimiento es más fácil de lograrse cuando se trata de las oclusivas sonoras no velares, /b/ y /d/, que cuando se trata de la oclusiva velar, /ɡ/, lo cual causa la asimetría entre ellas.
¿Por qué la influencia de las posiciones prosódicas en la inhibición de la espirantización es tan tenue incluso en las oclusivas no velares /b, d/? Puesto en otras palabras, ¿por qué no observamos que la inhibición de la espirantización de /b, d/ en el castellano limeño se produce en la mayoría de los casos y no solo en el 25% reportado? A nivel fonético, la prominencia de las posiciones prominentes está basada en propiedades perceptuales, articulatorias y psicolingüísticas. De este modo, por ejemplo, las sílabas acentuadas tienden a mostrar una mayor duración, los formantes de sus vocales tienden a ser más estables (es decir, evitan centralizarse), y la producción de sus segmentos tiende a requerir un mayor esfuerzo articulatorio. En contraste, las sílabas no acentuadas tienden a mostrar una menor duración, los formantes de sus vocales tienden a moverse hacia el centro del espacio vocálico y la producción de sus segmentos requiere menos esfuerzo articulatorio. En algunas lenguas, la prominencia de sílabas acentuadas o sílabas iniciales va más allá del reino de la fonética y logra que la fonología se refiera a ellas: en este caso, la fonología inhibe de manera categórica los procesos de debilitamiento e incluso puede disparar procesos de fortalecimiento que hagan a las posiciones prominentes incluso más sobresalientes. En contraste, las posiciones no prominentes, y los segmentos que las ocupan, están expuestos a cualquier proceso de debilitamiento que esté presente en la fonología de la lengua.
En el castellano limeño es claro que la fonología de la espirantización de las oclusivas sonoras no hace referencia a sílabas acentuadas o sílabas iniciales. La espirantización de las oclusivas sonoras del castellano se puede explicar como la interacción de una constricción como *VBV, que requiere que las oclusivas sonoras no ocurran entre dos vocales, y la constricción Ident[-continuo] que requiere que el rasgo [-continuo] de las oclusivas sonoras se preserve6. Ya que la espirantización de oclusivas sonoras en el contexto intervocálico es un fenómeno muy recurrente en castellano, la constricción *VBV debe dominar a la constricción Ident[-continuo]. De este modo, la jerarquía *VBV >> Ident[-continuo] hace que la /d/ de la palabra /lodo/ ‘lodo’ se manifieste como una aproximante y no como una consonante oclusiva: [lo.ðo], *[lo.do].
Ya que la estructura métrica está presente en la organización de los segmentos de las palabras en constituyentes prosódicos, las posiciones prominentes, debido a sus propiedades perceptuales articulatorias y acústicas, pueden ejercer su influencia en la realización de los segmentos incluso en aquellos casos donde la fonología de un proceso fonológico no hace referencia a ellas. Sin embargo, en esos casos, su influencia no se da de manera categórica, sino de manera gradual. Este es precisamente el caso del castellano limeño. Aunque la fonología de la espirantización de las oclusivas sonoras no hace referencia a las sílabas acentuadas, aún podemos ver el efecto de la sílaba acentuada y la sílaba inicial de palabra en el 25% de las veces en que las oclusivas sonoras se realizan como oclusivas.
¿Qué hay acerca de la asimetría entre los alófonos aproximantes con respecto a la influencia de las sílabas acentuadas en el grado de constricción que éstos muestran? La explicación es la misma. En el nivel de la implementación fonética, las posiciones prominentes pueden aminorar los efectos de los procesos de debilitamiento, como lo muestra el caso de la espirantización en el castellano limeño. La influencia de las posiciones prominentes (sílabas acentuadas y sílabas iniciales) en el castellano limeño es de índole fonética, variable y gradual. En un 25% estas logran inhibir la espirantización, pero incluso si no lo logran, influyen en el grado de constricción que las realizaciones aproximantes muestran, sobre todo, en sílabas acentuadas. Este mismo hallazgo ha sido corroborado en otros estudios como, por ejemplo, los trabajos de investigación de Carrasco, Hualde y Simonet (2012); Cole, Hualde y Iskarous (1999); Eddington (2011); Henriksen, Fafulas y O’Rourke (2020); O’Rourke y Fafulas (2015); Ortega-Llebaria (2004); Rao (2015) que indican que el acento reduce el grado de constricción de los alófonos aproximantes de las oclusivas sonoras del castellano.
6. Conclusiones
En este artículo se ha examinado la influencia que tiene el acento y la sílaba inicial de la palabra sobre la espirantización de las oclusivas sonoras /b, d, ɡ/ en el castellano de Lima. Lo primero que se encontró, y que confirma la impresión general que uno tiene de esta variedad de castellano, es que las oclusivas sonoras habitualmente se realizan como aproximantes en contextos intervocálicos. Sin embargo, dentro de esa tendencia general, se halló que la interacción con factores prosódicos sí tiene un efecto sobre la espirantización de las oclusivas sonoras, pero que dicho efecto no se da de manera uniforme. De este modo, se encontró que las oclusivas /b/ y /d/ muestran patrones de espirantización diferentes a la oclusiva /ɡ/. Mientras la oclusiva sonora velar /ɡ/ se espirantiza por igual en todos los contextos prosódicos examinados y su grado de constricción no se ve afectado por factores prosódicos, las oclusivas no velares /b/ y /d/ muestran una tendencia, ligera, pero estadísticamente significativa, a no espirantizarse en sílabas acentuadas en posición inicial de palabra. En ese ambiente prosódico, las oclusivas sonoras intervocálicas /b/ y /d/ pueden realizarse hasta en un 25% de las veces como oclusivas en vez de aproximantes. En contraste, en los otros contextos prosódicos, /b/ y /d/, al igual que /ɡ/, se realizan abrumadoramente como aproximantes en alrededor del 95% de las veces. La posibilidad de inhibir la espirantización en ambientes intervocálicos por presión de factores prosódicos es un fenómeno que no se ha reportado antes para el castellano.
Por otro lado, las realizaciones aproximantes de las oclusivas no velares /b/ y /d/, a diferencia de /ɡ/, también tienden a ocurrir con diferentes grados de constricción en la cavidad oral dependiendo de si pertenecen a una sílaba acentuada o no. Esto significa que, en sílabas que son prosódicamente privilegiadas, como es el caso de las sílabas acentuadas, las realizaciones espirantizadas de las oclusivas sonoras tienden a mostrar menos debilitamiento que en sílabas inacentuadas. Los resultados sobre la influencia del acento en el grado de constricción de las realizaciones espirantizadas de las oclusivas sonoras confirma lo encontrado por Carrasco, Hualde, y Simonet (2012); Cole, Hualde y Iskarous (1999); Eddington (2011); Henriksen, Fafulas y O’Rourke (2020); O’Rourke y Fafulas (2015); Ortega-Llebaria (2004); y Rao (2015) en otras variedades del castellano.
Este estudio sugiere que el efecto que se observa de la influencia de las sílabas acentuadas e iniciales de palabra sobre la espirantización de las oclusivas sonoras del castellano limeño es un fenómeno fonético, ya que la fonología de la espirantización de /b, d, g/ no hace referencia al acento o la sílaba inicial de palabra. La presencia de la estructura prosódica en la representación fonética influye de forma no categórica en la realización de las oclusivas sonoras en sílabas acentuadas y de inicio de palabra. Esto explica por qué la espirantización de las oclusivas sonoras intervocálicas /b, d/ solo se inhibe en alrededor de 25% de los casos en sílabas acentuadas iniciales y por qué las realizaciones aproximantes de /b, d/ en sílabas acentuadas tienden a tener un mayor grado de constricción. Todos esos casos reflejan el continuo de la influencia de la estructura prosódica en tratar de inhibir o aminorar la espirantización en posiciones prominentes. Por otro lado, la asimetría que se observa en la espirantización de consonantes velares y no velares es el resultado de restricciones aerodinámicas. Cuando se requiere un esfuerzo para evitar o aminorar la espirantización de oclusivas sonoras en posiciones prominentes, es más fácil lograrlo en aquellas que tienen una cavidad grande entre la glotis y el lugar donde se produce la cerrazón de la oclusiva que en aquellas oclusivas con una cavidad pequeña.