El presidente de Telefónica, José María Álvarez-Pallete, ha instado este miércoles 27 de marzo a desarrollar inteligencia artificial basada en la lengua española, que en contenidos digitales no alcanza el mismo lugar que sí ocupa respecto al número de hablantes en el mundo.
"La lengua española tiene un reto tremendo por delante. Es necesario que entre todos coloquemos al español donde se merece, también en el mundo digital", ha señalado Álvarez-Pallete durante su participación en el VIII Congreso de la Lengua que se celebra en la ciudad argentina de Córdoba. Para el directivo, resulta clave entender "cómo se está fraguando la lengua sintética con la que ya se está relacionando" el usuario cuando pregunta al asistente de voz las noticias del día, el tiempo, la información del tráfico o el resultado de un partido de fútbol.
Según los datos que ha ofrecido, tras el chino, el español ocupa la segunda posición por importancia –hablado por 480 millones de personas como primera lengua, superando en un veinte por ciento en número de hablantes al inglés–. Sin embargo, al revisar cuál es el idioma en contenidos digitales el español cae a la cuarta posición y el inglés sube a la primera, con un peso diez veces mayor.
Además, ha recordado que la lengua española está "expuesta a otros riesgos". "Cuanto menos precisos, más erróneos o menos relevantes sean los datos con los que aprende a hablar una inteligencia artificial, más errores, limitaciones o incluso sesgos se incorporarán en el lenguaje sintético", ha alertado, reiterando que es algo que "no se puede ignorar si se quiere asegurar el uso del español por futuras generaciones".
El presidente de Telefónica ha analizado también cómo los errores del lenguaje se extienden "a gran velocidad" y cómo la inteligencia artificial aprende de ellos. Ha utilizado ejemplos como cocreta, que aparece en casi ochenta mil referencias de búsquedas o el uso erróneo del imperativo del verbo decir, decirlo, que arroja más de dos millones de resultados, mientras que su forma correcta, decidlo, muestra algo más de tres mil. Asimismo, vocablos de uso menos habitual desaparecen o arrojan resultados residuales. Las abreviaturas e imprecisiones al usar aplicaciones de mensajería popularizan el uso de incorrecciones ortográficas o gramaticales.
Respecto al impacto que tienen los procesadores de texto más comunes en la configuración del nuevo lenguaje sintético y su impacto en el uso correcto de la lengua, ha subrayado que muchos de estos procesadores "fallan al reconocer palabras correctas" y, además, cuando esto sucede, "proponen corregirlas y sustituirlas, dando lugar así a un empobrecimiento y adelgazamiento del léxico". "Este es el momento de abordarlo, ya que en los próximos años cientos de millones de máquinas hablarán español", ha concluido.