Que escoitar, escribir

Kortabitarte Egiguren, Irati

Elhuyar Zientzia

Buscar por escrito é fácil na rede. Paira iso só temos que escribir a palabra que queremos consultar no buscador. Nestas procuras, con todo, pérdense, entre outras cousas, o indicado nos ficheiros de audio, sempre que non se recollan no texto escrito as explicacións do indicado en devanditos ficheiros de audio.
Que escoitar, escribir
01/03/2008 | Kortabitarte Egiguren, Irati | Elhuyar Zientzia Komunikazioa

Os programas Gaur Egun de ETB utilizan, entre outras cousas, paira formar sistemas de tratamento da fala.
EITB
Coñecer a fala oral e convertelo en texto non é tarefa fácil. As palabras non se separan ben entre si, hai que ter en conta a entonación e ademais o ruído dos sinais físicos é un obstáculo. Neste sentido, abriuse un amplo mercado aos sistemas que procesan e entenden a fala oral. É dicir, paira ferramentas que nos converten en texto escrito.

Estes sistemas intégranse polo momento principalmente en servizos telefónicos como cita previa, solicitude de produtos, solicitude de reserva paira espectáculos, etc. Pero hai outros como o ditado automático. Nesta última está a traballarse, entre outros, no departamento de Enxeñaría de Sistemas e Automática da UPV/EHU.

O tratamento da fala require moita e boa formación. É dicir, o sistema debe recibir certo adestramento, o que se coñece como aprendizaxe máquina. Paira iso necesítanse, por unha banda, ficheiros, audios e sons de televisión e radio, e por outro, textos de referencia do devandito neses medios de comunicación. Investigadores da UPV, por exemplo, utilizan con frecuencia os programas Gaur Egun e Teleberri de ETB paira formar o sistema. Non é necesario saber que se dixo literalmente, pero si que é capaz de recoller un resumo do devandito. En definitiva, trata de comprender a relación entre sons e palabras.

Una vez finalizado o proceso de aprendizaxe, o sistema debería ser capaz de entender o devandito en calquera Gaur Egun ou Teleberri. Aínda que a aprendizaxe é un proceso lento, una vez que o sistema ten as normas ou a información interiorizada, é dicir, ten o material de referencia adecuado, mostra o resultado con certa rapidez. Neste caso, texto escrito do falado. En definitiva, o obxectivo é obter texto dun audio ou son.

Pequeno grande

É certo que a maioría deste tipo de aplicacións que se poden atopar no mercado teñen como obxectivo os “grandes” idiomas, sobre todo o inglés. Con todo, investigadores da Escola Universitaria Politécnica de Donostia-San Sebastián, en colaboración cos grupos IXA, GTTS e Intelixencia Computacional da UPV/EHU, traballan co eúscaro. A diferenza evidente entre estas linguas 'grandes' e 'pequenas' radica no número de datos de referencia. Este tipo de ferramentas inglesas teñen una gran cantidade de datos, mentres que o material de referencia en eúscaro é bastante menor. Por iso, os investigadores están a buscar novas técnicas paira aproveitar mellor e con maior precisión estes poucos datos.

A frecuencia e entonación do devandito oralmente axudan a diferenciar o tipo de información que está a recibir o sistema.
UPV/EHU
Paira obter este grao de precisión utilizan varias ecuacións matemáticas. Tratan de atopar as características máis relevantes dos conxuntos de datos e ficheiros de audio que proporcionen información adecuada. Con todo, é bastante difícil realizar esta selección, é dicir, elixir a información que se vai a recibir e que se vai a rexeitar. Normalmente traballan con frecuencia e entonación paira diferenciar o tipo de información que está a recibir o sistema en cada momento (por exemplo, se se trata dunha pregunta ou dunha oración expresiva).

Estes sistemas dependen totalmente da lingua e cada lingua ten a súa propia ferramenta. Pero, por exemplo, os investigadores da UPV/EHU traballan non só co eúscaro, senón tamén co castelán e o francés. O programa Teleberri ou as sesións de Infozazpi, por exemplo, teñen dous obxectivos principais: por unha banda, queren comprender o castelán e o francés --xunto co eúscaro-, e por outro, buscar neste tipo de sistemas as similitudes existentes entre o eúscaro e as outras dúas linguas paira poder mellorar a capacitación das ferramentas en eúscaro.

Neste sentido, na actualidade están a realizarse una serie de ensaios que analizan a posibilidade de utilizar varios idiomas nunha mesma ferramenta. Este é o reto de futuro dos investigadores da UPV: desenvolver un sistema capaz de entender o eúscaro, o castelán e o francés.

Resumo do proxecto
Este grupo de investigación traballa no campo dos coñecementos plurilingües da fala paira o eúscaro e as linguas que lle rodean. En particular, desenvolven diversas ferramentas e recursos paira o acceso automático á información a través da linguaxe informativa dos medios de comunicación vascos. Paira iso, investigan as técnicas paira obter esta información da forma máis eficaz posible e, sobre todo, desenvolven métodos paira linguas minoritarias como o euskara.
Director
Dra. Miren Karmele López de Ipiña.
Equipo de traballo
C.M. López de Ipiña 1 , N. Barroso 1 , N. Gilisagasti 1 , I. Ariztimuño 1 , A. Nov 1 , N. Ezeiza 2 e M. Hernández 2.
Departamento
Enxeñaría de Sistemas e Automática.
Facultade
1 Escola Universitaria Politécnica de Donostia-San Sebastián e 2 Facultade de Informática.
Pola esquerda, Ixabel Ariztimuño, Nora Barroso, Aitzol Ezeiza, Karmele Lopez de Ipiña e Nerea Ezeiza.
(Foto: UPV)
Kortabitarte Egiguren, Irati
Servizos
Máis información
2008
Servizos
036
Universidades
Difusión do coñecemento
Outros
Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila