A calidade do traballo do tradutor humano será, sen dúbida, mellor e máis rica, pero hoxe en día é posible crear documentos nun campo concreto e técnico como é a meteorología, utilizando técnicas automáticas. Neste
artigo presentamos o sistema interactivo Multimeteo que utiliza a creación textual multilingüe no ámbito da meteorología, así como a adaptación que realizamos á creación en eúscaro. O sistema desenvolvido ofrece prognósticos meteorolóxicos diarios na seguinte dirección web: http://www.ingurumena.net/udala //www.inm.es/wwi/Multimeteo/Multimeteo.html
Aínda que non se utiliza a creación automática de textos, hai que mencionar aquí un sistema que traduce automaticamente as predicións meteorolóxicas. O sistema METEO creado polo grupo TAUM de Montreal foi o sistema de tradución máis exitoso de todos os tempos. Era difícil atopar tradutores paira traducións aburridas que se parecían a diario, e o servizo meteorolóxico oficial de Canadá comezou a investigar as vías automáticas. O sistema METEO obtido estivo traducindo boletíns meteorolóxicos do inglés ao francés desde 1977, e o 80% da súa tradución é totalmente directa. Con todo, o éxito da meteorología non se estendeu, xa que aínda que o sistema adaptouse a outras cuestións, non se obtiveron resultados de igual calidade. Parece que o ámbito das predicións meteorolóxicas ten una especial adecuación a este tipo de procesos automáticos.
A contorna de traballo Forecast Generator (FoG) tamén se puxo en marcha en Canadá en 1993. Neste sistema, o meteorólogo utiliza un editor gráfico paira adaptar o mapa que mostra os datos meteorolóxicos e posteriormente o sistema xera automaticamente a predición meteorolóxica en inglés e francés paira a rexión.
En 1995 o Servizo Meteorolóxico Francés (Meteo France) impulsou o proxecto MultiMeteo paira a publicación das previsións meteorolóxicas en varios idiomas. Paira iso púxose en contacto co Instituto Nacional de Meteorología (INM) de España, o Royal Meteorological Institute (RMI) de Bélxica, o Zentralanstallt für Meteorologie und Geodynamik de Austria (ZAMG) e dúas empresas especializadas na creación lingüística: Lexiquest, con sede en París, e CL Servizos Lingüísticos de Madrid. O servizo de meteorología alemán (DWD) tamén se uniu inicialmente, pero foi abandonado posteriormente.
Estas asociacións presentaron o proxecto denominado “Multilingual Production of Weather Forecasts” e obtiveron financiamento comunitario. O sistema desenvolveuse en catro idiomas: francés, inglés, castelán e alemán. Os resultados da avaliación realizada en febreiro de 1999 foron moi positivos.
No ano 2000 INM e Lexiquest alcanzaron un acordo paira estender o sistema a catro linguas máis: o holandés, o catalán, o galego e o eúscaro. O Grupo Ixa e o Centro de Terminología UZEI da Facultade de Informática de San Sebastián encargámonos da difusión ao eúscaro, e neste momento estamos a piques de finalizar a fase de desenvolvemento do proxecto.
Paira a recollida de datos meteorolóxicos utilízanse dúas fontes: a recollida superficial de datos e a recollida espacial. Os datos superficiais tómanse nos observatorios meteorolóxicos, nos que se miden e recollen en todo momento as variables físicas que describen o estado da atmosfera. Outros datos que se obteñen do espazo son os satélites meteorolóxicos, os satélites geoestacionarios METEOSAT e os satélites polares de sériea TIROS-NOAA, que non paira de enviar información.
Todos os datos numéricos obtidos procésanse mediante complexos modelos matemáticos. Os procesos automáticos simulan a evolución das variables físicas nos próximos días, xerando matrices de datos paira predicións meteorolóxicas. O meteorólogo ten entón a oportunidade de retocar estas matrices de datos, é dicir, de completar e redondear a previsión coa súa experiencia. Como conclusión, tal e como se observa na Táboa 1, as matrices presentan datos de temperatura (Che), dirección do vento (DD) e forza (FF), nubes, choiva, etc. paira diferentes horas (períodos de 3 horas no caso do sistema da INM). Paira cada punto do mapa obtense una matriz deste tipo.
Con estes datos os meteorólogos crean as predicións meteorolóxicas manualmente. Este traballo resulta moi longo e custoso, sobre todo cando dunha soa predición hai que facer varias versións en diferentes idiomas ou estilos (predicións xerais, de praias, de mar, de montaña, por comunidade, por provincia...).
Aí está o interese de MultiMeteo. Non se trata de substituír a obra dos meteorólogos, senón de contribuír de maneira interactiva ás súas tarefas, de maneira que se poidan difundir as predicións en diferentes idiomas e estilos. Ademais, permite realizar predicións paira diferentes lugares do mapa.
Esta técnica, en primeiro lugar, mediante a creación automática, xera un borrador a partir de datos de entrada quizá incompletos. Aínda que ten a capacidade de crear texto en varios idiomas, ao meteorólogo, paira actuar como corrector, ofréceselle unicamente na súa lingua materna. Si o meteorólogo desexa realizar una corrección nun fragmento de texto, deberá facer clic na parte que desexe modificar. A continuación, o menú “pop-up” ofreceralle una serie de opcións e modificadores alternativos, elixindo un deles paira realizar a corrección de forma cómoda. Tendo en conta os cambios realizados, o sistema xerará textos predictivos en todos os idiomas.
As vantaxes desta técnica son a rapidez (paira producir cada texto en cada idioma necesítanse uns 2 segundos; un tradutor humano necesita uns 10 minutos); a viabilidade da creación, aínda que algún dato non se recolleu aínda, a alta calidade dos textos creados (ás veces con toques humanos); a facilidade de mantemento e adaptación; e por último, a aceptación por parte dos usuarios humanos (aos meteorólogos non lles quitará o posto de traballo, senón que lles axudará a escribir en linguas estrañas).
MultiMeteo realiza a creación de dúas formas:
Predición meteorolóxica *IS *CO. *MO *FD.
Hora Local: *FP.
Valor do anuncio: *TT.
onde:
O motor de xeración utilizado polo sistema desenvolveuse en 1994 en francés paira a xeración automática de cartas comerciais. En 1995 estendeuse ao inglés integrándose nun prototipo de tradución de manuais técnicos. E o mesmo ano tamén se integrou no proxecto “Multilingual Production of Weather Forecasts” paira incorporar novas linguaxes e funcionalidades na creación de boletíns meteorolóxicos (creación interactiva e xestión de coñecementos estilísticos).
A arquitectura do sistema pódese ver na figura 2. A primeira fase consiste na obtención e reformateo dunha base de datos meteorolóxicos que permita a utilización de módulos de xeración. Posteriormente, a tarefa do módulo de creación divídese en dous partes: planificar e executar.
A planificación utiliza bases de coñecemento de conceptos e estilos (UE) e divídese en dúas fases:
O suceso é un obxecto conceptual asociado á situación meteorolóxica ou evolución da situación. Os fenómenos son de dous tipos: atómicos e moleculares.
O suceso atómico representa un parámetro meteorolóxico sen evolución, cun único valor asociado ( atributo Value). Por exemplo , o suceso atómico que representa o ceo cuberto é:
Event_CloudCovering4: Event{} Value=Class CloudCovering_code4 é un conxunto de conceptos simples: Overcast, NoSun e VeryCloudy-Overcast. Cada un destes conceptos está asociado a un termo en cada lingua.
O suceso molecular indica máis dun parámetro. Por exemplo, cando falamos de vento podemos ter forza, dirección e datos de evolución. Poden levar varios valores ( Value0 , Value1 , etc. atributos), así como un operador (atributo Operator) que especifica a forma de recoller estes valores. Por exemplo, o suceso molecular paira describir o ceo sen nubes a estar cuberto é:
GrowingCloudier_Min0: Event_mol{ Value0=Este suceso molecular maniféstase mediante dous episodios atómicos e un operador. Serve paira situar os eventos estafe - representation no tempo (presente, pasado ou futuro) e indica o período (día, mañá, tarde, noite...).
Á saída do módulo de planificación selecciónase un concepto paira cada evento atómico e paira cada clase de atributo Operator dos eventos moleculares. Ademais, pódense engadir outros atributos (automaticamente ou en interacción co meteorólogo): índice de probabilidade, fase, período...
O módulo paira materializar lingüisticamente os conceptos obtidos en cada lingua está baseado na Teoría do Significado - Texto (Mel’cuk 1988, Polguère 1988). Nesta fase utilízase una base de coñecemento lingüística que se divide en cinco etapas: predenotación, semántica, sintaxe profunda, sintaxe superficial e morfología.
O traballo computacional paira a difusión do sistema MultiMeteo ao eúscaro foi desenvolvido polo grupo IXA e o traballo terminolóxico foi realizado por UZEI. As adaptacións ao galego e catalán realizáronse a partir da versión castelá, e tiveron que traballar sobre todo o léxico, xa que non se requiría grandes cambios en sintaxes e morfología. Paira o euskara, aínda que partimos do castelán (e en ocasións do francés), a maioría das estruturas das frases foron modificadas e tivemos que traballar especialmente con marcas de declinación morfológica.
Comezamos o noso traballo en tres fases:
A adaptación realizámola en tres subfases: primeiro abordamos os sucesos atómicos (por exemplo, o “ceo, cuberto”), daquela os sucesos moleculares que eran fáciles (por exemplo, o “vento, débil, do norte”), e finalmente, os sucesos moleculares que presentaban especiais dificultades (por exemplo, o ceo, inicialmente cuberto, con choiva, posteriormente moi cuberto temporalmente).
En cada una das fases de adaptación realizouse unha análise lingüística previo, unha análise e deseño da información a incluír na base de coñecemento, una introdución e proba da información dun exemplo representativo paira cada evento e, finalmente, una introdución e proba de todas as posibilidades paira cada tipo de evento.
As principais características desta adaptación son:
Se posteriormente quixésese ampliar o sistema con outros estilos, deberíanse utilizar máis casos de declinación, polo que habería que introducir estes casos no dicionario. Vexamos, por exemplo, a introdución do vocabulario da palabra choiva:
BA_Euri1 :Na táboa 3 pódese observar como se materializaron varios conceptos atómicos en eúscaro (inclúese a realización en castelán e francés de referencia).
Na Táboa 4 pódese observar a execución de varios conceptos moleculares. As variables indican, cando se indican, os valores deste suceso: Variables N estado das nubes (oscarbia, baixo nube, cuberto...); Variables DD dirección do vento (norte, suroeste, etc.); As variables FF son a forza do vento (moderada, forte,...); Variables TS precipitacións (choiva, sirimiri...), Período PER (mañás...)...
O proxecto atópase actualmente nas últimas fases de desenvolvemento. O seguinte paso é una proba masiva paira analizar posibles erros no sistema. A continuación realizar os cambios necesarios e a avaliación final. Con todo, a adaptación realizada está xa integrada no sistema da INM e cada día ofrécense as previsións meteorolóxicas das comunidades do estado español na web http://www.inm.es/wwi/ MultiMeteo/Multimeteo.html.
Ademais da escritura telegráfica do obxectivo xeral, a realización de predicións de propósito especial (paira praias, montañeiros, esquiadores...) e a elaboración de escrituras máis ricas (por exemplo, a introdución de verbos con frases completas) serían pasos factibles a medio prazo. Este tipo de versións completas realizáronse en francés e utilízanse na actualidade. De momento bastaría con analizar a utilidade do sistema desenvolvido paira o eúscaro, e si posteriormente detectásese a necesidade, entón habería que abordar a organización das melloras mencionadas.