Sobre Apertium en Linux Gazette

Linux Gazette

Jimmy O’Regan ha publicado en Linux Gazette un artículo sobre Apertium. En él describe de forma general esta plataforma de traducción automática (TA) y explica brevemente los distintos tipos TA que podemos encontrar (basada en ejemplos, basada en reglas y TA estadística). En la publicación también hace una referencia a TinyLex, al que precisamente dediqué la última entrada. A partir de ahora intentaré estar atento a las referencias a este programa que se puedan hacer.

En una parte del artículo se hace alguna comparación entre traducción automática estadística y TA basada en reglas. Sobre la primera comenta algunos de los inconvenientes de este tipo de sistemas, como es la necesidad de contar con una gran cantidad de texto en ambos idiomas, algo que no esta disponible en la mayoría de pares de lenguas. Otra de las desventajas es que los diccionarios generados contienen todas las posibles combinaciones de palabras para ambas lenguas lo cual supone un gran consumo de memoria y requiere más tiempo de proceso que el tipo de diccionarios usados en sistemas basados en reglas que además tienen la ventaja de poder ser leídos directamente por personas. En este punto es donde hace mención a TinyLex, que basa su información lingüística en diccionarios bilingües desarrollados en Apertium para ser consultados en dispositivos móviles.

Este es el párrafo original en el artículo:

SMT is the current focus of most serious research in MT, but rule-based systems still have a number of advantages. First and foremost, SMT systems require the availability of a large amount of text in both languages, which for most language pairs is not available. Secondly, the generated dictionaries contain all likely word combinations for both languages, which both consume a lot of memory and take much more processing time than do the kind of dictionaries used in rule-based systems (which also have the advantage of being useful as human-readable dictionaries – TinyLex is a Java ME program for bilingual dictionaries that uses Apertium data).

O’Regan (Irlanda) ha promovido y desarrollado el par de lenguas inglés-polaco (también Irlandés) para Apertium.

Leave a Comment