jueves, 19 de septiembre de 2013

RBMT

La traducción automática basada en reglas (en inglés rule based machine translation, RBMT)
La traducción automática basada en reglas (en inglés ruled based machine translation, RBMT) es un tipo de traducción automática basado en reglas lingüísticas. Abarca los aspectos semánticos, morfológicos y sintácticos. Se inició en los años setenta y hoy en día se utilizan tres tipos de RBMT.
-¿En qué consiste? El método consiste en realizar transformaciones en una lengua de partida reemplazando sus palabras por su equivalente más apropiado en la lengua de llegada.
-¿Cómo es posible hacer esto? Porque la RBMT conoce las reglas gramaticales.
-¿Cómo funciona? En una primera fase se analiza el texto, normalmente creando una representación simbólica interna. Dependiendo de la abstracción de esta representación también se pueden encontrar diferentes grados: desde los directos, que básicamente hacen traducciones palabra por palabra, hasta interlingua, que utiliza una representación intermedia completa.





La RBMT puede ser de distintos tipos:
Por Diccionario: se utilizan como modelo diccionarios bilingües. La traducción de un texto se obtiene a partir de la traducción palabra por palabra, sin tener en cuenta ni la relación entre ellas ni el contexto en que se encuentran.
Por Transferencia: en la traducción por transferencia, el análisis del original juega un papel más importante, y da paso a una representación interna que es la que se utiliza como enlace para traducir entre idiomas distintos.
Por Lenguaje intermedio: la traducción automática a partir de un lenguaje intermedio es un caso particular de la traducción automática. El lenguaje original, por ejemplo, un texto que debe ser traducido, es transformado a un lenguaje intermedio, cuya estructura es independiente a la del lenguaje original y a la del lenguaje final. El texto en el lenguaje final se obtiene a partir de la representación del texto en el lenguaje intermedio.




RBMT frente a SBMT

La RBMT proporciona una buena calidad fuera de un dominio específico y es previsible por naturaleza. La personalización basada en diccionarios garantiza una calidad mejorada y la conformidad con la terminología corporativa. Pero a los resultados de la traducción les puede faltar la fluidez que esperan los lectores. En términos de inversión, el ciclo de personalización necesario para llegar al umbral de calidad puede ser largo y costoso. El rendimiento es alto incluso con hardware estándar.

La SBMT (traducción basada en estadísticas) proporciona una buena calidad cuando se dispone de corpus grandes y calificados. La traducción es fluida, lo que significa que se lee bien y, por lo tanto, cumple con las expectativas del usuario. Sin embargo, la traducción no es ni previsible ni coherente. La práctica a partir de corpus buenos es automática y más barata. Pero la práctica sobre corpus del lenguaje general, es decir, sobre textos que no son de un dominio específico, es deficiente. Además, la MT estadística requiere un hardware determinado para crear y administrar modelos de traducción grandes.

RBMT
SBMT
+ Calidad coherente y previsible
- Calidad de la traducción imprevisible
+ Calidad de la traducción fuera del dominio
- Calidad fuera del dominio deficiente
+ Conoce las reglas gramaticales
- No conoce la gramática


+ Alto rendimiento y robustez
- Elevados requisitos de CPU y espacio en disco
+ Coherencia entre versiones
- Incoherencia entre versiones


- Falta de fluidez
+ Buena fluidez
- Es difícil manejar las excepciones a las reglas

+ Buena para tratar las excepciones a las reglas


- Costos elevados de desarrollo y personalización

+ Desarrollo rápido y rentable siempre que exista el corpus requerido


Fuentes:
http://www.pangea.com.mt

No hay comentarios:

Publicar un comentario