Seminari «Llicències i drets d'ús de les dades lingüístiques en traducció automàtica»

10/02/2022 | TRAD
Compartir

Compartir

Facebook
Twitter
Linkedin
Whatsapp
Gmail
Imprimir

Acte: Seminari «Llicències i drets d'ús de les dades lingüístiques en traducció automàtica»

Data: 16 de febrer

Hora: d’11 a 13 hores

Lloc: Meet (l’enllaç s’enviarà per correu electrònic a les persones inscrites) i Sala de Juntes de la Facultat de Ciències Humanes i Socials

Coordinació: Esther Monzó i Amparo Alcina

Imparteix: Mikel Forcada

Resum: La traducció automàtica és especial perquè es basa en gran mesura en dades. En la traducció automàtica basada en regles, un motor realitza la tasca de traducció utilitzant recursos lingüístics com ara diccionaris i regles gramaticals, generalment escrites per experts, però de vegades apresos a partir de textos monolingües o bilingües. La traducció automàtica basada en corpus (estadística i, més recentment, neuronal) aprofita grans quantitats de text bilingüe (alineat oració a oració) i monolingüe. És evident que el programari de traducció automàtica que trau profit d'aquestes dades són obres de creació que poden estar protegides per drets d'autor, però aquesta conferència se centra en les dades. El treball humà, i per tant, l'autoria creativa de les obres, està present en totes les formes de dades de traducció automàtica: s'ha escrit text monolingüe, s'ha traduït i alineat text paral·lel i s'han escrit regles i diccionaris per experts. D'ençà que es van concebre fa segles, els drets d'autor protegeixen els mitjans de vida dels autors regulant com es poden utilitzar les còpies d'aquestes dades i com s'utilitzen i es publiquen les obres que se'n deriven, mitjançant instruments com les llicències. Tot i que el cas dels diccionaris i gramàtiques tal com s'utilitzen en la traducció automàtica basada en regles és raonablement clar, ja que s'escriuen expressament per a una o altra aplicació de processament d'idiomes, el text monolingüe i paral·lel, tal com s'utilitza a la traducció automàtica, no es va crear amb la traducció automàtica en ment, i això ha portat alguns autors a preguntar-se si autors i traductors haurien d'obtenir una compensació addicional per aquest ús no desitjat del seu treball per a generar nou valor "aigües avall". La conferència ofereix una visió general de les diferents fonts de dades utilitzades en la traducció automàtica, en discuteix l'autoria al llarg dels passos de creació, cura i transformació d'aquestes dades per utilitzar-les amb traducció automàtica, determina els tipus d'esquemes de llicències implícits i explícits que s'hi apliquen i com funcionen. També descriu la controvèrsia al voltant de l'ús d'obres publicades per generar valor nou, inicialment no desitjat, a través de les tecnologies de traducció, i les diferents maneres en què s'aborden els problemes de drets d'autor.

Inscripció necessària

Informació proporcionada per: Departament de Traducció i Comunicació