Acte: Seminari «Llicències i drets d'ús de les dades lingüístiques en traducció automàtica»
Data: 16 de febrer
Hora: d’11 a 13 hores
Lloc: Meet (l’enllaç s’enviarà per correu electrònic a les persones inscrites) i Sala de Juntes de la Facultat de Ciències Humanes i Socials
Coordinació: Esther Monzó i Amparo Alcina
Imparteix: Mikel Forcada
Resum: La traducció automàtica és especial perquè es basa en gran mesura en dades. En la traducció automàtica basada en regles, un motor realitza la tasca de traducció utilitzant recursos lingüístics com ara diccionaris i regles gramaticals, generalment escrites per experts, però de vegades apresos a partir de textos monolingües o bilingües. La traducció automàtica basada en corpus (estadística i, més recentment, neuronal) aprofita grans quantitats de text bilingüe (alineat oració a oració) i monolingüe. És evident que el programari de traducció automàtica que trau profit d'aquestes dades són obres de creació que poden estar protegides per drets d'autor, però aquesta conferència se centra en les dades. El treball humà, i per tant, l'autoria creativa de les obres, està present en totes les formes de dades de traducció automàtica: s'ha escrit text monolingüe, s'ha traduït i alineat text paral·lel i s'han escrit regles i diccionaris per experts. D'ençà que es van concebre fa segles, els drets d'autor protegeixen els mitjans de vida dels autors regulant com es poden utilitzar les còpies d'aquestes dades i com s'utilitzen i es publiquen les obres que se'n deriven, mitjançant instruments com les llicències. Tot i que el cas dels diccionaris i gramàtiques tal com s'utilitzen en la traducció automàtica basada en regles és raonablement clar, ja que s'escriuen expressament per a una o altra aplicació de processament d'idiomes, el text monolingüe i paral·lel, tal com s'utilitza a la traducció automàtica, no es va crear amb la traducció automàtica en ment, i això ha portat alguns autors a preguntar-se si autors i traductors haurien d'obtenir una compensació addicional per aquest ús no desitjat del seu treball per a generar nou valor "aigües avall". La conferència ofereix una visió general de les diferents fonts de dades utilitzades en la traducció automàtica, en discuteix l'autoria al llarg dels passos de creació, cura i transformació d'aquestes dades per utilitzar-les amb traducció automàtica, determina els tipus d'esquemes de llicències implícits i explícits que s'hi apliquen i com funcionen. També descriu la controvèrsia al voltant de l'ús d'obres publicades per generar valor nou, inicialment no desitjat, a través de les tecnologies de traducció, i les diferents maneres en què s'aborden els problemes de drets d'autor.