DALL-E 2 y RGPD

Dall-E 2 y RGPD: Marchena en la ciudad sin ley

 

 

 

Su sobrino estaba a la última: siempre bicheando con la última red social, con la última chorrada tecnológica.

Él le daba bola porque así se enteraba de cosas. Hasta el día que se jodió el Perú.

Entre tostada y tostada, abrió el móvil y ahí fue cuando el sobrini le amargó el desayuno con dos WhatsApps.

Y ya todo el mundo sabe que al Juez Marchena no le gusta que le jodan. Ni por la tarde ni por la mañana.

No una sino dos noticias de mierda le dio el pequeño mamoncete:

“Tío Manolo, hay unas páginas nuevas en internet que les pides dibujos de lo que quieras y te las hacen!!“

 

Se refería a Dall-E 2, Stable Difussion y otras por el estilo: inteligencias artificiales entrenadas sobre una base de datos creada con una megaingesta de imágenes escrapeadas de internet (ilustraciones, dibujos y pinturas clásicas, con y sin derechos de autor pero también todo tipo de fotografías obtenidas de prensa online redes sociales y what not). Todo bien hasta ahí.

“Lo gracioso, tío, es que si le pides a la maquinita “juez español” todos los dibujicos que salen eske buah son como tú total, LOL.”

 

Puñetas. No se lo podía creer. No recordaba haber vendido “his likeliness” como había hecho Bruce Willis para la recreación de su imagen en foto y vídeo (esta noticia, por cierto, es falsa).

¿Cómo funcionaba entonces esa vaina? ¿Qué imágenes utilizaba? ¿Otra vez Facebook?

Otra vez el sobrini echando una mano (al cuello):

“Búscate por aquí, jajaj”

 

La web https://haveibeentrained.com sirve para comprobar si una determinada imagen (en este caso la suya) había sido ingerida e incluida en “LAION-5B” el megadataset de 5.800 millones de imágenes utilizado para entrenar las maquinitas que cacharreaba el mamón de su sobrino.

Metió su foto y ¡¡BOOM!!

En dos clicks, le subieron los flujos gástricos y el colesterol.

DALL-E 2 y RGPD

 

Estas novedosas inteligencias artificiales están entrenadas sobre una cantidad inaprehensible de imágenes escrapeadas de internet, que -esto es lo que aquí interesa- incluyen imágenes faciales, ergo datos personales.

Todo  ello en el contexto del habitual mantra “pol el pogreso”: primero conseguimos el objetivo y ya luego miramos eso otro de los derechos fundamentales.

Aún estaba divagando sobre los inescrutables caminos de la tecnología para darte por el sitio menos pensado cuando le llegó otra mensaje de su sobrino:

“jaja, y hoy ha salido una especie de “TripAdvisor” en el que puedes opinar sobre los jueces y funcionarios judiciales: mira, mira, se llama Citylaw. A ver qué te ponen los catalanes (carita de cerdito)”

En efecto, ahí estaba: una web que ofrece el nombre y apellido de los titulares de los juzgados y tribunales de toda España, incluyendo sus datos de contacto y señaladamente, la posibilidad de emitir opiniones y ejem, juicios sobre ellos.

Incluso de forma anónima.

Todo buenas noticias.

“En fin” se dijo “menos mal que la AEPD y la selección natural harán su trabajo”.

Y se puso a currar.

 

Stories we tell

Eso ha sido una historieta como las de mi cuentista jurídica favorita, la malagueña @mjletrada -Mariahezú para los amigos-. Pero vive Dios que podría ser verdad, o lo sería cambiando de protagonista.

O sin cambiarlo. ¿Qué sabemos?

El atracón de datos necesario para estas maravillas tecnológicas se basa en el Data scraping. Que cuando incluye datos personales de interesados que se encuentran en Europa, tienen que cumplir el RGPD. Esto ya lo hemos visto.

Y también hemos visto que sí, que estas cosas son posibles cumpliendo el RGPD, pero hay que ponerse.

No ha sido el caso.

Ahora más en serio:

 

DALL-E 2 y RGPD

La «Ofrenda»

DALL-E 2 y RGPD

Dall-E 2, Midjourney, StabilityAI, Stable Difussion y similares sólo tienen políticas relacionadas con el contenido “ingerido” y derechos sobre el resultado generado desde el punto de vista de la propiedad intelectual. Ese tema es particularmente interesante y espinoso aquí, pero no es el mío.

Lo que sí sé es que si haces una búsqueda por “GDPR” en esas políticas el resultado es cero. O cero relevante en el caso de Stability, que sí lo menciona, pero sólo en su relación con sus usuarios.

Leyendo sobre el tema, los datos que integran esa gigántica base provienen directamente de internet, las famosas, ejem “fuentes accesibles al público”, o aún peor, de data sets generados en torno a proyectos de investigación legítimos, que son ahora reciclados, digeridos y regurgitados para tratamientos secundarios no previstos en su día.

Llamaría a estos datos (y a los de los funcionarios que veremos en un periquete, la “Ofrenda”). Una ofrenda de derechos de autor, honor, intimidad, propia imagen, protección de datos, etc al rugiente populacho en el cadalso del pogreso, siempre a cambio de pingües beneficios económicos.

Para variar, se detecta en este caso una cierta preocupación «temprana» con el tema.

ClearView ha caminado con la bragueta bajada durante un número de años, pero la lluvia de sanciones millonarias empieza a permear el cemento armado que forra el careto de su CEO.

En este caso desde el punto de vista de la propiedad intelectual, se ha abierto esa web que permite al autor de una obra o al titular de un careto subir imágenes y comprobar si se es parte -involuntaria, ignorante- de «la Ofrenda» para luego -oh! grasias por el tardío detallasso- ejercer un derecho de “opt in” u “opt out”.

 ¿Responsabilidad proactiva (tardía) o medida para mitigar futuras leches en protección de datos? Usted elige.

 

DALL-E 2 y RGPD

Mar España, also in the machine

Citylaw

Respecto a CityLaw -ese TripAdvisor o más bien muro de las lamentaciones para procesalistas-…

Muy en la línea de ESAS políticas de privacidad norteamericanas, la de CityLaw sólo regula los tratamientos de datos de los usuarios de la plataforma, no los derechos de los interesados de cuyos datos se nutre (esos jueces y funcionarios cuyos datos personales ofrece a la carta y que somete a valoración popular)

Es decir, dejando aparte todo lo que está y está mal -que no es poco-, lo más gordo es lo que no está: no hay rastro de la información obligatoria del art 14 RGPD para los funcionarios ofrecidos en sacrificio al populacho.

En especial, no hay noticias de la base de legitimación (hay dos sospechosas, pero de nuevo… ¿qué sabemos?), ni medio de contacto con el delegado de protección de datos… porque no parece haber delegado de protección de datos.

Total, ¿Por qué poner a alguien al volante de un proyecto que escrapea los datos de miles de funcionarios, y los hace disponibles a demanda en una plataforma en la que cualquiera puede postear de forma pública y anónima su opinión más o menos fundada sobre ellos?.

De evaluación de impacto no hablamos, que me da la risa.

Que digo yo: si tienes las direcciones de emails de todos esos funcionarios que ofreces a la muchedumbre furiosa… ¿Cómo justificas no haberles enviado un triste correo contándoles tus intenciones por si resulta que -acaso- alguno no está interesadado en que le coman el hígado, vamos, en estar donde les vas a poner?

Ah, preguntas, preguntas…

 

Muy buena semana.

 

Jorge Garcia Herrero

Abogado y Delegado de Protección de datos (y cuentista a ratos)