La minería de datos que ahora es legal en el Reino Unido

El 1 de junio entró en vigencia los estatutos que actualizan el marco legal de derechos de autor en el Reino Unido. Los cambios actualizan la lista de actos permitidos al usar obras intelectuales protegidas, incluyendo la facultad de hacer minería de datos bajo ciertas condiciones.

Los cambios han sido resultado de un proceso de investigación y consulta. La motivación del gobierno británico ha sido encontrar respuestas a cómo consolidar el dinamismo del país desde los mecanismos de propiedad intelectual, en el contexto digital que actualmente se vive. En ese marco, el informe Hargreaves ha sido una pieza clave del proceso, frecuentemente citado en parte por el riesgo tomado en sus conclusiones, donde se reconocía que el sistema actual de excepciones tanto a nivel de país como europeo debía actualizarse.

Sobre la minería de datos, el informe reconocía las limitaciones actuales para los investigadores británicos, en tanto no pueden usar todas las herramientas tecnológicas disponibles para la generación de nuevo conocimiento. Es decir, si tienen acceso lícito a fuentes de información como revistas científicas, pueden leerlas, pero no necesariamente es lícito copiarlas para que sean leídas por máquinas (requisito indispensable para la extracción y análisis masivo de texto). La lista de actos permitidos por ley no contemplaba esto último expresamente, colocando a los investigadores en una situación vulnerable y sujeto a denuncias de parte de los titulares de las obras minadas.

La minería de datos es el proceso de extraer información de material que puede ser legible por máquina.

Conforme lo define uno de los documento de respaldo del Informe Hargreaves. No se restringe a texto, ya que se puede minar también gráficos, cuadros, información bibliográfica, entre otros elementos que conforman los documentos electrónicos. No se restringe a artículos de investigación, ya que se puede analizar también datos estructurados contenidos en bases.

No es una actividad de reciente frecuencia. Google por ejemplo ha empleado por años este tipo de operaciones para indexar. Lo particular ahora es que se va incrementando una masa crítica de investigadores que están aprendiendo a usar las herramientas de extracción, con el fin de contar con más caminos para generar nuevo conocimiento. Esta situación,  sumado a  la capacidad actual de las herramientas para  procesar una gran cantidad de datos, están posicionando una narrativa que enfatiza los beneficios de este tipo de análisis, donde se revelan nuevas relaciones y patrones en el ámbito científico, en beneficio de una aceleración en los procesos de innovación.

Autorizados para una lectura individual, no para minar.

Los insumos para el análisis pueden estar protegidos por derechos intelectuales. Situación que no debería ser impedimento para que la comunidad científica pueda crear valor a partir de la reutilización, en la medida que se cuente con un acceso legal a las fuentes (por ejemplo, a través de una suscripción a revistas científicas en el centro de investigación al cual se pertenece).

Pero hay actores que bloquean esta posibilidad, como las empresas editoras de publicaciones científicas. Así, pueden ofrecer licencias de uso sin ninguna opción de minado o con un API restringido para el acto. El temor no es solo perder control en el ecosistema de información científica, sino también una fuente de ingresos adicional, en vista que a futuro pueden haber más interesados en realizar este tipo de análisis computacional. Además, los representantes de las casas editoras pueden entender que copiar un artículo sin autorización es un acto ilegal sin variantes, no importando el própósito final de quien lo realiza.

Como respuesta,  quienes cuentan con acceso legal a los documentos tendrían que ser claros en dos puntos. Primero, asegurar que los textos que serán reproducidos de forma legal  no terminen ilegalmente en un canal de distribución como los torrents. Segundo, ser claros que no se busca sacar provecho del contenido en sí, de la forma de expresión contenida en cada documento (y que es la base de protección del derecho de autor a nivel internacional). Lo que importa en el minado es la acumulación de datos, las cadenas alfanuméricas posibles de ser estudiadas a través de programas informáticos,  en un plano donde se asume (se debate) que esta acumulación no es susceptible de ser protegido por derechos de autor. Entonces, antes que suscribir nuevas licencias, lo que se debe imponer es el derecho a minar, si es que ya se cuenta con el derecho a acceder.

Con el nuevo estatuto que entró en vigencia en el Reino Unido, ¿en qué situaciones se puede minar sin cometer infracciones?

La norma menciona que no hay infracción cuando la copia de una obra es realizada para que una persona (con acceso lícito a la obra) pueda llevar a cabo un análisis computacional de cualquier elemento del ejemplar. Asimismo, el minado debe ser realizado con fines de investigación y sin que haya una motivación comercial. Es decir, este tipo de actividades estará permitido para un académico pero no para una persona que trabaja en el sector empresarial, salvo que tenga el permiso o la licencia respectiva.

Vemos que es indispensable que no haya una intención de lucro en la actividad, pese a lo expresado en su momento por el Open Science Working Group.  Esta asociación alegó, durante el proceso de consulta de la reforma, que restringir este tipo de análisis solo hacia contextos no comerciales era contraproducente, ya que se se duplican esfuerzos de forma ineficiente, en relación a las investigaciones que se realizan a nivel industrial.

El estatuto también ofrece parámetros sobre lo que no se puede hacer con las copias objeto del análisis masivo. Así, no se les puede transferir a otra persona. ni usar para otro objetivo salvo el examen computacional. Estos actos solo serán legales en caso haya permiso de los creadores de las obras.

A su vez, en línea con la imposibilidad de transferir las copias sin permiso, la norma es clara en señalar que las copias ofrecidas, vendidas o alquiladas configuran una situación de infracción y sujeta a sanción.

Finalmente, hay una aclaración con respecto a las licencias. Los acuerdos entre los proveedores y compradores a través de esta vía no podrán prevenir o restringir las situaciones de excepción contempladas en el nuevo estatuto. Así, si una red de bibliotecas académicas decide acceder a través de licencias a una base de datos de revistas académicas, este acuerdo no debería imposibilitar (ni legal ni técnicamente) que alguna persona pueda acceder a la API respectiva y copiar la información que se desea analizar de forma masiva, en la medida que se cumplan con las nuevas excepciones publicadas.

Va a ser interesante seguir los efectos de la ley. Sobretodo observar cómo los actores en el ecosistema británico de la comunicación científica van a adaptarse o reaccionar.  No olvidando tampoco que va a ser una referencia a nivel internacional, tanto para el proceso de reforma a la legislación de derechos de autor a nivel Europa, como para la reflexión sobre las nuevas posibilidades de hacer investigación en el hemisferio sur.

Referencias adicionales

La guía con los cambios que proceden desde el 01 de junio / UK Intellectual Property Office

Data mining in UK higher education institutions: law and policy / Andres Guadamuz; Diane Cabell. Link

Peter Murray-Rust es un científico y activista pro la minería de datos. Mucho del contenido de su blog está relacionado a la temática. [Actualizado]

 

Anuncios
Etiquetado , , ,

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: