Soutenez
le Trésor national
Formulario de búsqueda

Para los profesionales

Depósito legal digital: cuatro preguntas sobre el Archivo de las páginas web en la BnF

¿Por qué archivar las páginas web?

Porque es necesario conservar esta nueva forma de comunicación, que actualmente está presente en todas las áreas del conocimiento y en todas las partes de la sociedad.

E-administración, artes digitales, publicaciones en línea, e-learning, comercio electrónico, exposiciones virtuales y bibliotecas digitales, blogs y nuevos espacios públicos dedicados a la discusión y chat… Muchas actividades se han desplazado al web y se han creado otras nuevas. Con más de 30 millones de usuarios de Internet y un número creciente de páginas web francesas, finalmente Francia ha entrado en la Sociedad de la Información y las instituciones patrimoniales deben hacer frente a esta nueva realidad.

Porque archivando el Web mediante el depósito legal se amplia la misión histórica de la recopilación del patrimonio cultural francés.

El depósito legal es la obligación legal para cada editor, impresor, productor, distribuidor o importador de documentos, de depositar copias de todos los materiales publicados en las instituciones autorizadas. El depósito legal fue originalmente promulgado en 1537 para los libros impresos y se amplió progresivamente a todo tipo de materiales de expresión y creación, incluyendo nuevas tecnologías como las que aparecieron en Francia. Después de los libros, los grabados, las partituras musicales, las fotografías, los pósters, los documentos audiovisuales y multimedia, ha llegado el momento de archivar también las páginas web.

Porque el depósito legal de las páginas web es una obligación legal.

El código del patrimonio francés (Code du patrimoine) ahora incorpora la ley DADVSI de las siglas en francés de Derechos de autor y derechos relacionados, en la sociedad de la información (Droit d’auteur et droits voisins dans la société de l’information - loi 2006-961) oficialmente publicada el 3 de agosto de 2006. El capítulo III (artículos L131-1 a L133-1) establece oficialmente el depósito legal del web.

Esta ley:

  • amplia el depósito legal para Internet en los siguientes términos: “queda sujeto a depósito legal todo signo, señal, escritura, imagen, sonido o mensaje de cualquier tipo comunicado al público mediante canales electrónicos” (cláusula 39). La ley se aplica a todos los tipos de “publicaciones electrónicas en línea” constituidas por un conjunto de signos, señales, imágenes, sonidos o cualquier tipo de mensaje, mientras estén públicamente disponibles en Internet. En esta definición se incluyen no sólo las páginas web sino también los boletines informativos y los medios de comunicación audiovisual.
  • especifica las estrategias de recopilación: el depósito legal de Internet de la BnF da prioridad a la recolección automática masiva mediante crawlers (rastreadores de web): “Las instituciones autorizadas pueden recoger material de Internet mediante técnicas automáticas o mediante el establecimiento, junto con los productores, de acuerdos específicos y procedimientos de depósito”. La ley también estipula que los productores no pueden usar ningún obstáculo como login, contraseña u otra forma de restricción del acceso para restringir este proceso.
  • define el reparto de responsabilidades del depósito web entre las instituciones autorizadas: El INA (el instituto nacional de radio y televisión, que es el responsable de preservar el patrimonio audiovisual en Francia) recogerá las páginas web relacionadas con las comunicaciones audiovisuales (principalmente radio y televisión) y la BnF todas las otras páginas web. Un decreto publicado en diciembre de 2012 especifica los procedimientos de selección y de comunicación para las colecciones de archivos web.

¿Quién está implicado?

Cualquiera que produzca o publique material en línea, a fin de comunicar con el público mediante canales electrónicos, está obligado a realizar el depósito legal. La ley se ha aplicado a todos aquellos que tengan alguna conexión con el territorio nacional –esto siempre ha sido así para otros tipos de documentos: la Bibliothèque nationale de France recopila “todo lo publicado (o importado) en Francia”.

A diferencia de lo que se hace para otros materiales, la ley no utilizará ningún procedimiento especial para los productores porque el depósito legal de las páginas web será gestionado esencialmente mediante técnicas de recolección automática controladas por las instituciones autorizadas. La única obligación del productor será proporcionar, cuando la Bibliothèque lo requiera, los códigos de acceso e información técnica si la recolección automática ha fallado. También puede llevarse a cabo un procedimiento de depósito específico a petición de la BnF en aquellos casos en los que la arquitectura de la página web seleccionada o el formato de los datos usado no sea compatible con la recolección automática.

¿Cómo funciona?

El tamaño del web es exponencial: es imposible aspirar a la exhaustividad, ni realizar una selección manual de las páginas. Para responder totalmente, pero pragmáticamente, a los retos planteados por el depósito legal del web, la Bibliothèque ha elegido combinar dos métodos de recogida complementarios:

recolección automática masiva de las páginas web francesas

La recolección masiva se realiza mediante robots. En el pasado la BnF trabajó en colaboración con el Archivo de Internet (AI) para la recogida de cinco años de “snapshots” (capturas de pantalla) de páginas web, empezando en 2004. También se adquirieron colecciones históricas de snapshots desde 1995 hasta 2004.

En 2010, los procedimientos de recolección masiva fueron realizados por la propia BnF, con el propósito constante de proporcionar una mejor cobertura a las páginas de dominio francés de gran magnitud.

focused crawls

La recolección de información sobre un tema específico se basa en una selección de páginas web realizada por bibliotecarios de referencia de la BnF. Los rastreadores de web focalizados (focused crawls) pueden basarse en un acontecimiento (se han cubierto las elecciones francesas de 2002, 2004 y 2007, así como las elecciones europeas de 2009) o en un tema dado (blogs, desarrollo sostenible, activismo web,…).

¿Quién puede acceder a los archivos?

Pueden acceder a los archivos web los usuarios autorizados de la BnF, sólo en las salas de lectura de la biblioteca de investigación (bibliothèque de Recherche). Esta restricción es la misma que se aplica a todos los fondos del depósito legal. A partir del 22 de junio de 2009, la BnF ofrece 350 ordenadores para consultar sus archivos web a través de todos sus emplazamientos, en París y en Aviñón.

lunes 20 de agosto de 2012

Contacto

Departamento de Depósito Legal
Equipo Depósito legal digital
Correo electrónico : depot.legal.web@bnf.fr
Partagez