Elea Giménez Toledo
Ana del Arco Blanco
Digitalización de editoriales académicas
Políticas científicas e investigación
Esta guía pretende mostrar la mayor parte de las cuestiones que atañen a la digitalización en el marco de las editoriales académicas, muy especialmente aquellas relacionadas con el entorno de la investigación y sus políticas. Desde los aspectos más sencillos a los más sofisticados, desde los más conocidos a los menos, desde los más fáciles de desarrollar a los más costosos o complicados. Por ello, también sirve para descubrir todo lo que implica una verdadera transformación digital, los retos que conlleva, así como las posibilidades que ofrece. Y así la guía irá descubriendo en mayor o menor grado a las editoriales, dependiendo de su adentramiento previo en la digitalización, campos, siglas, proyectos, quizá desconocidos pero que ya forman parte del ecosistema de la edición académica y de los que es difícil deslindarse.
Aunque se abordan muchos elementos que conciernen a la digitalización, la guía se detiene especialmente en aquellos aspectos vinculados a aspectos que están más alejados del día a día del editor como son: a) la visibilidad de las editoriales en sistemas de información científica y plataformas relevantes para la academia de hoy; b) las políticas científicas nacionales e internacionales que afectan directamente a la actividad editorial; c) aspectos relacionados con el alcance, la interoperabilidad, la accesibilidad, el uso y el impacto de los libros académicos; d) los criterios de evaluación de la actividad científica que, igualmente, tienen repercusiones sobre lo que se exige a las editoriales. En definitiva, este documento pretende dar luz y hacer más sólidos los vínculos entre la edición académica y la «nueva academia», fijando la atención en aquellos aspectos relativos a la digitalización.
La guía se ha redactado pensando especialmente en editoriales académicas del ámbito iberoamericano. Aunque la conformación del sector editorial académico en cada país de la región es diferente, tal y como está mostrando el proyecto Cartografía de la edición académica iberoamericana[1], el conjunto de editoriales académicas de la región comparte algunas características. En la mayor parte de los casos son editoriales pequeñas y medianas las que desarrollan catálogos de libros académicos y las que, por tanto, publican la ciencia que se produce en la región en forma de libro. Cumplen así una función fundamental, pero tienen debilidades estructurales que, en muchas ocasiones, les hace difícil afrontar una transformación digital profunda.
Publican mayoritariamente en español y en portugués, aunque también en otras lenguas sin tantos hablantes nativos, pero muy necesarias en la comunicación de la ciencia, especialmente en la transferencia de resultados hacia los entornos más cercanos.
Potencialmente tienen un mercado común muy interesante y relevante, el que atañe a la circulación del libro académico en la región. El hecho de compartir idioma e intereses científicos y culturales constituye un pilar muy sólido para construir un mercado fuerte. En el proceso es clave la digitalización. Pensar en este mercado iberoamericano del libro o en la circulación del conocimiento científico en la región requiere de un conocimiento detallado de la edición académica en el conjunto de países, algo en lo que se está avanzando en el citado proyecto de Cartografía de la edición académica iberoamericana. También requiere un análisis global por parte de las instituciones del libro y también de la gestión de la ciencia. Crear ese mercado implica estrategias globales y para ello no solo es necesaria la disposición de las editoriales a la transformación digital sino también una acción conjunta regional para invertir en digitalización, teniendo en cuenta las políticas científicas y el estado de la edición académica internacional. Además, esta acción colectiva tendría efectos muy positivos sobre el español y el portugués como lenguas de comunicación científica, entendidas como lenguas globales. Por supuesto que también repercutiría positivamente sobre lenguas que se hablan y en las que se escriben en la región. ES CIENCIA, Plataforma Temática Interdisciplinar del CSIC, tiene como objetivo el fortalecimiento del español como lengua de comunicación científica valiéndose para ello de la investigación interdisciplinar y del trabajo conjunto y de transferencia con instituciones, asociaciones y empresas.
Desde el punto de vista metodológico, la elaboración de este informe/guía ha implicado la revisión sistemática de las directrices de política científica y los planes de investigación; la revisión de literatura científica, técnica y profesional para la identificación de los distintos aspectos que conciernen a la digitalización; el diálogo e intercambio de conocimientos con editores, gestores de política científica y también de plataformas de libros académicos y/o ciencia abierta, con responsables de políticas del libro y de instituciones con responsabilidades en política lingüística. En la parte más novedosa, la referida a explotación de los corpus textuales y de posicionamiento de información en abierto en infraestructuras de información científica, se ha colaborado con el grupo Ontology Engineering Group de la Universidad Politécnica de Madrid, así como con el Instituto de Física de Cantabria[2], para la exploración de las técnicas que utilizan en el campo editorial.
La guía está estructurada en los distintos bloques o acciones de digitalización a los que una editorial puede atender. Como se apuntaba en párrafos anteriores, se presta especial atención a los asuntos de la digitalización más vinculados con la política científica, las infraestructuras de información científica y las nuevas coordenadas de la evaluación científica por ser, quizá, las más desconocidas en el entorno editorial y, sin embargo, las que tienen implicaciones muy directas sobre el sector. Adicionalmente a esta guía puede consultarte y difundirse (en virtud de la licencia Creative Commons que tiene) la infografía Digitalización en editoriales académicas. 24 líneas de acción para pequeñas, medianas y grandes editoriales[3].
La relación entre política científica, financiación de la investigación y edición académica es estrecha. La actividad editorial en la academia no está —o no debe estar— desvinculada de las directrices en política científica. La relación entre ambos ámbitos no tiene que ver con los contenidos o las políticas editoriales sino, más bien, con los modelos de negocio y/o publicación de los contenidos científicos.
Aunque se tienda a pensar que los planes de investigación o los esquemas de financiación previstos para desarrollarla son independientes de la edición o solo afectan a las revistas científicas, lo cierto es que también afecta a las editoriales que publican libros académicos. No hay más que atender a los movimientos de los gigantes de la edición académica internacional para darse cuenta de su adaptación constante a lo que sucede en el entorno en el que desarrollan su actividad que no es otro que el académico. Centros de investigación y universidades; autoras y autores académicos; políticas de investigación, financiación, marcos normativos que guían la investigación que se realiza; agencias de evaluación y evaluadores, etc.: todos forman parte de un sistema en el que la edición está inserta y, por tanto, con el que debe haber una interacción directa.
En el momento de elaborar este informe, son ineludibles algunas referencias el marco europeo relativo a la investigación, a la digitalización y, por tanto, a la edición académica. Todas ellas presentan contenidos relevantes que marcarán o afectarán el devenir de la edición académica.
La Estrategia Digital Europea 2021-2027[4] está encaminada a afrontar la transformación digital de las empresas y de la administración como uno de los ejes que afecta al desarrollo y a nuestra vida diaria. Se invertirán 7,5 billones de euros en computación de alto rendimiento, inteligencia artificial, ciberseguridad,
habilidades digitales avanzadas y en el uso extendido de tecnologías avanzadas en la sociedad. En ese marco de financiación, la atención a pequeñas y medianas empresas, la investigación, la educación y la cultura, tienen perfecta cabida, por lo que representa una oportunidad para la transformación digital también de las editoriales académicas.
El programa de investigación europeo para 2021-2017, Horizon Europe, y todos sus documentos asociados[5], se refieren con bastante detalle a las acciones de difusión, explotación y comunicación de resultados de investigación financiados con fondos europeos. Se pretende que la investigación tenga un impacto no solo científico, sino también social y económico, y se establecen caminos para ellos.
El impulso decidido a la ciencia abierta y al acceso abierto[6] es una seña de identidad de este programa marco de investigación y tiene indudables efectos sobre la edición académica. Los artículos y libros generados en los proyectos financiados deben ser publicados en acceso abierto y de forma inmediata (sin periodos de embargo). También los datos producidos en el transcurso de las investigaciones deben ser accesibles para todos, siguiendo además los principios FAIR (Findable, Accesible, Interoperable and Reusable): deben ser recuperables, accesibles, interoperables y reutilizables y, desde luego, teniendo en cuenta la Directiva Europea (UE) 2019/1024 del Parlamento Europeo y del Consejo de 20 de junio de 2019
relativa a los datos abiertos y la reutilización de la información del sector público[7].
Investigar en el marco de la Ciencia Abierta implica nuevas prácticas, más allá de la publicación de resultados y datos en abierto. Supone utilizar infraestructuras abiertas para visibilizar e intercambiar información, aplicar procedimientos de revisión en abierto en los procesos editoriales (open peer review), asegurar la reproducibilidad de los resultados y abrir la colaboración no solo entre científicos sino también involucrando a instituciones y a la sociedad en general.
La Ciencia Abierta y su estrecho vínculo con la investigación responsable —otro concepto esencial en Horizon Europe— crean un entorno nuevo para la investigación, nuevas dinámicas más transparentes, abiertas, colaborativas y con más posibilidades para que la tecnología ayude mucho más en el avance de la ciencia. La Ciencia Abierta cambiará la manera de publicar. De hecho, ya está modificando todo el sistema de publicación científica. Baste mencionar cinco señales inequívocas:
1.El Plan S, iniciativa de un conjunto de agencias financiadoras de la investigación, junto con la Comisión Europea y el Consejo Europeo de Investigación, se inició en 2018 para hacer realidad la publicación en abierto de los resultados financiados con fondos públicos en 2021. Se establecieron 10 principios[8] para lograrlo, inicialmente referidos a revistas. Uno de ellos explicita que no se apoya el modelo híbrido de publicación, es decir, aquél seguido por algunas revistas en el que algunos artículos son accesibles mediante un modelo de suscripción y otros son de acceso abierto por el pago que hacen los autores o instituciones a determinadas revistas. Solo se admitirá en este periodo de transición. En 2021, el Plan S emitió una declaración en relación con el acceso abierto para los libros académicos[9]. Establece cinco principios: a. los libros que sean resultado de la investigación financiada por las instituciones que impulsan el Plan S deben publicarse en abierto; b. los autores y las instituciones deben retener los derechos de propiedad intelectual adecuados para poder publicar el libro en acceso abierto y hacer reutilizables sus contenidos; c. los libros deben ser publicados bajo una licencia Creative Commons; d. si existe periodo de embargo (el tiempo que transcurre desde que se publica una obra hasta que se hace disponible en abierto) no debe superar los doce meses; y e. se apoyará la publicación de libros en abierto siguiendo los esquemas de financiación previstos por el conjunto de agencias que promueven el Plan S.
2.Los grandes sellos académicos internacionales llevan desarrollando durante años programas específicos de publicación en abierto, tanto de revistas como de libros[10]. Lejos de reducir sus beneficios por la adopción del acceso abierto, sus posiciones en el mercado son de las más destacadas de la industria editorial mundial. El informe The Global 50 World Ranking of the Publishing Industry 2021[11] situa a RELX Group
(Reed Elsevier), Thomson Reuters, Pearson, Wolters Kluwer, Springer Nature, Wiley y McGraw Hill entre las primeras por beneficios obtenidos. Habitualmente basan la sostenibilidad del acceso abierto en el pago que los autores o instituciones hacen para publicar en abierto sus artículos o libros. Las tasas que se pagan reciben el nombre de Book Processing Charges (BPC) o APC (Article Processing Charges).
3.La Comisión Europea ha creado la plataforma de publicación Open Research Europe como un modelo innovador de publicación en abierto que dé una opción a los investigadores de cumplir con los requisitos de publicación en abierto de Horizon Europe y que no suponga el pago por publicación a las editoriales. La sostenibilidad de la publicación en abierto lleva años debatiéndose y el pago por publicación a las editoriales no parece ser una fórmula sostenible ni igualitaria.
4.Asimismo, la Comisión Europea tiene entre sus objetivos el desarrollo y la consolidación de la Nube Europea de Ciencia Abierta (European Open Science Cloud), infraestructura para alojar, intercambiar y trabajar con datos procedentes de la investigación financiada con fondos públicos.
5.Los sistemas de evaluación, en revisión, que están en proceso de adaptación a la nueva política científica para estimular y consolidar las prácticas de la ciencia abierta. Ello implica apostar por nuevas métricas y no basar la evaluación únicamente en indicadores como el factor de impacto que presentan limitaciones y que, por otra parte, provienen de fuentes «cerradas» o accesibles solo bajo suscripción.
Lo que está sucediendo en el contexto internacional de la investigación y de la edición académica no debería pasar desapercibido para las editoriales iberoamericanas. Tanto la Ciencia Abierta como el Acceso Abierto van mucho más allá de Europa. En el caso de España, la política científica está alineada a la europea, por lo que muchas de las cuestiones tratadas en los párrafos anteriores ya están presentes en el Plan Estatal de Investigación Científica, Técnica y de Innovación (2021-2023) o en las convocatorias de proyectos y, probablemente, lo estarán en la nueva Ley de la Ciencia que se está gestando.
Quizá algunas de estas ideas, acciones o políticas resulten extrañas o lejanas a las editoriales académicas del conjunto de países de la región. Pudiera parecer que todos estos cambios en el contexto de la investigación científica afectaran solo a las revistas científicas, pero no. Afecta a la publicación académica en su conjunto[12] y, desde luego, a las editoriales que publican libros académicos (véase figura 1). Los profesores e investigadores son quienes nutren, en buena parte, los catálogos de las editoriales académicas; el sistema en el que trabajan está marcando unas directrices de publicación y el tercer gran elemento del sistema, las editoriales, deberán responder en consecuencia. Se trata de que el sistema en su conjunto esté armonizado, aunque siempre es difícil lograr el equilibrio. Esta adaptación a los requerimientos de la política científica no es igual, ni mucho menos, para las grandes editoriales que para las pequeñas. Las grandes empresas editoriales permanecen en alerta a cualquier cambio en el sistema de investigación, en la política científica, en los sistemas bibliotecarios de cada país, incluso en el terreno de la evaluación de la ciencia. Ahí desarrollan su negocio y, por ello, reaccionan de manera inmediata. Desde el trabajo temprano con XML y sistemas de gestión de contenidos para estar de manera rotunda en el entorno digital, hasta los acuerdos transformativos firmados con instituciones académicas, pasando por la adopción de modelos de publicación en abierto de libros y revistas, la creación, uso de métricas alternativas a las tradicionales, herramientas útiles para los investigadores incorporadas a sus plataformas de venta y acceso a contenidos o acciones de marketing digital.
Figura 1. Engranaje del sistema de investigación y publicación científica
Ese conjunto de editoriales tiene un perfil muy diferenciado en cuanto a lo que publica —temas internacionales, publicados en inglés y con públicos amplios— y los medios utilizados para ello —la transformación digital es plena e incesante—. Pero en el mismo ámbito, en la edición académica, existe otra realidad sobre la que hay que focalizar la atención. Se trata de las pequeñas y medianas editoriales académicas de cada país, tanto universitarias como privadas/comerciales o institucionales, que desarrollan catálogos de libros académicos, sobre temas muy diversos, de interés local, regional y también internacional, esenciales para garantizar la pluralidad temática y de enfoques. Publican en los idiomas de cada región o país y son puentes entre ciencia y sociedad, llevando los resultados de la investigación a aquellos lectores que quieren y necesitan conocerlos para el desarrollo de su actividad. En ese sentido, representan una pieza fundamental en lo que se denomina impacto social de la ciencia. Por otro lado, en regiones como la iberoamericana, que comparte idiomas globales como el español o el portugués, estas editoriales componen la estructura para fortalecer tales idiomas en la comunicación de la ciencia. Así lo recoge uno de los tres principios de la Iniciativa Helsinki sobre la comunicación científica[13].
Precisamente por todo lo que representan estas pequeñas y medianas editoriales de cada país, el reto de su transformación digital, en línea también con la política científica, es urgente y crítico. El conocimiento que vamos teniendo del sector editorial académico de libros en Iberoamérica gracias a los estudios realizados con la Federación del Gremio de Editores de España y con el apoyo del Ministerio de Cultura y Deporte[14], con la Unión de Editoriales Universitarias Españolas (UNE)[15] y a raíz del proyecto de Cartografía de la edición académica iberoamericana[16] permite identificar más de 470 editoriales universitarias y un número equiparable de editoriales privadas e institucionales que, cumpliendo con esas funciones señaladas, tienen dificultades para afrontar una transformación digital íntegra. Muchas han podido iniciar acciones relacionadas con sus páginas web, la comercialización en plataformas, el trabajo con metadatos o la impresión bajo demanda, aunque eso representa solo un estadio en la digitalización. La mayor parte de la publicación de libros académicos se difunde en pdf[17] y no está estructurada, está basada en muchos procesos manuales y no es legible por las máquinas, lo que representa limitaciones en la visibilidad, en el posicionamiento en buscadores, en la posibilidad de hacer seguimiento sobre el impacto de los libros, en la obtención de métricas y un largo etcétera. Las características de la digitalización en la edición académica de la región, están alejadas aún de lo que la política científica está fomentado con respecto a los libros de ciencia. Por ello, resulta muy importante subrayar algunas cuestiones:
•Las pequeñas y medianas editoriales académicas representan la bibliodiversidad académica. Por sí solas no van a poder afrontar transformaciones digitales integrales. Ello requiere que desde las instituciones que tienen competencias en políticas del libro en la región se afronte la cuestión y se invierta, en consecuencia, en la transformación digital de las editoriales.
•Los marcos de investigación vigentes y las políticas de ciencia que los inspiran no son ajenos a la actividad editorial. Al contrario, son ámbitos que requieren estar conectados. No se trata de que las editoriales académicas de la región renuncien a sus proyectos, a sus enfoques o a su independencia sino, más bien, de que desarrollen su actividad con una mirada al sistema de investigación y a las directrices que afectan más directamente a la publicación científica.
•La tendencia a la digitalización en todos los ámbitos es imparable. Para la edición académica es crítica porque tanto el entorno digital como el de la investigación evolucionan muy rápidamente en lo que afecta a contenidos científicos. Perder la oportunidad de dar el salto hacia lo digital implica no solo perder mercados potenciales sino también agrandar las distancias con los sellos que sí están ocupando el entorno digital.
•Desde el punto de vista de la ciencia que se hace en la región y en nuestros idiomas, es importante destacar que la fortaleza de ambas —nuestra investigación y nuestras lenguas— pasa en estos momentos por la transformación digital, la presencia de los contenidos científicos (producción editorial académica) en buscadores, plataformas e infraestructuras de información científica y por la participación en proyectos internacionales que integren y visibilicen la ciencia publicada en forma de libros.
La producción en formato digital es quizá uno de los primeros pasos de las editoriales en el campo de la digitalización. Producir estos formatos implica abrir un mercado diferente, dar respuesta a la demanda de libro electrónico y, desde luego, llegar a lugares a los que el libro impreso tiene un acceso más dificultoso (véase también la sección Impresión bajo demanda). En el artículo anexo a esta guía, se muestra cómo el 63% de las editoriales analizadas ofrecían en 2020 algún tipo de formato digital.
Gran parte de las plataformas que comercializan libros, incluyendo aquí los sitios web de las editoriales preparadas para la compra electrónica, así como los sistemas de información científica y bibliotecas académicas ofrecen los libros en los formatos digitales producidos por las editoriales.
La elección de un formato u otro dependerá de las herramientas al alcance, los costes de producción o los conocimientos del editor, pero no es indiferente a la experiencia del usuario ni al entorno digital. Además de las diferencias que pueda haber en la legibilidad de estos formatos en tabletas, móviles, ordenadores u otros dispositivos, es necesario considerar las propiedades de cada formato en el entorno digital. Algunos de ellos están especialmente previstos para ser legibles por máquinas, lo que multiplica sus posibilidades de aparecer en buscadores, sistemas de información científica o plataformas utilizados por los académicos.
Los formatos más comunes son PDF (Portable Document Format) y ePUB (Electronic Publication). El primero está especialmente diseñado para la reproducción de textos en su formato original y para su impresión en papel. Es el formato mayoritariamente adoptado por los editores académicos a pesar de sus limitaciones para interactuar en el entorno digital, es decir, para ser legible por las máquinas y multiplicar sus posibilidades de ser descubierto. ePUB es un formato bastante extendido también en la edición académica, específico para la lectura de libros utilizando software y dispositivos móviles.
Existen otros formatos como Fixed Layout, Mobipoket y KF8 o iBooksAuthor. Sin embargo, no son muy habituales en la edición académica. Finalmente cabe mencionar los audiolibros, usualmente en formatos MP3, FLAC y WAV. Los audiolibros experimentan un auge para géneros de ficción fundamentalmente y son comercializados por empresas como Storytel, Audible (Amazon), Scribd, Sonolibro o Audioteka. En el ámbito académico son realmente escasos, pero algunas editoriales como la Universidad de Navarra[18] o la Universitat Oberta de Catalunya[19] ya han probado suerte en este terreno.
Por otro lado, es preciso hablar de los lenguajes de marcado, que se relacionan más con la automatización de los procesos editoriales y la agregación de valor al contenido. HTML (Hyper Text Markup Language) es un lenguaje especialmente diseñado para la presentación de contenidos en la web, mientras que XML (Extensible Markup Language) es un potente lenguaje de marcado, utilizado por las grandes editoriales académicas y con posibilidades muy interesantes para la edición si se utiliza desde el comienzo del proceso editorial.
Tal y como apuntan algunos expertos, lo ideal y más eficiente en el proceso editorial es trabajar con algún lenguaje de marcado, y muy especialmente con XML, para generar posteriormente otros formatos como pdf o epub. La utilización de lenguajes de marcado desde el inicio del proceso —la aceptación de un original para su publicación—es habitual en grandes sellos académicos internacionales muy bien posicionados en el mercado. Sin embargo, es prácticamente inexistente en editoriales académicas iberoamericanas, donde predomina la publicación no estructurada y difundida en pdf, con mucho trabajo manual en el proceso editorial y con publicaciones que no son legibles para las máquinas.
En la edición académica iberoamericana predominan las pequeñas y medianas editoriales, con limitaciones para afrontar procesos profundos de transformación digital. Hecho al que habría que atender desde las políticas públicas de cada país de la región para que los contenidos científicos en español publicados en forma de libro pudieran competir en el entorno digital. Apoyar la transformación digital de las editoriales iberoamericanas es, sin duda, un modo de defensa del español, el portugués y otras lenguas de la región en la ciencia. No afrontar esa transformación aleja a la edición iberoamericana de lo que se plantea en la actualidad la política científica europea en cuanto a presencia digital y en abierto, no solo de las publicaciones científicas sino de los datos generados en investigación. Por tanto, parece claro que el salto ha de darse lo antes posible.
Adoptar lenguajes como XML en el trabajo editorial implica un cambio profundo en las maneras de trabajar de la edición tradicional. Cambian las herramientas, las técnicas y la propia filosofía del trabajo, pues el objeto central no es tanto el libro como el contenido. Aunque la editorial produzca libros igualmente, el contenido es el objeto de tratamiento y puede dar lugar a muchos otros productos para la difusión y el marketing, obras derivadas, extractos para bases de datos u otro tipo de metadatos. Es decir, permite múltiples usos para el mismo contenido y agrega valor a todo el proceso editorial. Un archivo XML es legible para los humanos pero también para las máquinas, lo que garantiza una extraordinaria visibilidad y un mejor posicionamiento de los contenidos en el entorno digital. La figura 2, de la empresa Publicaciones Académicas, muestra cómo el contenido —los libros— van incrementando su valor con la automatización de los procesos y el etiquetado semántico que lleva aparejado.
Figura 2. Valor agregado en las publicaciones con el etiquetado semántico y la automatización. Basada en una presentación de Oxford University Press.
Bases de datos de literatura científica tan potentes como Dimensions indexan libros[20] y capítulos de libros si tienen DOIs registrados en Crossref y si están marcados con XML BITS (Book Interchange Tag Set: JATS Extension). Son condiciones indispensables para aparecer en la base de datos y, por tanto, para ser vistos por la gran cantidad de usuarios de esta base, para que los contenidos se interconecten con otros dentro de la base de datos o para poder obtener métricas.
Por otro lado, sistemas como DILVE, para la distribución y comercialización del libro, recomiendan la carga de datos desde XML como procedimiento más flexible y eficiente.
El trabajo con XML representa otra dimensión para la edición. Su adopción requiere recursos, formación o reciclaje del personal de la editorial o incluso nuevos perfiles profesionales. También, desde luego, un cambio en la cultura de trabajo y una visión ambiciosa de la propia editorial.
Un aspecto básico de la digitalización está relacionado con la automatización de los procesos editoriales. Los programas de gestión editorial o los gestores de contenidos (Content Management Systems) son herramientas esenciales en todas las fases del proceso editorial desde la recepción de un original hasta más allá de su publicación. El proyecto de publicación, la planificación, la edición, el etiquetado de los contenidos, la publicación o la interacción social o comunicación son etapas que pueden gestionarse desde estos programas. También integran la gestión económica y financiera, la liquidación de derechos y facturación. Algunos de estos programas permiten integrar también el desarrollo de sitios web de las editoriales para la venta de libros. Permiten una mejor organización del trabajo, eficiencia en los procesos, seguimiento de los mismos y agilidad en el flujo editorial.
Los metadatos son informaciones clave de los libros que sirven para su visibilización, difusión, comercialización e intercambio de datos entre sistemas de información de distinto tipo, entre ellos distribuidoras, librerías, bibliotecas o plataformas de información científica. El concepto de metadato lleva implícita la noción de normalización, es decir, se siguen ciertos estándares internacionales para la asignación de metadatos a cada libro y que son necesarios para que las máquinas se entiendan entre sí, es decir, para que puedan intercambiar información. Estos estándares pueden venir dados por el sistema que los gestione (ej. ONIX) o pueden referirse a las clasificaciones empleadas para asignar metadatos (ej. THEMA como clasificación temática de la industria editorial). Además, cada vez es más frecuente que las editoriales trabajen con protocolos abiertos como OAI PMH (Open Archives Initiative — Protocol for Metadata Harvesting) para que los sistemas de información puedan acceder a los metadatos de los libros publicados por esa editorial. Permitir la salida de esos datos, haciéndolos interoperables, implica mayores posibilidades de hacer visible la producción editorial.
Los metadatos e imágenes de los libros tienen un valor fundamental para la difusión y las ventas de los libros en el entorno digital. Por ello han de ser un foco de atención importante para los editores y han de trabajarse con cuidado. De una buena gestión y asignación de metadatos depende que los libros se vean, se ubiquen bien en librerías o aparezcan bien entre los resultados de buscadores.
En los estudios realizados sobre el sector editorial español (Giménez Toledo y Mañana Rodríguez, 2016; Giménez Toledo, 2017; Giménez Toledo, 2019) y en la Cartografía de la edición académica iberoamericana[21] (Giménez Toledo y Giraldo, 2021; Giraldo, Giménez Toledo y Córdoba Restrepo, 2021) queda patente que la asignación de los metadatos de materia no es siempre la más adecuada,
produciéndose clasificaciones inexactas, demasiados genéricas, imprecisas, etc. No siempre se dedica la atención suficiente a esta tarea técnica que, sin embargo, tiene repercusiones tan serias sobre la visibilidad y la venta de los libros. Precisamente por la relevancia que tiene, DILVE puso en marcha un Plan de Calidad de Metadatos[22] que tiene como objetivo «dotar a las editoriales participantes en DILVE de la formación y de las herramientas que les permitan mejorar la calidad de la información de sus catálogos y, por tanto, de la información que circula en la cadena comercial».
A menudo se lee que los metadatos reemplazan al libro en el entorno digital. El usuario, lector, bibliotecario no puede explorar físicamente el libro cuando está navegando e identificar así la información que busca, pero los metadatos le permiten conocer casi todo de un libro.
Siendo un elemento clave en la visibilidad y comercialización del libro, no es de extrañar que sean uno de los aspectos que forman parte del sello de calidad para colecciones CEA APQ[23] (UNE/ANECA/FECYT). Concretamente, en la evaluación para la concesión de este sello se consideran metadatos mínimos los autores/autoras, el título de la obra, la colección, el año, el ISBN, las materias IBIC o THEMA y la editorial.
La sección dedicada a los metadatos ha puesto de manifiesto lo esenciales que resultan para que la información de los libros publicados circule, esté bien visible en el entorno digital y llegue, por tanto, a casi cualquier lugar donde pudieran estar interesados en los libros que publica una editorial.
Las editoriales académicas de hoy deben atender y posicionar sus libros y sus correspondientes metadatos en una gran variedad de canales, plataformas, buscadores, servicios y sistemas de información. Todo ello como un proceso fundamental y coexistente a los espacios físicos en los que el libro es protagonista: librerías y bibliotecas. Limitándonos al entorno digital, allá donde un lector interesado en libro académico vaya a buscar información sobre libros, debe haber estado antes el editor con la información sobre sus libros (metafóricamente hablando porque la circulación de metadatos se produce como intercambio de información entre sistemas y gracias a los estándares).
Tratando de libros académicos, resulta muy relevante que aparezcan recogidos en bases de datos, catálogos de bibliotecas o plataformas que son específicas del ámbito académico y, por tanto, fuentes de información habitual para investigadores. No en todos los sistemas de información se puede entrar con la misma facilidad, ni todas tienen el mismo propósito o los mismos destinatarios.
Empezando por los más restrictivos, Book Citation Index (Clarivate Analitycs)[24] y Scopus[25] (Elsevier), como bases de datos internacionales de literatura científica que seleccionan según criterios exigentes las que consideran mejores editoriales académicas e indexan sus libros, colecciones y capítulos. Book Citation Index recoge en la actualidad 116.000 libros y registra un crecimiento anual de unos 10.000 títulos. Scopus recoge 240.000 y 1500 colecciones de libros académicos. Ambas bases de datos priorizan los libros en inglés, aunque incluyen algunos en otros idiomas si tienen metadatos en inglés. Esa característica en sus coberturas limita la visibilidad de los libros académicos en español y en otras lenguas distintas al inglés. También es cierto que para las editoriales de la región que logran entrar representa una posibilidad de proyección muy interesante hacia la academia internacional. Estar en estos sistemas implica, además, formar parte del corpus de documentos —libros y revistas— cuyas referencias son analizadas para determinar el impacto de unas obras en otras, el intercambio y la circulación de conocimientos, la influencia de un autor en otros, etc. Es decir, todo lo que permite un análisis sistemático de las referencias y citas en la literatura científica.
Ambas son bases de datos a las que se accede solo mediante suscripción y sus tarifas son cubiertas por las instituciones académicas o mediante licencias nacionales de acceso, como las que gestiona la Fundación Española para la Ciencia y la Tecnología (FECYT) en España, que posibilita el acceso desde universidades y centros de investigación. Son sistemas selectivos y cerrados, que construyen métricas utilizadas por distintos países e instituciones para la evaluación de sus científicos o unidades de investigación.
Las editoriales tienen también la oportunidad de hacer visibles sus libros en el entorno más académico en otras bases de datos bibliográficas, especializadas temáticamente, cuyo acceso depende del pago de una suscripción y, por ello, normalmente disponibles en bibliotecas universitarias o de centros de investigación. Aunque muchas cubren artículos de revista, algunas de ellas incluyen también libros. MLA Internacional Bibliography, Historical Abstract o Communication & Mass Media Complete son solo tres de estas bases de datos, cuyo acceso proporciona EBSCO[26], de consulta habitual para los investigadores de cada uno de esos campos. Que los libros de una editorial estén indexados en esas bases de datos representa la oportunidad se ser vistos, leídos, citados y recomendados por los académicos de la especialidad. Formar parte de esos sistemas implica en muchas ocasiones cumplir con algunos criterios de calidad y técnicos establecidos por quienes producen las bases de datos. Para un editor puede ser sumamente interesante conocer esos requisitos y, en caso de cumplirlos o poder trabajar para cumplirlos, solicitar su inclusión, explorando una vía adicional y muy interesante para la visibilidad de los libros.
Dimensions[27] es la gran base de datos de literatura científica abierta, con una amplísima cobertura y que interconecta los documentos —libros, revistas, informes, etc.— con informaciones relacionadas como las fuentes de financiación de las investigaciones, los autores, sus instituciones, las métricas alternativas, los impactos, etc. Está basado en fuentes abiertas lo que le permite un crecimiento continuado y una interconexión de las informaciones muy útiles tanto para los investigadores que buscan información como para los editores que pueden hacer un seguimiento muy detallado de su producción. Básicamente, el sistema extrae información de Crossref, que recoge la producción científica con DOI (véase el apartado dedicado a los identificadores digitales). Esto supone que las editoriales pueden entrar en el sistema[28] si están asignando identificadores digitales a sus libros y capítulos de libros y si están incorporando los metadatos como requiere el sistema incluyendo. El trabajo con XML BITS (Book Interchange Tag Set: JATS Extension) es otra condición indispensable para aparecer en la base de datos, para que los contenidos se interconecten con otros dentro de la base de datos y para poder obtener métricas. En el momento de redactar esta guía, 1 millón de libros son indexados por Dimensions.
En el registro tipo que muestra la figura 3 puede verse como para cada libro se ofrece información muy útil para investigadores y editores: información de sus autores y otras obras recogidas en la base de datos; las referencias incluidas en el libro y el enlace a las mismas, si están incluidas en Dimensions; distintos tipos de métricas basadas en citas y en métricas alternativas (ej. menciones en redes sociales), proporcionadas por Altmetrics, una herramienta asociada a Dimensions; y el acceso al libro en el sitio web del editor, ya sea a la versión digital para la compra, bien a la versión de acceso abierto, en caso de existir.
Quizá sea este el mejor ejemplo para mostrar las posibilidades que tienen las editoriales que estén trabajando con lenguajes
Figura 3. Registro tipo de una monografía en Dimensions de marcado como XML y con identificadores digitales tanto de contenidos como de autores. La proyección, la visibilidad o la influencia de las obras publicadas por una editorial puede verse tremendamente beneficiada al participar de sistemas abiertos y globales como este.
La visibilidad y descubribilidad de los libros está cada vez más basada en el etiquetado de los contenidos y la producción editorial, en los metadatos o en el uso de identificadores digitales. Sin esos elementos, la producción editorial más interesante puede pasar desapercibida en el entorno digital. Por el contrario, trabajar bien esas dimensiones de la digitalización implica legibilidad por parte de los sistemas que, a su vez, supone la circulación extensiva de la información de los libros.
Pensando en el buscador más utilizado del mundo, Google, y en el uso intensivo que tiene dentro de la academia, es obvio destacar el interés que las editoriales y sus libros deberían tener por aparecer en sus resultados de búsqueda. Para evaluar hasta qué punto es visible una editorial o un título, la editorial debe revisar cómo son los resultados de búsqueda que ofrecen los buscadores y preguntarse si el orden de los resultados es el más adecuado, si los títulos aparecen fácilmente entre los resultados o si es fácil acceder a la información sobre los mismos para conocerlos, acceder a ellos o comprarlos. El primer resultado debería ser la información del libro en la web de la editorial, algo que no siempre se da. Cada libro, ya sea impreso o digital (en venta o en abierto) debería ser encontrado por cualquier usuario cuando utilice un buscador. Y eso pasa por trabajar técnicamente con la descripción de los contenidos y siguiendo distintas rutas.
Se apuntaba antes que gran parte de los libros digitales publicados en Iberoamérica tienen formato PDF, que normalmente no son legibles por los buscadores, a no ser que se les incorporen metadatos. Para que los buscadores puedan recuperarlos es necesario transformarlos a PDF/A. En general, la asignación de metadatos completos y adecuados va a ser la clave para que los libros y sus informaciones relacionadas serán visibles y recuperables por los buscadores. Una recomendación habitual es pensar en posibles preguntas que los usuarios harían en un buscador para que, utilizando la descripción de los libros, el buscador lleve al usuario los contenidos que se le pueden ofrecer desde una editorial.
Hay algunos elementos del documento que son clave para poder recuperar adecuadamente su información a través de un buscador o de las grandes plataformas de venta de libros: el título, las palabras clave y el resumen. Trabajar en estos tres aspectos, como en el resto de metadatos, representa hoy una cuestión crítica por las características del entorno digital. Por ello conviene prestarles mucha atención desde el inicio del proceso y teniendo en cuenta que tiene implicaciones directas sobre la visibilidad, las ventas y las lecturas. Sobre los tres se suelen dar una serie de recomendaciones que, incorporadas a la práctica habitual de las editoriales, pueden suponer una mejora sustancial de la visibilidad. En las siguientes líneas se resumen algunas de ellas.
En relación con el título se recomienda que sean cortos y significativos, expresivos del contenido real del libro y sin circunloquios que sorteen la esencia del libro. Es importante pensar que los buscadores pueden acortar los títulos y/o mostrar solo una parte de los mismos. Lo mismo ocurre con los títulos de los capítulos que deberían ser identitarios por sí mismos, sin dependencia del título general del libro. Si los títulos son cortos, significativos y sustanciales, el posicionamiento de esos títulos será mejor por la ordenación por relevancia que suelen utilizar los buscadores. Esta recomendación entra en colisión con algunas prácticas habituales al titular los libros académicos, pues a menudo se utilizan títulos llamativos o literarios, seguidos de subtítulos explicativos del contenido.
En la elaboración de resúmenes, normalmente incorporados a las contracubiertas de los libros, también el comienzo es muy importante. Teniendo en cuenta que los buscadores como Google suelen mostrar los primeros 155 caracteres en los resultados de búsqueda, conviene iniciar los resúmenes con lo que represente lo sustancial del mismo o con las palabras que sean más importantes. De este modo, el resumen quedará bien posicionado y será visible de manera clara a los usuarios. También se recomienda no utilizar guiones, signos diacríticos o especiales, etc. para evitar problemas en la recuperación de información.
También es recomendable alternar las palabras que describan el contenido del libro. Si en el título aparece una palabra representativa del contenido se puede optar por utilizar otros sinónimos en el resumen y en las palabras clave, de tal manera que el usuario pueda llegar al contenido de un libro determinado buscando por los distintos sinónimos. Si hubiera siglas o abreviaturas se recomienda poner el acrónimo y su desarrollo en el resumen.
También la elección de las palabras clave es crítica en la recuperación de información sobre libros en la red. La elección de cada una de ellas es importante. Además de la recomendación anterior, de alternar sinónimos en título, resumen y palabras clave, se debe pensar en palabras que utilizaría el usuario para llegar a ese libro en concreto. También puede resultar útil recurrir a herramientas como tesauros o vocabularios controlados que permitan saber qué términos se utilizan de manera preferente,
o cuáles son los términos genéricos, específicos o relacionados que, quizá, resulten interesantes para describir el contenido de un libro. Por otro lado, conocer los términos más utilizados por los usuarios en sus búsquedas utilizando herramientas como Google Trends, puede ayudar mucho a seleccionar con más posibilidades de acierto o eficiencia (véase figura 4).
Tiene importancia el número de palabras que se utilicen para describir cada libro. La recomendación es que se elijan entre 3 y 7 palabras que representen lo esencial. Se debe evitar la asignación de numerosas palabras clave pues es algo que los buscadores penalizan, lo que significaría que el libro no aparecería bien posicionado.
Figura 4. Comparativa de uso entre «clases online» y «clases virtuales» según Google Trends (07/12/2021)
Como una estrategia de posicionamiento adicional a la buena descripción de los libros, es importante saber que los buscadores recaban datos e información de muy distintos sitios. Los repositorios temáticos o institucionales son fuentes privilegiadas para la recolección de datos e información. Su carácter de recurso abierto les hace estar especialmente preparados para ellos. Lo habitual no es que haya libros en estos repositorios, a no ser que sean en abierto y/o que el editor haya autorizado para alojar una copia. Sin embargo, las editoriales o los autores pueden depositar documentos en estos repositorios, como resúmenes de los libros, reseñas, entrevistas con el autor, etc., con los metadatos correspondientes para que el buscador pueda cosecharlos y mostrarlos entre sus resultados de búsqueda.
Ahondando en el asunto de la visibilidad de la producción editorial, pero yendo hacia el terreno de la comercialización de libros y/o de acceso a los mismos —en el caso de los libros de acceso abierto— resultará interesante hacer un recorrido por los diferentes canales, plataformas y otras infraestructuras que permiten cumplir con esas funciones.
Como punto de partida, puede subrayarse la conveniencia de estar presentes en muchos o en todos los canales posibles. Cada uno de ellos puede tener públicos diferentes y estar en todos ellos multiplica las posibilidades de llegar a los distintos tipos de lectores.
Por un lado, están los canales más genéricos y extensivos para dar a conocer y vender libros. Todostuslibros.com es la plataforma creada por CEGAL para localizar y comprar libros comercializados en España y América Latina. Ofrece información de más de 4 millones de libros y se pueden comprar en torno a un millón y medio de ellos. Los sitios de venta de las cadenas de librerías como la Casa del Libro, FNAC, Martins Fontes Paulista, Gandhi o Lerner son ejemplos de ello así como, naturalmente, los sitios web de las propias editoriales o librerías, cuyo diseño ha de cuidarse especialmente.
Como gigante de la logística y la comercialización, no puede dejar de mencionarse Amazon. Independientemente de todas las controversias asociadas a lo que supone para el sector y especialmente para las pequeñas y medianas librerías y editoriales, es necesario aludir a algunas cuestiones técnicas que repercuten en la visibilidad y en la venta de libros a través de esta plataforma. En el apartado dedicado a márketing digital se tratan algunas de ellas.
Google Books, por su parte, permite buscar en millones de libros escaneados en bibliotecas pero también recupera referencias de libros no escaneados. El acceso al libro será diferente en función de los derechos: se podrá acceder a la obra completa si está libre de derechos, ver algunas páginas o algunos fragmentos, acudir a los sitios de venta del libro mediante los enlaces que se proporcionan o acudir a las bibliotecas enlazadas para acceder al préstamo. En Google Books se pueden realizar reseñas de los libros y también obtener la información para citar el libro.
En el ámbito académico, existen numerosas plataformas de alcance supranacional o internacional que merece la pena revisar y considerar. Aunque en algunos casos pueden ser selectivas, y exigen el cumplimiento de algunos criterios por parte de las editoriales, lo cierto es que son excelentes recursos para difundir la producción editorial de un sello entre un conjunto de lectores académicos potenciales muy amplio. Cada una de estas plataformas presenta sus particularidades en cuanto a cobertura, idiomas, tipo de libros, opciones de acceso o venta, etc. pero todas ellas pueden tener interés para las editoriales académicas.
En el ámbito iberoamericano, destacan algunas dedicadas íntegramente a los libros académicos o con algún tipo de cobertura hacia ellos. Ulibros[29] es un proyecto de catálogo colectivo de libros publicados por las editoriales universitarias latinoamericanas, españolas y portuguesas que incluye, a día de hoy, más de 15.000 títulos. Cada uno de ellos va acompañado de informaciones bibliográficas completas, metadatos e información sobre los canales donde poder adquirir los libros. Incluye también libros de acceso abierto. Se desarrolla en colaboración con EULAC, la Asociación de Editoriales Universitarias de América Latina y el Caribe.
Vinculada a la Unión de Editoriales Universitarias Españolas (UNE), la plataforma Unebook[30] informa, comercializa y da acceso a la producción editorial de las universidades españolas, pero también empieza a incorporar producción latinoamericana. Además, los más de 13.000 títulos que integran su fondo se incorporaron recientemente a WorldCat, el catálogo colectivo de bibliotecas más amplio del mundo. Precisamente esa integración en catálogos de bibliotecas, por las distintas vías que hay para ello, representa otra gran oportunidad de difundir la producción editorial en distintas partes del mundo, ampliando y diversificando el conjunto de lectores.
Scielo livros[31] es un proyecto de FAPESP, la entidad financiadora de proyectos del Estado de Sao Paulo. El desarrollo de la plataforma está liderado y financiado por un consorcio formado por las editoriales de la Universidade Estadual Paulista Júlio de Mesquita Filho (UNESP), Universidade Federal da Bahia (UFBA) y Fundação Oswaldo Cruz (FIOCRUZ). Incluye fundamentalmente libros académicos brasileños pero está abierto a otras editoriales de la región. En diciembre de 2021 recogía más de 1.500 títulos. Ofrece tanto los libros que están en acceso abierto (más de 900 títulos) como libros que están a la venta, dándolos a conocer a través de la plataforma y estableciendo el puente para adquirirlos.
También los sistemas de información REBID[32] y Dialnet[33] que tienen una amplia cobertura de la producción científica española y, en menor medida, latinoamericana, comenzaron a incluir libros y capítulos de libros académicos.
Más allá del ámbito iberoamericano y en el terreno exclusivo de los libros académicos en abierto, es imprescindible llamar la atención sobre los proyectos OAPEN[34] y DOAB[35]. Con epicentro en Europa pero de cobertura y proyección mundial, son proyectos clave en el desarrollo, difusión y descubribilidad de los libros académicos en abierto. El primero está encaminado a proporcionar infraestructuras y servicios de distinto tipo a editoriales para impulsar su transición al acceso abierto; para servir de enlace con las bibliotecas que, de este modo, conocen la producción editorial de las editoriales más prestigiosas; para facilitar el alojamiento de los contenidos así como la recuperación de información de los mismos en buscadores y otros sistemas de información, gracias al trabajo que realizan con los metadatos y con estándares. OAPEN está vinculado a la infraestructura Directory of Open Access Books (DOAB), la mayor plataforma de libros en abierto, con más de 47.000 títulos de más de 600 editores. Todos ellos son libros que han pasado por un proceso de revisión por expertos. Desde DOAB, además, se ha arbitrado un sistema de certificación que vela por las buenas prácticas en editoriales y que evalúa no solo los distintos sistemas de selección de originales[36], sino la transparencia de las prácticas editoriales en los sitios web o los aspectos relacionados con los derechos de autor en el entorno de lo abierto (OA policies).
En este sentido, también es importante mencionar el recurso Think Check Submit[37], una herramienta pensada para dar información a los autores sobre editoriales que les pueden resultar interesantes para enviar sus resultados de investigación, que siguen una serie de buenas prácticas editoriales y, por tanto, son editores en los que se puede confiar. Son varios los distintos parámetros de calidad y transparencia que maneja este sistema para seleccionar a las editoriales.
Se trata de proyectos clave en nuestro entorno para visibilizar la producción de libros de calidad en abierto, pero también para observar las prácticas editoriales y de integridad en la investigación, en consonancia con el impulso que la política europea está dando a estos aspectos de la comunicación científica actual y de la ciencia moderna.
Paradójicamente, tal y como se ha visto en distintos estudios[38], la presencia de las editoriales iberoamericanas en estos proyectos no es la que corresponde a su volumen de producción editorial académica. La razón es que la publicación de libros de acceso abierto en nuestra región no está entre las prioridades de las editoriales académicas y tampoco hay una línea de acción conjunta dentro del propio sector editorial, de las políticas universitarias o de las políticas de ciencia. Mientras en otros países (véase el proyecto COPIM[39] en el Reino Unido) o en el contexto de la Unión Europea se desarrollan iniciativas, dotadas de fondos para estimular la publicación de libros académicos en abierto, en nuestros países no se está produciendo la reflexión ni la acción colectiva necesaria para abordar este reto. Las pequeñas y medianas editoriales académicas no pueden afrontarlo por sí solas, la publicación en abierto que se ha dado hasta el momento es anecdótica en comparación con la producción editorial real, no se participa suficientemente en proyectos internacionales, no se han explorado modelos viables para la publicación en abierto, etc. Todo esto, como se apuntaba en una sección anterior, es un reto pendiente para la edición académica iberoamericana.
En el ámbito estadounidense, han de destacarse las plataformas MUSE[40] y JSTOR[41].
La primera, iniciada a mediados de los 90 por la Johns Hopkins University Press y la Biblioteca Milton S. Eisenhower Library de la misma universidad proporciona acceso a una enorme cantidad de contenidos científicos en el ámbito de las Humanidades y las Ciencias Sociales. Actualmente reúne unos 70.000 libros de 200 editoriales y plataformas de todo el mundo. Esta plataforma, que ha recibido financiación de la Mellon Foundation y del National Endowment for the Humanities proporciona también a las editoriales una serie de herramientas para poder publicar en abierto.
JSTOR es una gran base de datos de literatura científica e imágenes de distintos repositorios y fuentes que reúne y permite acceder a unos 12.000 millones de documentos. Entre ellos, 12.000 libros y más de 458.000 capítulos. JSTOR es parte de ITHAKA, una organización sin ánimo de lucro que pretende estimular el uso de la tecnología, favorecer el aprendizaje e impulsar la preservación digital.
Precisamente la salvaguarda de todo el material publicado en digital y el acceso permanente al mismo constituyen otro de los desafíos para las editoriales académicas. Se trata de garantizar la preservación de los libros digitales así como su acceso permanente. Lo primero requiere de grandes repositorios, plataformas y bases de datos que alojen los contenidos académicos. Algunos gestores de contenidos y programas de gestión editorial como Open Monograph Press puede contribuir a esa preservación. También plataformas como las mencionadas MUSE o JSTOR o el proyecto CLOKKS[42] para la preservación a largo plazo de los contenidos académicos.
Junto a la posibilidad de alojar los contenidos en algún lugar seguro para preservarlos está la cuestión del acceso. En un entorno cambiante, como el digital, los identificadores persistentes son necesarios para que el contenido pueda ser localizado independientemente de si cambia la ubicación del servidor y su dirección. La utilización de DOI (Digital Object Identifier) y de otros identificadores persistentes resulta esencial para acceder a los libros y a sus capítulos.
La obtención de los identificadores puede realizarse a través de entidades como Crossref pero también los repositorios institucionales o temáticos asignan identificadores persistentes una vez que se deposita un libro o un capítulo. Muchos sistemas de información científica, plataformas o bases de datos requieren esos identificadores persistentes para que los libros de una editorial puedan entrar a formar parte del sistema.
A diferencia de lo que ocurre con las revistas científicas, hasta hace relativamente poco apenas existían indicadores sistematizados para libros, colecciones o editoriales académicas. Sin embargo, tener datos sobre el interés que suscitan los libros, las ventas o el impacto académico y social es importante para las editoriales y los autores. Para estos, además, son datos esenciales en su carrera académica pues las promociones y el reconocimiento de los sexenios de investigación (u otros méritos similares) tienen en consideración algunos indicadores relacionados con estas variables. Las agencias de evaluación de la actividad investigadora, por tanto, son también parte interesada en la obtención de métricas para libros.
La aparición de Book Citation Index (Clarivate Analytics) en 2011 y la incorporación de libros académicos a la base de datos Scopus aportaron las primeras métricas para libros en el entorno internacional, aunque con las consabidas limitaciones. La cobertura de ambas bases de datos hacia editoriales que no publican en inglés no solo es reconocida entre los criterios de selección de los productores de estas bases de datos, sino que además está documentada en distintos estudios (Gingras y Khelfaoui, 2019; Vera-Baceta, Thelwall y Kousha, 2019; Sivertsen y Larsen, 2012, entre otros). Esto significa las editoriales académicas iberoamericanas apenas están presentes y, por tanto, no se dispone de datos de citación o impacto para los libros que publican.
Sin embargo, en los últimos diez años hay que destacar que las nuevas ideas en torno a los modelos de evaluación de la actividad científica y las posibilidades que brinda el entorno digital y abierto han favorecido la aparición de métricas de distinto tipo para los libros. También se ha avanzado en el desarrollo de los estudios de la edición académica. En el ámbito iberoamericano son varios los ejemplos, desde la mencionada Cartografía de la edición académica iberoamericana hasta los estudios de la Edición Académica Española (véase la bibliografía que acompaña a este informe).
Algunos documentos clave como el Manifiesto de Leiden[43], la Declaración de San Francisco[44], el manifiesto ENRESSH[45] o la Iniciativa Helsinki sobre multilingüismo en la comunicación científica[46] proponen alternativas bien fundamentadas a la evaluación de la producción científica más extendida, basada en indicadores cuantitativos. Algunas ideas clave en la «nueva» evaluación son:
•Evaluación cualitativa apoyada en parte en algunos indicadores cuantitativos.
•Tener en consideración los patrones de publicación propios de las distintas disciplinas científicas.
•Adecuar los indicadores a lo que se quiere evaluar.
•Utilizar indicadores transparentes y comprensibles.
•Reconocer la investigación localmente relevante publicada en idiomas distintos al inglés.
•Proteger las estructuras editoriales que permiten la publicación de ciencia de calidad en los idiomas de cada país.
•En consonancia con el impulso a la ciencia abierta, apostar por métricas también abiertas y alternativas a los indicadores «cautivos» de determinados sistemas de información bajo suscripción.
Los estudios de la edición, los indicadores para editoriales, las nuevas directrices para la evaluación científica y, desde luego, las herramientas que ofrece el entorno digital incrementan las posibilidades de tener más información sobre los libros, las colecciones y las editoriales. Con ello, es posible una mejor evaluación de los libros como forma de producción científica, especialmente destacada en las Humanidades y en las Ciencias Sociales.
También en algunos procesos de evaluación científica se presta atención al impacto de la investigación más allá de la academia. En concreto, la primera convocatoria de los denominados «sexenios de transferencia» por parte de la ANECA contempla entre los distintos tipos de transferencia aquella generadora de valor social a través de publicaciones y actividades de difusión. En el análisis realizado sobre los resultados de esta convocatoria[47] se concluye cómo determinados tipos de publicaciones —también libros— de perfil no estrictamente académicos sirven para transferir conocimientos desde la academia a otros públicos y ámbitos. No siempre es fácil aportar indicadores de calidad para mostrar el impacto de una publicación de este tipo en el ámbito social, político, jurídico o empresarial, pero la convocatoria de sexenios de transferencia o, previamente, la del Research Excellence Framework del Reino Unido, ayudan a pensar y a medir los diferentes tipos de impactos. En general, la demostración de cómo se ha utilizado o cómo ha servido una publicación más allá del ámbito académico se basa más en lo cualitativo que en lo cuantitativo, es decir, en cómo se argumenta el impacto producido o en que se denomina internacionalmente la «narrativa del impacto».
Para los libros académicos que son resultado de investigación y que, normalmente, está dirigidos a lectores académicos, se pueden identificar y manejar distintos tipos de indicadores.
En un apartado anterior (Bases de datos de literatura científica), se mencionaron las citas recibidas por los libros como indicadores aportados por las grandes bases de datos comerciales Book Citation Index y Scopus. Podrán ser obtenidos para las editoriales y libros allí recogidas que, como se apuntaba también, no representan a todos los países ni a todos los idiomas por igual. En el caso de las editoriales iberoamericanas son pocos los libros para los que se puedan obtener citas de estas bases de datos.
También se mencionan en el mismo apartado las citas a libros que se registran en sistemas abiertos como Dimensions, gracias a la incorporación de Altmetric. Esta herramienta no solo contabiliza citas a libros procedentes de la literatura científica sino que analiza indicadores de «circulación» de libros en las redes sociales (visualizaciones, lecturas o descargas).
Otra herramienta para la obtención de métricas de distintos tipos de resultados de investigación, incluidos libros y capítulos de libros es Plum Analytics[48]. Las posibilidades que ofrecen son interesantes pues obtiene indicadores relacionados con el uso, las capturas, las menciones, las redes sociales y las citas. Para cada uno de estos bloques de métricas, se aportan distintas métricas, incluidas algunas que pueden reflejar el impacto social de la ciencia, como las citas recibidas por determinadas publicaciones en documentos de política científica. La cobertura de Plum Analytics no se limita a artículos de revistas sino que incluye una amplia variedad de resultados de investigación, aunque con pesos mucho menores que los artículos. Los libros representan un 5,4% y capítulos de libros un 2,4% de todas las publicaciones recogidas por el sistema. La presencia de fondos editoriales iberoamericanos como fuente para esta herramienta es limitada. Observando el listado de fuentes con el que trabaja Plum Analytics[49] se puede insistir en la importancia de que las editoriales académicas hagan esfuerzos por que sus fondos estén bien cubiertos y visibles en Google, Wikipedia, Worldcat o Scielo, por mencionar algunas de las fuentes más cercanas a la producción editorial iberoamericana.
Plum Analytics puede incorporarse a repositorios institucionales y temáticos, lo que significa que en la medida en que haya contenidos sobre los libros en estos sistemas de información, se podrían obtener métricas para ellos.
Cabe mencionar también que en el entorno de los libros académicos en abierto, se está desarrollando un ambicioso proyecto piloto denominado Data Trust for Open Access Ebook Usage[50] en el que participan numerosos especialistas de la edición académica internacional para lograr métricas adecuadas para las monografías.
Aunque la editorial no tenga un programa de publicación en abierto, puede promover e impulsar la presencia de algunos contenidos en el entorno digital. Bien sean reseñas de los libros, resúmenes, vídeos promocionales, tablas de contenidos o capítulos de prueba, estos fragmentos de contenidos pueden formar parte de los sitios web, de repositorios institucionales o temáticos o de plataformas de distribución o comercialización, como elementos de difusión y marketing de la producción editorial. Además, puede animar a los autores a que depositen esas «piezas» en redes sociales académicas como Academia, Linked In, Research Gate u otras. Todo ese plan de acción en el entorno digital garantiza no solo una mayor visibilidad sino también la posibilidad de obtener algunas métricas que pueden ser calculadas gracias a los recursos en abierto.
Las figuras 5 y 6 muestran algunos de los resultados (decenas) mostrados por Google Scholar para una monografía y una obra colectiva respectivamente[51], un publicada en el Reino Unido por University College of London y otra en España/Alemania por Iberoamericana Vervuert. Examinando cuáles son las fuentes que han permitido a Google Scholar identificar que estos libros han sido citados, mencionados o reseñados, hay una observación concluyente. Si se publican reseñas, resúmenes, índices, etc. en recursos en abierto, la visibilidad y las métricas para una determinada obra aumentan de forma significativa. Hay monografías muy relevantes cuyos resultados son exiguos en Google o Google Scholar. Que dejen de serlo es una tarea conjunta entre los editores y los autores, que deben dedicar esfuerzos a que haya contenidos sobre la obra en el entorno digital.
Figura 5. Resultados de Google Scholar para la monografía Archaeologists in print (University College of London)
Figura 6. Resultados de Google Scholar para la obra colectiva El mar no es ancho ni ajeno (Iberoamericana Vervuert)
Las citas a un libro procedentes de la literatura científica que Google identifica y contabiliza permiten tener acceso a informaciones relevantes como de dónde proceden esas citas, quién cita, de qué instituciones, desde qué disciplinas se cita o desde qué medios no estrictamente académicos. Esta información es tan importante para los editores como para los autores. En evaluación científica, las citas de Google Académico pueden ser un indicador de la circulación e impacto del libro, aunque faltan medidas contextuales. Es decir, el número absoluto de citas recibidas por una obra no permite saber si es un valor igual, superior o inferior a la media de los libros de una disciplina porque no hay un universo cerrado de publicaciones sobre las que calcular ese valor. Un número bajo de citas puede ser importante en especialidades académicas pequeñas o puede ser señal de la falta de digitalización o de trabajo en el entorno digital por parte de una editorial. Sin embargo, el recuento de citas así como la posibilidad de trazar su origen ya es, en sí misma, una información con valor. La herramienta de creación de perfiles de citas para investigadores ha sido utilizada por algunas colecciones para mostrar el conjunto de citas recibidas por el conjunto de libros de una colección (véase Figura 7).
Finalmente, si las métricas se relacionan con el impacto de las editoriales y las obras que publican, así como con los procesos de evaluación de la producción científica, conviene mencionar los dos proyectos consolidados en España en relación con los indicadores de editoriales y de colecciones.
Figura 7. Perfil en Google Académico de la colección Bibliotheca Montaniana de la Universidad de Huelva
El primero de ellos, Scholarly Publishers Indicators (SPI)[52], iniciado en 2012, reúne indicadores para editoriales académicas españolas y extranjeras. El sistema muestra el prestigio de las editoriales establecido por los humanistas y científicos sociales españoles en distintas consultas. También ofrece perfiles de publicación para las editoriales, identificando el volumen de publicación y las materias académicas a las que se dedican. Un tercer bloque de información muestra los sistemas de selección de originales empleados por las editoriales académicas y también su grado de transparencia en cuanto a si hacen pública o no esa información. Finalmente, se aporta información sobre sistemas de información de producción científica de otros países que cubren estas editoriales. Los estudios de prestigio de las editoriales han podido ser desarrollados también en Colombia[53] (Giménez Toledo et al., 2021) y Brasil[54].
El segundo es el sello de calidad CEA/APQ[55] impulsado por la Unión de Editoriales Universitarias Españolas y avalado por la ANECA y por la FECYT. El sello es solicitado voluntariamente por las editoriales que asumen pasar por un proceso de evaluación de la colección basado en distintos indicadores de calidad y transparencia. Hasta el momento son 49 las colecciones que han recibido el sello de calidad, que es tenido en cuenta en algunos paneles de evaluación.
Los identificadores persistentes son códigos que se asignan a distintas unidades de información en el entorno digital y que las dotan de características que, hoy, resultan indispensables. Asignan una identidad propia a cada autor y a cada «objeto digital» —un libro, un capítulo o un artículo; permiten que ese objeto pueda ser recuperado siempre en el entorno digital, independientemente de cambie de servidor o de dirección; hace posible, además, las conexiones de informaciones relacionadas que a día de hoy son imprescindibles en toda la red, pero muy especialmente en lo que concierne a información científica y técnica. A través de los identificadores digitales, los sistemas se consultan e intercambian información. Dos sistemas de información que incluyan, por ejemplo, el ORCID de los autores, van a poder intercambiarse información de los metadatos que cada sistema tenga por separado.
Precisamente por esa interconexión de informaciones en la red, la utilización de identificadores digitales aumentará notablemente la visibilidad de la producción editorial y de los autores.
Además del ISBN y del ISSN (series monográficas), y otros menos utilizados como el URN (Uniform Resource Name), el identificador más común y extendido para las publicaciones académicas es el DOI (Digital Object Identifier). Es un código alfanumérico legible para las máquinas. Se puede asignar a cualquier objeto digital y es clave para localizar los recursos de manera permanente, para poder contabilizar las citas y navegar adecuadamente por el aparato crítico de los documentos, para compilar e interconectar las publicaciones de un mismo autor, para vincular las publicaciones a una determinada fuente de financiación y, desde luego, para hacer visible la producción editorial en la red. Gracias a la legibilidad del código y a las aplicaciones de los sistemas (APIs), los metadatos de las publicaciones pueden estar presentes en multitud de plataformas y sistemas de información. Así, el DOI es un elemento esencial en los actuales sistemas de información científica y, por ello, casi siempre un requisito que ponen los productores de bases de datos para que determinadas publicaciones pasen a formar parte de su acervo.
Precisamente por todo lo que posibilita el DOI se recomienda asignarlo a cualquier libro publicado con versión digital y no solo a la obra completa sino también a cada uno de sus capítulos. En edición académica, el hecho de que cada capítulo tenga su identificador resulta esencial pues muchas veces se busca, se lee o se cita un capítulo concreto y no toda la obra. Los distintos autores de los capítulos en una obra colectiva, al difundir su producción científica en redes sociales académicas como Research Gate o Academia podrán reflejar el DOI de su contribución concreta en el libro, ayudando a visibilizarlo y multiplicando las posibilidades de difusión. Para que el contenido de una obra colectiva sea conocido y se pueda recuperar en la red es necesario tratar cada capítulo de forma independiente, tal y como se hace en catalogación analítica en algunas bibliotecas.
Crossref[56] es la agencia que asigna mayoritariamente los DOI a las editoriales que producen publicaciones académicas. También es posible obtener estos DOI al registrar una publicación en algunos repositorios como Zenodo[57] (un proyecto de OpenAIRE operado por el CERN) u otros institucionales o temáticos que, a veces, proporcionan otros identificadores digitales diferentes.
Si el editor es el responsable de solicitar los ISBN, ISSN o DOI de las obras publicadas por la editorial, el autor —normalmente un académico— solicita su identificador único de autor. Como en el caso del DOI, los identificadores de autor son códigos alfanuméricos legibles por máquinas que evitan los problemas de ambigüedades en los nombres, identifican unívocamente a los autores, preservan los derechos de autor y permiten la integración de información (producción científica vinculada a un autor, revisiones realizadas para revistas científicas, citas recibidas, etc.). Uno de esos identificadores es el ISNI (International Standard Name Identifier), que puede asignarse a personas físicas y jurídicas. Las bases de datos internacionales de literatura científica también prevén la utilización de sus propios identificadores digitales: Researcher ID en el caso de Web of Science y Scopus Author ID en el caso de la base de datos de Elsevier. Dialnet trabaja también con identificadores de autor para agrupar la producción científica en torno a los investigadores. Sin embargo, el más extendido de todos los identificadores referidos a autores es ORCID[58]. El código se obtiene de manera inmediata ofreciendo datos básicos del investigador en la página de ORCID. El código identifica al autor y agrupa su producción científica. Es un identificador clave en el entorno académico de hoy. Muchas revistas y editoriales lo exigen a los autores que envían sus artículos o libros. También se requiere ya de forma habitual en los formularios que el investigador ha de cumplimentar para solicitar un proyecto de investigación. Además, es un identificador clave en los nuevos sistemas que reconocen la tarea de evaluación de originales que llevan a cabo los investigadores (Publons[59] o Plaudit[60], por ejemplo) (véase figura 8), así como en nuevas plataformas de revisión y publicación en abierto como Open Research Europe[61].
Figura 8. ORCID y DOI como identificadores clave del sistema Plaudit
En definitiva, gran parte de la visibilidad, el reconocimiento y el impacto de la producción científica de hoy, incluidos los libros académicos y sus capítulos, suceden en el entorno digital, un marco en el que son esenciales los identificadores digitales. Autores y editores deben trabajar con ellos para garantizar la proyección de sus obras.
Las estrategias de marketing en el entorno digital son numerosas y pueden llegar a ser muy eficientes. Además de lograr más ventas de libros están encaminadas a conocer mejor a los lectores y a comunicarse con ellos, en un proceso de aprendizaje que resulta muy útil a la editorial.
Las cuestiones tratadas en el apartado de visibilidad de la producción editorial en buscadores están ligadas al marketing digital. En este apartado, se analizarán otras estrategias al margen del posicionamiento en buscadores como son las redes sociales, el conocimiento de los lectores a través de las herramientas que ofrece la red y algunas acciones específicas en el marco de Amazon.
Comenzando por estas últimas, se pueden destacar los artículos de Mareike Schubert (2019), especialista en marketing de medios y que aporta informaciones muy esclarecedoras al respecto. La concisión de los títulos ya fue apuntada anteriormente y se subraya como característica importante en los sitios de venta de libros como Amazon. La imagen de cubierta resulta muy importante en estas plataformas y el título en las mismas debe ser legible, incluso si la imagen aparece en un tamaño pequeño. Tanto la cubierta como el título son elementos esenciales para que el usuario decida entrar en el mismo y buscar más información, paso crítico para la venta. Por eso se recomienda que en el diseño de la cubierta se tengan ya en cuenta esos aspectos.
El acceso a la información individualizada de cada libro es un logro pues implica que el usuario ha seleccionado un libro entre una amplia oferta. Por ello, el editor debe cuidar especialmente esa información que ofrece. Esta autora hace hincapié en la relevancia de la opción «Mira dentro del libro» y recomienda que sea incorporada por los editores, incluso manualmente para que pueda ser visto también desde dispositivos móviles. También subraya la importancia de redactar un buen texto descriptivo para el libro pues es el elemento que va a hacer que el lector se sienta o no interesado por el contenido, decida o no comprarlo. Las recomendaciones para redactar inciden en lo que se exponía en la sección de descubribilidad: información concisa y sustancial, estructurada en párrafos y subtítulos. De algún modo, debe conectar con el lector, destacar algo que pueda resultar singular en ese libro frente a otros y pensar que esta descripción sustituye en el entorno digital a cualquier otra información que normalmente contaría el editor o el librero.
Para los libros que contengan imágenes especiales o que tengan alguna característica singular, se recomienda la utilización de una página A+ de Amazon, con un coste asociado pero que posibilita precisamente mostrar esos detalles especiales de la edición. Esa página permite, además, incluir vídeos de autor o comentarios de lectores lo que, sin duda, contribuye a promocionar mejor el libro.
Por último, dos elementos fundamentales para que un libro tenga buena acogida en Amazon son las valoraciones y las reseñas. Las valoraciones positivas —por encima de cuatro estrellas— parecen incidir bastante en la decisión de los compradores/lectores. También influyen bastante las reseñas que se incluyan sobre las obras. El editor debe promover la realización de reseñas entre los autores y compradores de cada libro.
Fuera ya de Amazon, pero siguiendo con el tema de las reseñas, al lector y al editor le serán siempre útiles los comentarios que los lectores puedan hacer de las obras académicas. Si las revistas científicas o la prensa han acogido tradicionalmente reseñas sobre los libros académicos, las posibilidades de reseñar y comentar libros se amplían sustancialmente en la red. Quizá cambia la naturaleza de las mismas. Si las reseñas publicadas en revistas suelen estar muy elaboradas y documentadas, habitualmente por un académico de la disciplina, el entorno digital favorece otro tipo de comentarios sobre las obras. Goodreads[62] es una plataforma que permite la publicación de reseñas breves y comentarios sobre cualquier tipo de libros. Están clasificados por géneros. Los usuarios/lectores pueden clasificar los libros mediante la asignación de estrellas. Goodreads permite ir a Amazon, otras tiendas en línea y a bibliotecas para conseguir el libro.
También los vídeos de autor hablando del libro, los podcast, la lectura de párrafos así como las presentaciones en librerías o los clubes de lectura retransmitidos en Instragram, Facebook u otras redes sociales son piezas importantes en el marketing que hoy es efectivo para los libros. Pueden considerarse otro tipo de reseñas: las propias del entorno digital.
La difusión de información sobre los libros publicados y el dinamismo de la misma son posibles gracias a las redes sociales. Resultan esenciales en la comunicación de la editorial con sus lectores reales o potenciales. Requieren un conocimiento específico —no muy complejo— y una dedicación sistemática, pues una clave en este entorno es producir contenidos de forma regular. Es recomendable elegir algunas de ellas (Twitter, Facebook, Instagram, Linked In, Tik Tok, etc.) y generar contenidos habitualmente que trabajar con varias sin poder atenderlas adecuadamente. Cada una tiene sus particularidades y sus condiciones. La longitud de los mensajes, el mayor uso de imágenes, el tipo de público que las consume, etc. son variables que pueden ayudar a una editorial a decidir cuál de ellas puede resultar más interesante.
Algunas editoriales académicas, además, optan por desarrollar herramientas propias (blogs o boletines, por ejemplo) para poder ofrecer informaciones de los libros más amplias o no condicionadas a los formatos de las redes sociales.
Los investigadores, profesores y otras personas interesadas por el libro académico utilizan cada vez más las redes sociales, no solo para difundir su actividad sino para informarse y estar al día de lo que ocurre en su campo. Las redes son canales privilegiados para hacer llegar la información de la actividad editorial a los lectores potenciales y por esa razón deben ser consideradas y cuidadas por las editoriales académicas. Los contenidos más evidentes que una editorial generará estarán relacionados con la información de los libros publicados, los hitos sobre los mismos (nueva edición, premios recibidos, reseñas publicadas, etc.) o las actividades en torno a él, como presentaciones públicas o debates. Sin embargo, hay muchas otras perchas —como se dice en el argot periodístico— para hablar de los libros de la editorial. Los días mundiales dedicados a un tema, noticias de actualidad que se relacionen con alguno de los libros publicados, festividades de distinto tipo y, desde luego, las relacionadas con el libro pueden ser motivos para la que la editorial genere contenidos de manera regular para las redes. Es una tarea que requiere dedicación y planificación pero que resulta efectiva en un momento en el que las redes sociales son importantes fuentes de información para todos, también para la academia.
El dinamismo en redes sociales crea comunidad, permite interactuar con los seguidores y conocer mejor a los lectores reales o potenciales. Las interacciones que se producen en redes, los comentarios, las sugerencias que el editor puede recibir y agradecer, las preguntas que se pueden resolver, las herramientas de análisis (ej. Google Analytics) que permiten saber más de las visitas que recibe cada página), etc. son elementos que aportan información sobre quienes siguen a una editorial.
El conocimiento de los lectores es muy apreciado por las editoriales, pero no siempre es fácil de obtener. El entorno digital ofrece herramientas que hacen posible el acercamiento a esa información. Google Trends, por ejemplo, identifica los términos más buscados en cada momento por el conjunto de usuarios de la red. Se pueden hacer análisis similares dentro del sitio web de la editorial para saber si los lectores están buscando determinados libros, autores o temas, cómo evolucionan las búsquedas o cómo están de relacionadas con acontecimientos de la actualidad. Algunas herramientas más específicas como Facebook Audience Insight permiten hacer el seguimiento de búsquedas y a segmentar públicos; esto puede ayudar bastante a definir la estrategia de marketing y a hacerla más eficiente, al dirigirse a perfiles bien identificados para los que una editorial puede ofrecer contenidos especializados. En ocasiones interesará dirigirse a un público muy amplio y, en esos casos, algunos especialistas recomiendan la publicidad que ofrecen los gigantes tecnológicos, pues suele surtir efecto.
En la difusión de una obra cada es importante el papel del editor pero es crucial no descuidar lo que el autor puede hacer. En sus redes sociales podrá anunciar la aparición de una obra e ir ofreciendo regularmente algún dato, titular, imagen o noticia relacionada, de forma que la presencia del libro en redes sea regular. También los vídeos de autor, comentarios o entrevistas audiovisuales de corta duración suelen ser muy eficientes en la difusión de una obra. Muchas editoriales literarias están utilizando redes como Instragam precisamente para ofrecer este tipo de contenidos periódicamente. Subir la cubierta, un resumen, un extracto o lo que el editor autorice a un repositorio, con sus correspondientes metadatos, se ha mostrado como una forma esencial de visibilizar el libro. Además, entre otras muchas formas en las que un autor puede contribuir a difundir su obra en el entorno digital, están las redes sociales académicas como Academia, Research Gate o Linked In, muy utilizadas por los investigadores para descubrir contenidos científicos de su interés. En estas redes se podrá depositar, de nuevo, aquello que permitan los editores. Para obras estructuradas en capítulos, es recomendable hacer constar la información de cada capítulo, multiplicando así las posibilidades de que un libro —o su referencia— sea encontrado.
Las grandes editoriales académicas se preocupan porque el diseño de sus sitios web sea el adecuado para que los buscadores recopilen y posicionen bien su información. Pero además, prevén una fase tras la publicación del libro en la que el autor promociona el contenido[63] .
Esta sección trata de los corpora textuales que son los libros y sus posibilidades de análisis. El conjunto de textos académicos editados y publicados albergan una gran riqueza que va más allá del propio libro. Las tecnologías semánticas, herramientas de procesamiento de lenguaje natural o la inteligencia artificial permiten analizar corpora textuales en busca de informaciones no evidentes pero que están ahí y que pueden ser analizadas con usos potenciales muy interesantes.
En el apartado relativo a producción digital y lenguajes de marcado, ya se apuntaba la idea de que el marcado de contenidos con XML desde las fases más tempranas del proceso editorial, permiten sacar mucho más partido a los contenidos e incluso reutilizarlos en la publicación de nuevas obras o nuevos productos.
Si los textos son legibles por las máquinas, las posibilidades de análisis son fascinantes y muy útiles. Además de esta posible reutilización de contenidos, el análisis de los corpora mediante distintas tecnologías hacen posible algunos desarrollos y/o aplicaciones, que se revisan a continuación.
Los textos de una editorial o un conjunto de ellas van registrando nuevo conocimiento en las distintas disciplinas pero también nuevos conceptos y nuevos términos. Extraer terminologías de los libros académicos permite estudiar los lenguajes de especialidad, la evolución de los términos a lo largo del tiempo, la llegada de neologismos a una disciplina y a una lengua. Desde el punto de vista de las lenguas, y teniendo en cuenta la hegemonía del inglés, estos estudios contribuyen al fortalecimiento de otras lenguas distintas en la ciencia. Identificar los términos en su contexto (veáse figura 9) ayuda a precisar la definición de los términos, a conocer sus distintos usos o a desambiguarlos. Permite también disponer de una base de conocimiento fundamental para la traducción automática. En la medida en que las herramientas de traducción automática cuenten con fuentes de términos en español y en otras lenguas, la eficiencia y la calidad de las traducciones será mayor y la presencia de esas lenguas en el entorno digital se incrementará. Para ello, no solo es necesario extraer, estudiar y sancionar lingüísticamente las terminologías, sino que es preciso que los términos tengan formatos adecuados para la web semántica (como RDF. Resource Description Framework) y estén alojados en infraestructuras de la red que permitan recuperarlos.
Además, las herramientas que procesan el lenguaje natural (véase figura 10) son capaces también de agrupar textos por afinidad temática (en inglés se denomina Topic Modelling). Así, un conjunto de libros o capítulos podrían clasificarse por familias de palabras o conceptos, lo que se traduciría, de nuevo, en una mejor recuperación de esa producción editorial, entre otras aplicaciones.
Figura 9. Aplicación desarrollada por Ontology Engineering Group para ES CIENCIA. Búsqueda de palabras en contexto para el corpus de textos COVID19 en español de The Conversation.
Tanto los datos lingüísticos enlazados como los metadatos son y serán clave en la recuperación de contenidos científicos en la red. Uno de los grandes proyectos europeos para la búsqueda de publicaciones, datos, investigadores y proyectos en Humanidades y Ciencias Sociales —áreas en las que se publican el 80% de los libros académicos— es TRIPLE[64]. Se trata de un sistema de búsqueda y descubrimiento de contenidos científicos que está siendo desarrollado en la actualidad y que analizará y recuperará documentos de distintas fuentes europeas y en distintas lenguas. Para que una lengua —el castellano, el catalán, el euskera, el gallego o el portugués, por poner como ejemplo las más cercanas— puedan ser visibles a través de estas plataformas es necesario trabajar los distintos aspectos que se han venido mencionando hasta ahora en este informe.
Figura 10. Ejemplo de aplicación de procesamiento del lenguaje natural con Tirant Analytics
El análisis del discurso que hacen posible algunas tecnologías semánticas o los desarrollos basados en inteligencia artificial pueden resultar de alto interés. Durante la pandemia, estas técnicas se han empleado para discernir entre la gran cantidad de trabajos científicos generados cuáles eran más relevantes o fiables (Giménez Toledo, 2020).
En el campo jurídico, el ejemplo de la editorial Tirant lo Blanch, expresa bien las posibilidades de estas tecnologías aplicadas a sus propios libros (Figura 11). La identificación de los temas principales en libros, jurisprudencia y doctrina, la extracción de citas literales o cuestiones tan desarrolladas como el cálculo de probabilidades de éxito en casos procesales a partir del análisis de contenido.
Figura 11. Servicios ofrecidos por Tirant Analytics relacionados con el análisis de corpus de textos académicos
[2] La colaboración con estos dos grupos se estaban produciendo en el marco del proyecto intramural del CSIC Covid19 en español: investigación interdisciplinar sobre terminología, temáticas y comunicación de la ciencia https://pti-esciencia.csic.es/project/covid19-en-espanol-investigacion-interdisciplinar-sobre-terminologia-tematicas-y-comunicacion-de-la-ciencia/. Las aplicaciones entrevistas para el campo editorial han sido exploradas y, por tanto, incorporadas a este proyecto.
[3] https://pti-esciencia.csic.es/project/edicion-academica-en-espanol-transformacion-digital-y-la-nueva-academia-e-scholarshipb/
[4] Digital Europe Programme for the period 2021-2027.
[5] Por ejemplo, el Horizon Europe Grant Agreement: https://ec.europa.eu/info/funding-tenders/opportunities/docs/2021-2027/common/guidance/aga_en.pdf
[6] Horizon Europe, open science: https://op.europa.eu/en/web/eu-law-and-publications/publication-detail/-/publication/9570017e-cd82-11eb-ac72-01aa75ed71a1
[10] Algunos ejemplos son: https://www.elsevier.com/open-access/open-accessbooks, https://www.wolterskluwer.com/en/solutions/lippincott-journals/ lippincott-open-access (solo para revistas), https://www.springernature. com/gp/librarians/products/ebooks/open-access-books o https://authorservices.wiley.com/open-research/open-access/index.html
[12] Taster, Michael. 2021 in Review: The Culture of Academic Publishing (2021). LSE Impact blog. https://blogs.lse.ac.uk/impactofsocialsciences/2021/12/22/2021-in-review-the-culture-of-academic-publishing/; Giménez Toledo, Elea. 2020. Transformaciones en la comunicación científica. Revista de Occidente. N. 475, pp. 60-65.
[17] Giménez-Toledo, Elea; Córdoba-Restrepo, Juan Felipe (eds.) (2018). Edición académica y difusión. Libro abierto en Iberoamérica. Bogotá; Granada: Universidad del Rosario; Comares. https://editorial.urosario.edu.co/gpd-edicion-academica-y-difusion-libro-abierto-en-iberoamerica.html; E-lectra (2019). Estudio de la especialización y publicación de monografías digitales y en acceso abierto de las editoriales de la UNE. Informe. https://www.une.es/media/Ou1/Image2/webnoviembre2019/EstudioUNE-Especializacion_digital.pdf
[18] Sagrada Biblia Universidad de Navarra: https://ebooks.eunsa.es/library/publication/biblia-universidad-de-navarra?gclid=CjwKCAiAtdGNBhAmEiwAWxGcUrwlrezVJBSzMP6QPJZHPiKueKRL9rwPenoR50kpCdq_rBnwkhJ2aRoCJZIQAvD_BwE
[19] El club de los Superman: https://www.storytel.com/es/es/books/el-club-de-los-superman-1482813
[20] En el momento de redactar esta guía, un millón de libros son indexados por Dimensions, muy pocos de ellos en español u otras lenguas iberoamericanas, precisamente por la falta de trabajo con XML en editoriales académicas de la región.
[28] https://www.dimensions.ai/submit-journal-and-book-titles/ y https://dimensions.freshdesk.com/support/solutions/articles/23000022625-how-can-my-journal-s-or-book-s-get-indexed-in-dimensions
[36] Estas variables son observadas y recogidas en el sistema de información sobre editoriales Scholarly Publishers Indicators (http://ilia.cchs.csic.es/ para un conjunto amplio de editoriales españolas y latinoamericanas.
[38] Giménez Toledo, Elea y Córdoba-Restrepo, Juan Felipe. Edición académica y difusión: libro abierto en Iberoamérica. Bogotá/Granada: Universidad del Rosario; Comares, 2008. https://doi.org/10.12804/th9789587841671; Giménez Toledo, Elea; Mañana Rodríguez, Jorge. Boosting Open Access books in Spanish &, contributing to the multilingualism in the Open Access space. Third Research Evaluation in the SSH Conference (RESSH 2019). Valencia, España: 19/09/2019 https://ressh2019.webs.upv.es/wp-content/uploads/2019/10/ ressh_2019_paper_16.pdf; Giménez, Elea; Kulczycki, Emanuel; Pölönen, Janne and Gunnar Sivertsen (2019). Bibliodiversity–What it is and why it is essential to creating situated knowledge. London School of Economics Impact blog https://blogs.lse.ac.uk/impactofsocialsciences/2019/12/05/bibliodiversity-what-it-is-and-why-it-is-essential-to-creating-situated-knowledge/
[47] Castro Martínez, E. et al. (2021). Análisis de la primera convocatoria del sexenio de transferencia de conocimiento e innovación, focalizado en los tipos de aportaciones. Informe.
[51] Se trata de dos libros en abierto, pero lo que pretende mostrarse no depende estrictamente de esa condición.
De la publicación de contenidos a la publicación de datos
Ana del Arco Blanco
Decía Juan Ramón Jiménez que en edición diferente los libros dicen cosas distintas. Los diversos formatos en que una obra literaria, artística o científica se puede actualmente difundir son una oportunidad para adecuar el acceso a distintas circunstancias y experiencias lectoras.
Para Roberto Calasso los libros únicos eran los que habían corrido un alto riesgo de no llegar a ser nunca tales. Tras este punto de partida y superada la fase de existir, el siguiente paso a abordar es siempre la difusión.
En este texto no nos referiremos a la distribución de ejemplares físicos a través de la cadena tradicional de agentes. Sí a obras que se publican en formato digital (en acceso libre o en acceso restringido) y se difunden por Internet. En concreto a libros (de autoría individual o colectiva) y a sus materiales complementarios (de carácter visual, audiovisual, y sonoro editados conjuntamente con el libro).
Incidiremos especialemente en la edición de libros académicos por parte de las editoriales universitarias, por centros de investigación, e instituciones públicas. Incluiremos también referencias constantes a prácticas de editoriales comerciales (aunque esta distinción terminológica no la entendemos del todo ajustada). Considero que las primeras (y, desde luego, los repositorios) tienen actualmente más en mente la posibilidad de publicar en acceso abierto como vía para dar difusión a las publicaciones de sus investigadores, pero unas y otras editoriales tienen elementos y pautas de actuación coincidentes. También un marco normativo común aplicable que, en la mayoría de los casos y en lo relativo a los usos que se pueden hacer de las obras, viene determinado por el Real Decreto Legislativo 1/1996, de 16 de abril, por el que se aprueba el texto refundido de la Ley de Propiedad Intelectual (en adelante «Ley de Propiedad Intelecual» o «LPI») y por otras disposiciones como la Ley 10/2007, de 22 de junio, de la Lectura, del Libro y de las Bibliotecas, o la Ley 23/2011, de 29 de julio, de Depósito Legal (con su Real Decreto de desarrollo).
Cada epígrafe principal de este texto va precedido de una serie de preguntas a las que, tras una descripción muy somera del supuesto y de la regulación legal relacionada, se pretenden dar respuesta. El tercer apartado relativo a datos en abierto y reutilización de la información por el sector público no resuelve cuestión práctica alguna, pero plantea la pregunta de si a los datos vinculados a publicaciones científicas les es aplicable la nueva normativa europea (ya transpuesta al ordenamiento jurídico español) sobre datos abiertos y menciona algunas consecuencias de que así fuera. Tras la conclusión, se incluye como recurso una tabla de preguntas y respuestas relacionadas.
Las cuestiones que se abordan en este apartado son ¿hasta qué punto se están publicando en España obras en acceso abierto?, ¿qué autorizaciones necesitan las editoriales para publicar en acceso abierto?, ¿qué tipo de licencias han de llevar estas publicaciones?, ¿disponen las editoriales españolas de políticas de acceso abierto?, ¿cómo las podrían articular?,
¿es compatible el acceso abierto con otras modalidades de explotación (por ejemplo, la comercialización)?, ¿qué aspectos jurídicos se han de tener en cuenta a la hora de desarrollar plataformas en acceso abierto?, ¿cómo proceder para dar acceso abierto a obras descatalogadas?, ¿qué cuestiones adicionales han de tenerse en cuenta al publicar en acceso abierto obras en dominio público?
Apuntaba Giménez Toledo (2018), que aunque el desarrollo del acceso abierto en revistas ha sido rápido y extensivo en muchos países del mundo, no ha podido ser así en el caso de las monografías y otros libros académicos, puntualizando que la publicación de monografías en abierto comenzaba a despegar.
El mencionado avance del acceso abierto en la publicación de revistas se debe a que las declaraciones internacionales, las disposiciones normativas europeas, y la legislación española sobre acceso abierto (a través de la Ley 14/2011, de la Ciencia, la Tecnología y la Innovación) son contundentes respecto a la necesidad de publicar en abierto los resultados de investigación financiados con fondos públicos que tomen forma de publicaciones periódicas o seriadas (revistas).
Lo anterior y lo que continúa, ha de entenderse con algunos matices derivados de obras sujetas a derechos de propiedad intelectual y, por tanto, con la salvedad de que antes de publicar en abierto hay que valorar si existen relaciones contractuales con terceros (por ejemplo un contrato entre el autor y un editor). Sin embargo y bajo el paraguas del respeto a los derechos de propiedad intelectual, hay una contundente apuesta por el acceso abierto a publicaciones científicas que bebe de la normativa europea y que comulga con el programa público de inversiones destinado a impulsar la investigación, la innovación y la competitividad. El programa público Horizonte 2020[65] estableció como obligatorio el acceso abierto para las publicaciones científicas resultantes de los proyectos financiados por Horizonte (su programa de investigación «heredero» es Horizonte Europa[66]). También se materializa en repositorios como RECOLECTA[67], el recolector de ciencia abierta desarrollado por FECYT que cuenta con 147 recursos recolectados: 88 repositorios institucionales, 4 temáticas, 47 revistas y 7 portales de revistas.
Cuando los investigadores crean obras resultado de su actividad investigadora en las circunstancias que marca la ley normalmente corresponde a ellos la titularidad originaria de los derechos de propiedad intelectual y decidir sobre los términos en que divulgarán sus creaciones. En el supuesto de que acuerden la explotación de la obra (en exclusiva o en régimen de no exclusiva) para la distribución de ejemplares en forma de libro a cambio de una contraprestación económica y por un tiempo determinado, surgen nuevos titulares de derechos, los titulares derivativos (los editores).
La publicación en abierto de monografías ha de contar con la autorización de los titulares (originarios y derivativos) de derechos de propiedad intelectual. Llevado al ámbito universitario significa, por ejemplo, que si el investigador cedió en exclusiva los derechos para la edición y distribución de su obra, solo puede archivarla en acceso abierto en el repositorio después de pasar el tiempo de cesión, o mientras dura esta con el consentimiento de su editor (De Román, 2020)[68]. Esto es extrapolable, siguiendo a esta autora, a las tesis doctorales. Las universidades solo podrán dar acceso abierto a las tesis depositadas y defendidas en ellas con el consentimiento de sus autores. De lo contrario se produciría un acto no consentido de comunicación pública. Por tal razón sin la autorización de los nuevos doctores las universidades únicamente podrán realizar el archivo de las tesis en su repositorio.
A los autores como titulares de derechos de propiedad intelectual les corresponde determinar qué usos pueden hacerse de sus obras. En el caso de que autoricen la publicación en acceso abierto en forma gratuita (por ejemplo en un repositorio institucional o por una editorial universitaria) los términos de esa cesión suelen quedar reflejados a través de las llamadas licencias creative commons que se incluyen junto a los metadatos identificando obra y autoría.
Autorizar la publicación de obras bajo estas licencias no implica una renuncia a los derechos de propiedad intelectual. Simplemente son una modulación de los usos diferentes a la modalidad tradicional de cesión de derechos y está configurada en tres capas que aportan la información sobre los términos de la licencia (un «código legal», una capa «legible por humanos» y una capa «legible por máquinas»).
El catálogo de licencias creative commons es amplio y prevé usos que van desde licencias amplias a más restrictivas. El informe que publica REBIUN (2018) «Recursos educativos abiertos: estado de la cuestión y pautas para su impulso en las Universidad españolas» destaca que la licencia tipo más usada para recursos educativos (apuntes, guías didácticas, planes docentes, cursos…) es una licencia CC–BYNCND que implica la mención a la autoría y que no permite usos comerciales ni obras derivadas (usada en un 62% de los recursos educativos en abierto). Este tipo de licencia es también la más utilizada para la publicación en abierto de obras científicas y, en mi opinión y aunque sea la licencia más restrictiva, es la licencia más adecuada porque permite descargar y/o visualizar la obra y ponerla a disposición de otras personas sin alteraciones.
Por ejemplo y siguiendo con la anterior licencia, un artículo científico publicado en acceso abierto con la licencia CC–BYNCND que permite un uso no comercial y prohíbe la generación de obras derivadas, podrá colgarse al completo en la plataforma de una universidad con fines de ilustración de la enseñanza, siempre que no se traduzca ni se modifique de otra forma (De Román, 2021)[69].
Con carácter general, las editoriales españolas que publican libros científicos no lo hacen en acceso abierto. Tampoco tienen a disposición de posibles usuarios cuáles son sus políticas sobre acceso abierto a publicaciones sujetas a explotación comercial. Sin embargo son cada vez más frecuentes las consultas que se plantean a los editores desde repositorios académicos sobre la posibilidad de poner en abierto trabajos publicados por sus investigadores (especialmente respecto a obras en coautoría). Los repositorios (directamente o a través de los autores) plantean esta cuestión a los editores por dos motivos principales: para cumplir con las indicaciones de las convocatorias de proyectos a las que concurren y para aumentar la difusión y el impacto de sus investigaciones. Quizás y tras valorar el conjunto de circunstancias concurrentes, los editores podamos reflexionar sobre la posibilidad de permitir el acceso a monografías pasado un tiempo desde su publicación.
Respecto a las maneras de articular ese libre acceso cabrían, a mi entender, dos posibilidades:
La primera pasaría por incluir en la web del editor cuáles son sus políticas sobre acceso abierto. Esta vía, si bien es recomendable, puede ser controvertida debido a la casuística que acompaña a cada publicación y a las circunstancias contractuales específicas para la explotación de cada obra.
Otra fórmula es valorar caso por caso e incluir para determinadas obras una cláusula en el contrato de edición en la que el editor se comprometa a poner la obra en acceso abierto pasado un tiempo o de inmediato.
La expresión coloquial «poner en acceso abierto» implicaría, a mi entender, dos cosas: i) dar acceso libre y gratuito (para el usuario / potencial lector) en la web de la editorial y ii) también permitir que el investigador facilite el archivo para los mismos fines al repositorio de su institución o universidad y a otros repositorios.
La vía tradicional y más frecuente para conocer las políticas editoriales, pero referido sólo a permisos para autoarchivo de revistas, son buscadores como Dulcinea[70] (revistas nacionales) o Sherpa Romeo[71] (revistas internacionales) que muestran si las revistas o editoriales autorizan o no a publicar en acceso abierto.
Para poner un ejemplo de políticas editoriales sólidas en acceso abierto hemos de recurrir a editoriales extranjeras. Tomo la referencia a las políticas de acceso abierto de la editorial académica Oxford University Press (OUP) y su modelo de gestión que combina el acceso abierto (la descarga del formato pdf y la visualización del contenido a través de html) con la comercialización en formato ePub y del libro impreso[72]. Este modelo de negocio tiene muy presente, a mi entender, los hábitos lectores y las necesidades actuales de los usuarios.
Estos servicios pueden ser desarrollados internamente por las editoriales o derivados a un tercero (a través, generalmente, de un contrato mercantil de prestación de servicios). Téngase en cuenta que del desarrollo de estas plataformas (a través de un software libre o propietario) suelen surgir, por ejemplo, rediseños del logotipo de la editorial, subdominios, adaptaciones de la imagen corporativa, un nuevo diseño para la configuración de la web. También y, en el caso de que se contrate la conversión de archivos o el marcado semántico en XML, surgen nuevos formatos o formatos derivados de los archivos originales. En consecuencia es recomendable prever contractualmente, además de la titularidad de la plataforma, que todos los nuevos diseños, recursos, archivos y datos se ceden por el prestador de servicios (el desarrollador de la plataforma) al editor o son titularidad del editor contratante.
Conforme al art. de 10 de la Ley de la Lectura, el Libro y las Bibliotecas se entiende que un libro ha sido descatalogado por el editor «cuando no aparezca en su último catálogo o lo comunique por escrito a sus canales de distribución y venta y a la Agencia Española del ISBN o a las Agencias autonómicas de ISBN correspondientes».
Se trata de obras sobre las que existen derechos de propiedad intelectual aún en vigor y que fueron comercializadas hasta que dejaron de serlo (por decisión de un editor fundada, generalmente, en motivos de rentabilidad económica). Es según Suñol Lucea (2015)[73], una situación de bloqueo en el que el titular de derechos «queda preso» en manos del licenciatario. En EEUU, por ejemplo, se estimó que existían 6 millones de libros descatalogados a fecha de 2010 (Samuelson, 2010). Una problemática similar plantean las llamadas «obras huérfanas», las obras que están sujetas a derechos de propiedad intelectual pero cuyos titulares no pueden ser localizados o identificados.
El acceso abierto o una nueva edición comercial para «dar vida» a obras descatalogadas es un planteamiento frecuente en la práctica. Su tratamiento jurídico es similar: cuando se descataloga un libro los derechos vuelven a los titulares (a los autores o a sus herederos) que podrían publicarlos en otra editorial, ponerlos ellos mismos en abierto, o incluso decidir (con algunos matices) no volverlos a publicar. En consecuencia aunque se trate de libros previamente descatalogados, los nuevos usos y la puesta a disposición del archivo digitalizado implicarían recabar nuevas autorizaciones. Además téngase en cuenta que los editores, incluso aunque el contrato de edición ya no esté vigente, pueden ostentar determinados derechos sobre el archivo de fotocomposición (archivo de imprenta) durante 25 años desde la publicación (arts. 129 y 130 de la LPI). Estas consideraciones son también aplicables al supuesto de que una editorial se planteé publicar en acceso abierto libros que formaban parte de su catálogo pero que, a su iniciativa, quedaron fuera de los circuitos comerciales.
En el momento de cerrar la edición de esta guía se publica el Real Decreto-ley 24/2021, de 2 de noviembre, de transposición de diversas directivas de la Unión Europea al derecho español, entre ellas la directiva (UE) 2019/789 por la que se establecen las normas sobre el ejercicio de los derechos de autor y derechos afines. Entre las muchas cuestiones que aborda esta reforma está la adopción de medidas para promover el uso de obras y prestaciones fuera de circuito comercial por parte de las instituciones responsables del patrimonio cultural.
La caída de las obras en dominio público se produce como consecuencia de la temporalidad de los derechos de explotación del autor (que como regla general duran toda su vida y 70 años después de su fallecimiento, art. 41 LPI).
La digitalización y puesta en acceso abierto de obras que ya han pasado a dominio público no plantea problemas jurídicos sustanciales siempre que se mencione la autoría y se respete la integridad de la obra. Si bien no es tan frecuente incluir obras en dominio público en los repositorios académicos internos (que por su naturaleza y sus fines están vinculados a la difusión de la producción científica propia), son recursos frecuentes para bibliotecas digitales como EUROPEANA[74].
Las cuestiones que se abordan en este apartado son ¿qué previsiones han de incluirse en los contratos de edición literaria para la explotación de libros digitales? ¿es obligatorio utilizar símbolos de reserva de derechos y registrar las obras en el Registro General de la Propiedad Intelectual?
¿qué implicaciones tiene no hacerlo? ¿existe una obligación de depósito legal para las publicaciones en línea y para las publicaciones electrónicas?
Tan sólo una puntualización respecto a las nuevas ediciones, traducciones y antologías de obras en dominio público. Las transformaciones de las obras literarias, artísticas o científicas (traducciones, adaptaciones, revisiones, actualizaciones…) son, a su vez, objeto de propiedad intelectual. Cuando se trate de obras en dominio público estos actos pueden realizarse libremente (sin solicitar autorización) pero el resultado traerá como consecuencia una nueva obra protegida. Por tanto la editorial (en su relaciones con los traductores, adaptadores, revisores….) que publique una antología (por ejemplo de poetas cuyos derechos de explotación estén en dominio público) o haga una adaptación de una obra clásica, o una nueva edición ilustrada, o un audiolibro, etc., es titular de derechos de propiedad intelectual sobre una nueva obra que podrá decidir publicar en acceso abierto, en acceso restringido (oponiéndose a la explotación por terceros) y/o a través de las modalidades de explotación que considere.
Tras abordar diversos aspectos referidos a publicaciones en abierto, a continuación queremos plantear una serie de reflexiones sobre la publicación en acceso restringido de obras y aspectos de propiedad intelectual relacionados. Están centradas en la edición digital aunque muchas son extrapolables a la edición comercial analógica o tradicional. Por publicación digital en acceso restringido entendemos, en una definición propia, la publicación de libros en formato digital (por ejemplo pdf o ePub) para su explotación comercial a través de la web del editor o a través de las de terceros (es decir, la vía tradicional de explotación en la que sólo se permite el acceso o la descarga del libro previo pago).
El instrumento para articular las relaciones jurídicas entre el autor y el editor es el contrato de edición literaria. La Ley de Propiedad Intelectual dedica al contrato de edición una regulación que no ha sido reformada en años ni adaptada al ámbito digital. Es una regulación tan extensa como obsoleta (arts. 58 a 73 LPI). Está pensada únicamente para distribución ejemplares físicos y respecto a éstos tampoco tiene en mente procesos actuales tan extendidos como la impresión bajo demanda («POD»).
Por lo anterior es habitual e imprescindible para la publicación y comercialización de libros digitales incluir una cláusula en los contratos de edición indicando que se ceden al editor, además del derecho de reproducción y el distribución, el derecho de comunicación pública en su modalidad de «puesta a disposición». También serán habituales (de hecho es un requisito esencial para el contrato de edición literaria) otras previsiones como por ejemplo un tanto por ciento sobre el precio de venta al público como retribución proporcional al autor por los ejemplares digitales vendidos. Además son frecuentes otras formas adicionales de tarificación, como por ejemplo las liquidaciones al autor por páginas visualizadas.
Un supuesto habitual es que el editor se planteé la publicación en digital de una obra cuyos derechos los ostenta únicamente para la explotación como libro impreso. Aquí la solución más frecuente es formalizar una adenda (anexo) al antiguo contrato de edición previendo la publicación en digital por el tiempo que reste de vigencia al contrato.
En la publicación de libros digitales en acceso restringido suele usarse también el símbolo de «todos los derechos reservados» o «Copyright». Generalmente los titulares de derechos anteponen este símbolo © a su nombre precisando el lugar y el año de la edición. Decir que, pese a lo frecuente, no es una práctica obligatoria conforme al artículo 146 LPI. Por tanto un libro digital sin indicación sobre reserva de derechos es también una obra protegida (y no se puede, por ejemplo, reproducir libremente).
Tampoco es necesario para que las obras sean consideradas objeto de protección su inscripción en el Registro General de la Propiedad. Esta inscripción no es obligatoria y cuando se realiza tiene como efecto crear una presunción (que admite prueba en contrario) de que el titular inscrito lo es (arts. 144 y 145 LPI).
En cuanto al número de ISBN International Standar Book Number sabemos que identifica los libros en sus diferentes versiones, no las obras. Así una edición digital de una obra también impresa tendrá un número ISBN propio. A su vez la versión en formato pdf del libro tendrá un ISBN distinto a la versión Epub. El tema plantea no pocas cuestiones que se abordan en el clarificador documento «Directrices para la asignación del ISBN a los libros electrónicos y aplicaciones»[75] (Agencia Internacional del ISBN, 2010).
El Real Decreto 635/2015, de 10 de julio desarrolló el procedimiento de depósito legal que quedaba pendiente para las publicaciones en línea. En esencia, reguló la estrategia de recopilación y archivo de páginas webs, blogs, ebooks, etc (sean de acceso abierto o de acceso restringido) con la finalidad de preservar el patrimonio bibliográfico, sonoro, visual, audiovisual digitales y permitir el acceso al mismo con fines culturales, de investigación o información (Del Arco Blanco, 2015)[76].
Los sitios web están sujetos a la obligación de depósito, incluyendo los libros electrónicos y otros materiales asimilables a los de la edición en papel en ellos contenidos, ya sean sitios web libremente accesibles o sitios web de acceso restringido, y sea cual sea su formato. Las publicaciones electrónicas (llama así la ley a las que tienen un soporte tangible como un CD o CD-rom) han de llevan el número de depósito legal en lugar visible.
Téngase en cuenta que al cierre de este texto se tramita la mo-
dificación de la Ley de Depósito Legal para “su adaptación a la situación actual de la producción editorial”. La reforma en curso establece modificaciones sustanciales, como el hecho de que la Biblioteca Nacional de España y los centros de conservación autonómicos recibirán el archivo digital previo a la impresión con el fin de facilitar la consulta y la conservación del patrimonio bibliográfico.
La evolución del contexto tecnológico, social y económico conlleva un proceso de modernización del marco normativo de los datos abiertos y la reutilización de la información del sector público. A partir de la Directiva 2013/37/UE y de la Ley 18/2015, de 9 de julio y Ley 9/2017, de 8 de noviembre, las Administraciones y organismos del sector público quedan obligados a velar por la reutilización de la información que albergan.
Tras las anteriores se aprobó la Directiva 2019/1024 del Parlamento Europeo y del Consejo, de 20 de junio, relativa a los datos abiertos y la reutilización de la información del sector público (versión refundida). El legislador europeo considera que «La información del sector público representa una fuente extraordinaria de datos que puede contribuir a mejorar el mercado único y al desarrollo de nuevas aplicaciones para el consumidor y para las personas jurídicas. El empleo inteligente de los datos, incluido su tratamiento a través de aplicaciones de inteligencia artificial puede tener un efecto transformador en todos los sectores de la economía».
La Directiva establece el marco legal para la reutilización de la información en poder de organismos del sector público (entre ellos, las Universidades) o empresas públicas. Se aplica, y ésto es una de las novedades respecto a la anterior regulación, a los datos de investigación financiados con fondos públicos. También extiende el alcance de sus previsiones a los metadatos, datos dinámicos y datos de alto valor.
A los datos de investigación se refiere la Directiva con especial intensidad y establece que los países de la UE llevarán a cabo las actuaciones pertinentes destinadas a hacer que los datos de investigación financiada públicamente sean plenamente accesibles, en aplicación del principio de «apertura por defecto», y para fomentar que los datos de la investigación sean localizables, accesibles, interoperables y reutilizables (principios «FAIR»).
El espíritu de esta normativa no es una llamada a la apertura de datos sin más, sino una apertura de datos en su máximo potencial para que sean reutilizados «garantizando la detectabilidad en línea y la disponibilidad en tiempo real de los documentos y los metadatos conexos en formatos abiertos, legibles por máquina y que garantizan la reuntilización y la accesibilidad». Todo ello con una dimensión social ya que la posibilidad de reutilización se contempla para los consumidores y se extiende también a las personas jurídicas (es decir, empresas emergentes y a pequeñas y medianas podrán reutilizar esos datos con fines comerciales y no comerciales).[77]
La apertura de datos no se dará, entre otros casos, cuando existan derechos de propiedad intelectual e industrial sobre los mismos. De ahí el principio, a interpretar y que plantea un debate jurídico fascitante, de datos «tan abiertos como sea posible, tan cerrados como sea necesario».
La Directiva de datos abiertos diferencia los datos científicos de las publicaciones científicas y excluye expresamente a éstas últimas de su ámbito de aplicación. Por tanto la Directiva es aplicable a datos de investigación (y no considera como documentos reutilizables las monografías, obras colectivas o revistas que, por ejemplo, estén en la biblioteca de la Universidad). Tampoco a las monografías o artículos publicadas por editoriales universitarias o por instituciones del sector público.
Conviene observar que normalmente los artículos científicos y otros resultados de investigación están sometidos a derechos de propiedad intelectual, esta es la razón de ser de que estén excluidas de la Directiva de datos abiertos (De Román Pérez, 2021). Sin embargo y estando de acuerdo con la anterior observación hay una cuestión que cabe plantear ¿se aplica la Directiva a los datos vinculados e identificativos de las publicaciones científicas? Piénsese que, el marcado semántico a través de XML, las publicaciones en html, o indicadores bibliográficos como el DOI, generan datos o son datos en sí. La calificación de esos datos y su consideración como datos sujetos a la Directiva puede ser un impulso para la apertura de datos por defecto y para la aplicación de las tarifas previstas en la normativa europea para la reutilización de datos y de datos de alto valor (ya que aunque la reutilización de documentos debe ser gratuita podrá permitirse la recuperación de los costes marginales y, en determinados casos, de costes superiores a los marginales).
El Real Decreto-ley 24/2021, de 2 de noviembre, de transposición de diversas directivas de la Unión Europea publicado cuando se cierra la edición de esta guía aborda, entre otras cuestiones, la transposición al ordenamiento jurídico español de la mencionada Directiva de datos abiertos y de la Directiva (UE) 2019/789 por la que se establecen las normas sobre el ejercicio de los derechos de autor y derechos afines.
La digitalización y abordar la circulación del conocimiento científico elevado a su máxima potencia implica generar datos. Por tanto conlleva un esfuerzo para pensar no solo en términos de gestion de contenidos sino también en términos de datos (en datos como vehículo de difusión de los contenidos). Se trata de un espacio que se abstrae de lo analógico para buscar otras fuentes, medios, y recursos (también jurídicos) de divulgación ajustados a la pluralidad de matices que encierra el concepto de lectura y que va más allá de la comercialización de libros en formato digital a través de las propia web y/o de intermediarios.
La esencia de esta transformación la define Fernández Sanmamed indicando que «los editores han pasado de publicar libros a publicar datos y esto requiere cambios en su flujo de trabajo».
Estamos ante un econosistema del caso concreto en el que pueden convivir publicaciones analógicas con digitales y que hay que plantearse, a mi entender, con nuevas gafas, otro traje, y un paraguas. Las gafas de los datos y el traje de otras maneras de acompañar los contenidos (como cláusulas contractuales ajustadas a la explotación digital, licencias para articular jurídicamente el acceso, contratación de servicios como el marcado semántico en XML, nuevos identificadores, y formatos que vayan más allá del pdf). Y, continuándo con el símil, la edición digital require, también, la precaución constante de llevar un paraguas que ponga a cubierto a los titulares de derechos de propiedad intelecual.
[68] De Román Pérez, R. (Coord.) (2020). Información en abierto y propiedad intelectual en la Universidad. Granada: Comares.
[69] De Román Pérez, R. (2021). Propiedad Intelectual y aulas virtuales. Granada: Comares.
[75] https://view.officeapps.live.com/op/view.aspx?src=https%3A%2F%2Fagenciaisbn.es%2Fweb%2Farchivos%2FDirectrices_para_la_asignacion_del_ISBN_a_los_libros_electonicos_y_aplicaciones.doc&wdOrigin=BROWSELINK
[76] Del Arco Blanco, A. (2015). El archivo de internet. Granada, Comares.
[77] Puede ampliarse esta información en las publicaciones del profesor JuliánValero Torrijos y en sus trabajos recientes y a lo largo de la tramitación de la Directiva. https://datos.gob.es/ca/blog/conclusiones-del-congreso-sobre-datos-abiertos-y-reutilizacion-de-la-informacion-del-sector
Tabla resumen (no exhaustiva) de preguntas planteadas y respuestas*
Publicaciones digitales en acceso abierto (acceso libre y gratuito) |
|
¿Hasta qué punto se están publicando en España obras en acceso abierto (en acceso libre y gratuito)? |
El desarrollo del acceso abierto en revistas ha sido rápido y es relativamente frecuente (en parte por la obligación que establece Ley de Ciencia de publicar en abierto los resultados de investigación financiados públicamente y por las previsiones de los programas europeos de investigación) |
¿Qué autorizaciones necesitan las editoriales para publicar en acceso abierto? |
Autorización de los titulares de derechos, es decir del autor o de sus herederos |
¿Qué tipo de licencias han de llevar estas publicaciones en abierto? |
Las licencias generalmente usadas son las llamadas licencias creative common. En particular se recomienda la que permite el uso de la obra mencionando la autoría pero impide la explotación comercial y que la obra sea modificada. |
¿Disponen las editoriales españolas de políticas de acceso abierto? |
Como regla general las editoriales científicas españolas no están publicando libros en acceso abierto (hay casos aislados pero en ocasiones simplemente dan acceso al pdf y no incluyen otros formatos como Epub o html o marcado semántico en XML). Las políticas editoriales sobre acceso abierto podrían incluirse en la web de cada editor (aunque quizás esto sea algo controvertido). También pueden establecerse, para cada caso concreto y transcurrido un tiempo desde la publicación, en el contrato de edición. |
¿Cómo proceder para dar acceso abierto a un libro descatalogado? |
Si un libro ha sido descatalogado por el editor implica que ha indicado que la obra queda fuera de circuito comercial. En consecuencia, y simplificando, los derechos retornarían a los titulares originarios. Un editor no puede poner en acceso abierto libros previamente descatalogados (por él o por otro editor) sin contar con la autorización de los titulares de derechos. |
¿Qué cuestiones han de tenerse en cuenta para poner en abierto obras en dominio público? |
Entre otras que, aunque las obras estén en dominio público, puede haber editores que tengan derechos sobre el archivo (la maquetación y composición gráfica del texto). También que las traducciones, revisiones, adaptaciones, etc, de obras en dominio público dan lugar a una nueva obra protegida. |
Publicaciones digitales en acceso restringido (acceso o descarga previo pago) |
|
¿Qué previsiones han de incluirse en los contratos de edición literaria para la explotación de libros digitales? |
Es imprescindible incluir una cláusula por la que el autor (o sus herederos) cedan al editor el derecho de comunicación pública en su modalidad de “puesta a disposición”. |
¿Es obligatorio incluir símbolos de reserva de derechos y registrar la publicaciones digitales en el Registro de Propiedad Intelectual? |
No, no es obligatorio incluir símbolos de reserva de derechos ni en las publicaciones impresas ni en las digitales (aunque sea una práctica habitual). Tampoco es obligatoria la inscripción de las obras o prestaciones en el Registro de (inscribirlas tiene el efecto que se menciona en el cuerpo del texto). Aunque las obras no lleven el símbolo del copyright o no estén inscritas en el Registro son, con carácter general, obras protegidas. |
¿La edición digital de una obra también impresa tendrá un número ISBN propio? |
Sí, para más información se recomienda consultar “Directrices para la asignación del ISBN a los libros electrónicos y aplicaciones” (Agencia Internacional del ISBN, 2010). |
¿Las publicaciones en línea y las publicaciones electrónicas son objeto de la obligación de depósito legal? |
Sí* |
*Esta tabla no constituye asesoramiento jurídico ni aborda en profundidad los matices que cada supuesto concreto puede plantear. Es sólo una síntesis de algunas de las cuestiones tratadas en el texto al que acompaña.
* Téngase en cuenta que al cierre de este texto se tramita la modificación de la Ley de Depósito Legal para “su adaptación a la situación actual de la producción editorial”. La reforma en curso establece modificaciones sustanciales, como el hecho de que la Biblioteca Nacional de España y los centros de conservación autonómicos recibirán el archivo digital previo a la impresión con el fin de facilitar la consulta y la conservación del patrimonio bibliográfico.
Book Interchange Tag Set: JATS Extension https://jats.nlm.nih.gov/extensions/bits/rationale.html
CERLALC. Dosier Inteligencia artificial: transformaciones y retos en el sector editorial. https://cerlalc.org/publicaciones/dosier-inteligencia-artificial-transformaciones-y-retos-en-el-sector-editorial/
Chesson, D. (2021, August 19th). Amazon Popularity Effect: How Amazon Treats Book Discoverability. Kindlepreneur. com. https://kindlepreneur.com/amazon-popularity-effect-how-amazon-treats-book-discoverability/
Clague, T. How to make sure your book is discoverable. https://authorservices.taylorandfrancis.com/making-your-book-discoverable/
Conrad, L. Y. (2021, July 14th). Digital Transformation Requires Cultural Evolution. The Scholarly Kitchen. https://scholarlykitchen.sspnet.org/2021/07/14/title-digital-transformation-requires-cultural-evolution/
De Román Pérez, R. (Coord.) (2020). Información en abierto y propiedad intelectual en la universidad. Granada: Comares.
De Román Pérez, R. (2021). Propiedad Intelectual y aulas virtuales. Granada: Comares.
Del Arco Blanco, A. y Rojas, L. (2016) El archivo de internet. Depósito Legal de las publicaciones electrónicas tras el Real Decreto, 635/2015 de 10 de junio. Granada; Comares. https://www.comares.com/media/comares/files/book-attachment-6366.pdf
Giménez Toledo, E. (Ed.). (2017). La edición académica española. Indicadores y características. Madrid: Federación de Gremios de Editores de España. ISBN: 978-84-86141-66-0 Disponible en http://ilia.cchs.csic.es/SPI/spi-fgee/docs/EAEV2.pdf
Giménez Toledo, E. (Ed.). (2019). La edición universitaria española. Análisis de la producción editorial de libros. https://www.une.es/media/Ou1/Image2/webnoviembre2019/EstudioUNE-Produccion_editorial.pdf
Giménez Toledo, E. (2020). Transformaciones en la comunicación científica. Revista de Occidente. (475), 60-65.
Giménez Toledo, E. y Córdoba-Restrepo, J. F. (2008). Edición académica y difusión: libro abierto en Iberoamérica. Bogotá/ Granada: Universidad del Rosario; Comares. https://doi.org/10.12804/th9789587841671
Giménez Toledo, E., Córdoba Restrepo, J. F., Giraldo González,
E. y Mañana Rodríguez, J. (2021). Calidad y prestigio de la edición académica. El caso colombiano. Signo y Pensamiento, 40(78). https://doi.org/10.11144/Javeriana.syp.40-78.cpea
Giménez Toledo, E. y Giraldo, E. (2021). Cartografía de la edición académica iberoamericana. Comparativa Colombia/España, 2013- 2019. Liber, 13 de octubre 2021, Madrid.
Giménez Toledo, E., Kulczycki, E., Pölönen, J. y Gunnar Sivertsen (2019). Bibliodiversity–What it is and why it is essential to creating situated knowledge. London School of Economics Impact blog. https://blogs.lse.ac.uk/impactofsocialsciences/2019/12/05/bibliodiversity-what-it-is-and-why-it-is-essential-to-creating-situated-knowledge/
Giménez-Toledo, E. y Mañana-Rodríguez, J. (2016). La edición académica española a partir de sus metadatos. Trama & Texturas, 31, 125-131. http://hdl.handle.net/10261/219767
Giménez Toledo, E. y Mañana Rodríguez, J. (19-20 septiembre 2019). Boosting Open Access books in Spanish &, contributing to the multilingualism in the Open Access space. Third Research Evaluation in the SSH Conference (RESSH 2019). Valencia, España. https://ressh2019.webs.upv.es/wp-content/uploads/2019/10/ressh_2019_paper_16.pdf
Gingras, Y. y Khelfaoui, M. (2019). Do we need a book citation index for research evaluation?. Research Evaluation, 28(4), 383-393.
Guidelines from the Committee on Publications Ethics (COPE). https://publicationethics.org/core-practices
How books and journals are produced. The Chicago Manual of Style online. https://www.chicagomanualofstyle.org/help-tools/production-technologies.html
Kaiser, K. A., Urberg, M., Johnsson, M., Kemp, J., Meadows,
A. y Paglione, L. (2021). An international, multistakeholder survey about metadata awareness, knowledge, and use in scholarly communications. Quantitative Science Studies, 2(2), 454–473. https://doi.org/10.1162/qss_a_00133
Make sure your book is discoverable advice for the reader oriented autor. LSE Impact blog. https://blogs.lse.ac.uk/impactofsocialsciences/2017/11/08/make-sure-your-book-is-discoverable-advice-for-the-reader-oriented-author/
Maryl, M., y Błaszczyńska, M. (Eds.). (2021). Future of Scholarly Communication. Forging an inclusive and innovative research infrastructure for scholarly communication in Social Sciences and Humanities. Zenodo. https://doi.org/10.5281/zenodo.5017705
Mellado, A. (2020).Claves de la transformación digital del negocio del libro impreso (parte 1). Actualidad editorial. https://www.actualidadeditorial.com/claves-transformacion-digital-del-negocio-del-libro-impreso-parte-1/
Mellado, A. (2020). Claves de la transformación digital del negocio del libro impreso (parte 2). Actualidad editorial. https://www.actualidadeditorial.com/claves-de-la-transformacion-digital-del-negocio-del-libro-impreso-parte-2/
Mellado, A. (2021). Diez premisas fundamentales en la edición del siglo XXI. Actualidad editorial. https://www.actualidadeditorial.com/decalogo-de-la-edicion-inteligente/
de Oliveira, A. B. (2019). Los libros en Ciencias Sociales y Humanidades en Brasil: un estudio a partir de los investigadores y de las editoriales. [Tesis]. Universidad Complutense de Madrid. https:// eprints.ucm.es/cgi/export/55556
Sello CEA/APQ de colecciones académicas. Guía de evaluación. https://www.selloceaapq.es/archivos/convocatorias/ guia-de-ev1641557515.pdf
Schilhan, L., Kaier, C. y Lackner, K. (2021). Increasing visibility and discoverability of scholarly publications with academic search engine optimization. Insights, 34(1). https://insights. uksg.org/articles/10.1629/uksg.534/print/
Sharma, A. (2019). XML Workflow: The New Content Process Publishers Need. Magicedtech. https://www.magicedtech.com/blog/xml-workflow-content-engineering-process-for-publishers
Shubert, M. (2019). Produkt-Suchmaschine Amazon: Wie Kunden Ihre Bücher finden. Buchreport. https://www.buchreport.de/news/pp-amazon-seo-produkt-suchmaschine-wie-kunden-ihre-buecher-finden/
Shubert, M. (2019). Amazon-SEO: So entsteht Ihre Keyword-Strategie. Buchreport. https://www.buchreport.de/news/ppamazon-seo-so-entsteht-ihre-keyword-strategie/
Shubert, M. (2019). Die optimale Produktdarstellung auf Amazon. Buchreport. https://www.buchreport.de/news/pp-die-optimale-produktdarstellung-auf-amazon/
Shubert, M. (2019). So setzen Sie Amazon Advertising optimal ein. Buchreport. https://www.buchreport.de/news/pp-so-setzen-sie-amazon-advertising-optimal-ein/
Sivertsen, G. y Larsen, B. (2012). Comprehensive bibliographic coverage of the social sciences and humanities in a citation index: An empirical analysis of the potential. Scientometrics, 91(2), 567-575. https://doi.org/10.1007/s11192-011-
0615-3
Suñol Lucea, A. (2015). El caso de los libros descatalogados. https://almacendederecho.org/el-caso-de-los-libros-descatalogados
Testa, J. (2017). The selection process for the Book Citation Index in Web Of Science. Clarivate. https://clarivate.com/webofsciencegroup/essays/selection-process-book-citation-index-web-science/
Thompson, J. B. (2021). Book wars. The digital revolution in publishing.
Vera-Baceta, M. A., Thelwall, M. y Kousha, K. (2019). Web of Science and Scopus language coverage. Scientometrics, 121(3), 1803-1813. https://doi.org/10.1007/s11192-019-03264-z
Why Publishers Should Care About Persistent Identifiers. https://scholarlykitchen.sspnet.org/2021/06/21/why-publishers-should-care-about-persistent-identifiers/