
Crédito: Peter Dazeley/Getty
Em meio a temores de dados de pesquisa que desaparecem para político e razões técnicas, cientistas, bibliotecários e arquivistas estão chamando fraquezas na maneira como o registro acadêmico está sendo preservado.
As equipes que executam repositórios de dados estão sendo instadas a ter planos de contingência que protegeriam seus dados no caso de emergências. Isso pode incluir a formação de redes com outros repositórios, que podem intervir se ocorrer uma falha. Os editores também estão sendo solicitados a usar serviços de arquivamento para garantir a segurança de seu conteúdo.
Dados de pesquisa desaparecem com mais frequência do que as pessoas podem esperar. Por exemplo, um estudo de 20231 Dos mais de 3.000 repositórios de dados de pesquisa mostraram que 191 deles haviam fechado. Desses, o 90 não manteve o acesso aos seus dados ou nomeou um repositório que assumiu a custódia dos dados, o que poderia indicar que os dados foram perdidos. “O encerramento do repositório representa uma ameaça real à disponibilidade perpétua de dados de pesquisa”, escreveu o autor principal Dorothea Strecker, que pesquisa a gestão aberta de ciências e dados de pesquisa na Universidade de Humboldt de Berlim e seus colegas.
Repositórios de dados como o PubMed, a Web of Science e Scopus são um recurso essencial para os pesquisadores, porque ajudam a melhorar a acessibilidade, confiabilidade e reutilização dos dados. Mas Como uma interrupção de marcha do PubMed deixou claroesses recursos não são infalíveis. Uma análise de 20152 Dos 326 bancos de dados, descobriram que mais de 60% haviam desaparecido, não eram funcionais ou tinham funcionalidade limitada e 14% foram arquivados em um período de 18 anos.
Jonas Recker, arquivista do Instituto de Ciências Sociais de Leibniz em Mannheim, Alemanha, diz que a possibilidade de fechamento pode ser negligenciada por equipes que executam repositórios. “Muitas vezes, não pensamos o suficiente sobre os piores cenários, como perda de financiamento ou mudança da missão da organização de hospedagem”, diz ele.
Recker diz que o Remoção de alguns conjuntos de dados relacionados ao gênero e diversidade dos sites do governo dos EUA Em fevereiro, lembrou a comunidade científica da necessidade de construir “redes fortes” com diversos fornecedores de “geolocalização, tecnologia e técnicos, organizações anfitriãs e fontes de financiamento” para garantir que o conhecimento científico seja preservado.
Distribuição de dados
Muitos repositórios são fechados devido à falta de financiamento, dificuldades técnicas ou mudanças organizacionais, descobriram Strecker e seus colegas. Como a preservação “geralmente repousa apenas em repositórios individuais”, Strecker diz que gostaria de ver uma abordagem mais “distribuída” da preservação, como o desenvolvimento de redes que preservam os dados se um repositório for fechado.
Recker concorda, acrescentando que essa abordagem pode aliviar a pressão sobre os repositórios individuais. Ele recomenda que os repositórios se conectem com outras pessoas que são “semelhantes” a eles de alguma forma, como compartilhar uma disciplina de pesquisa, tipo de dados ou público. “Um grupo de repositórios do Rede alemã de dados de pesquisa educacional Atualmente, está trabalhando em um modelo de ‘Lista de verificação de cessação’, que destaca coisas práticas que um repositório pode fazer para se preparar para uma situação em que a transferência de dados para outro repositório pode se tornar necessária ”, diz ele. Ter esse preparado pode ajudar a funcionar para trabalhar em que um acordo mais formal pode ser transferido, como um memorando de entendimento, afirmam, afirmam ou ajudam a esclarecer“ que as partes podem ser transferidas.

2024 Líderes de pesquisa
As redes de preservação estão em vigor para publicações de texto. Lockss (muitas cópias mantêm as coisas seguras)por exemplo, é um programa de código aberto desenvolvido pela Universidade de Stanford, na Califórnia, que faz várias cópias de conteúdo e depois as armazena nos servidores de bibliotecas em todo o mundo que pagam uma taxa anual para ter suas coleções preservadas. Os arquivos ‘sombrios’ – nos quais trabalhos de pesquisa e outros conteúdos permanecem principalmente inacessíveis ao público e são usados principalmente para fins de restauração ou recuperação em caso de corrupção de dados ou outras interrupções significativas – são outra opção. O Clockss (muitas cópias controladas mantêm as coisas seguras) Arquivo escuroque também está sendo esgotado de Stanford, fornece acesso ao seu arquivo apenas em resposta a eventos de gatilho específicos, como o editor que interrompe as operações ou o conteúdo não está disponível por um período acordado.
Martin Eve, pesquisador de literatura, tecnologia e publicação em Birkbeck, Universidade de Londres, exorta os editores a se envolverem com esses serviços. Um estudo que ele publicou no ano passado de quase 7,5 milhões de trabalhos de pesquisa descobriram que mais de um quarto deles não havia sido adequadamente arquivado e preservado3. “Os editores precisam ser atualizados sobre o que precisam fazer para fazê -lo funcionar”, diz ele. “Caso contrário, o que teremos daqui a 50 anos é um monte de links que pensávamos ser persistentes, que acabaram de desaparecer do uso e um sistema que não é ótimo para transmitir conhecimento”.
A pesquisa de Eve constatou que os editores mais ricos eram mais propensos a ter boas medidas de preservação digital do que aquelas menores e menos bem-bem-sucedidas-um fato que não é surpreendente para o pesquisador de comunicações acadêmicas Juan Pablo Alperin na Universidade Simon Fraser, em Vancouver, Canadá. O custo de serviços como o Clockss (os editores recebem uma taxa de participação anual baseada na publicação de receita) “pode ser proibitiva para alguns periódicos, especialmente aqueles que operam em lugares como o sul global”, diz Alperin. Ele acrescenta que é importante que as opções estejam disponíveis para editores e repositórios em locais mais pobres.