Scan for MARC

scan for marcUm dos muitos benefícios que a chegada da internet trouxe para as bibliotecas de todo o mundo foi a possibilidade de fazerem intercâmbio de informações. Dessa forma, ao invés das instituições realizarem a catalogação de cada exemplar que recebem, elas podem copiar e compartilhar os registros já existentes por meio da rede de computadores, utilizando um formato internacional de intercâmbio denominado MARC21, cuja sigla remete ao significado de Catalogação Legível por Máquina.


Ao mesmo tempo, o uso dessa ferramenta ainda é impraticável em muitas bibliotecas brasileiras, tanto porque algumas não possuem todo seu acervo informatizado, quanto porque outras utilizam softwares próprios para catalogação, que não permitem a troca com os programas das demais instituições. Foi pensando em contornar essa situação que as pesquisadoras Zaira Regina Zafalon, do Departamento de Ciência da Informação da UFSCar, e Plácida Leopoldina Ventura Amorim da Costa Santos, da Unesp de Marília, e o programador Jairo da Silva desenvolveram o Scan for MARC, um programa de computador destinado a converter dados catalográficos analógicos em registros no Formato MARC21.


Para utilizar o Scan for MARC o usuário deve capturar uma imagem da catalogação original, seja por foto, escaneamento ou outro meio, e então passá-la pelo software, que irá processar essa figura e codificá-la em texto. No entanto, é necessário que esses dados estejam representados a partir do Anglo American Cataloging Rules (AACR), um padrão internacional de descrição das informações contidas em um documento. Assim, com registros em Formato MARC21, torna-se possível garantir o intercâmbio de dados a partir da interoperabilidade entre sistemas, ou seja, a partir da conversa entre máquinas com a menor interferência humana possível.


Sem o programa desenvolvido, uma das possibilidades é que o bibliotecário faça uma busca em um catálogo cooperativo, que pode possuir centenas de cadastros para um mesmo livro e autor, e então ler cada um deles para definir qual se refere ao documento que se quer registrar. Além de exigir um alto dispêndio de tempo do profissional, esse método demanda que o usuário insira manualmente aqueles dados que são únicos para cada instituição, como conteúdo do documento, dados de localização na estante e termos de busca. Assim, outra vantagem do Scan for MARC é que, ao se ter uma imagem do registro da própria biblioteca, o resultado já vem com as informações adequadas, sendo desnecessário ajustes.


Zaira Zafalon argumenta que, com o uso do software, o processo de conversão de dados sofrerá uma abreviação significativa, visto que no processo manual há um gasto de tempo de cerca de 15 minutos por documento, entre copiar, alterar o que for necessário, inserir os dados específicos e salvar o registro. “Hoje o Scan for MARC demora segundos para ler e processar cada imagem. No entanto, o objetivo é que o processo não seja mais de um registro por vez, e sim processamento em lote”, garante.


O software é resultado da tese de doutorado da pesquisadora, apresentada em junho de 2012 ao programa de Pós-graduação em Ciência da Informação da Unesp, sob orientação de Plácida Santos. Após a defesa, o trabalho recebeu algumas premiações devido à contribuição para sua área de pesquisa, o que aumentou a visibilidade do produto e levou algumas instituições a manifestarem interesse pelo uso do Scan for MARC, como a Biblioteca Nacional do Rio de Janeiro e a Biblioteca Pública Mario de Andrade, em São Paulo, respectivamente as duas maiores do Brasil. Interesse também foi manifestado pela Biblioteca do Instituto Butantã, também em São Paulo e a do Instituto Nacional de Pesquisas da Amazônia (INPA).


Foi a partir do contato com essas instituições que as pesquisadoras constataram que havia um problema maior do que elas pensavam nas bibliotecas brasileiras. Antes, a preocupação era com o fato delas não utilizarem do MARC para o compartilhamento de registros, decorrente, em parte, do software que utilizavam. Somente depois percebeu-se que muitas sequer possuíam seu acervo completo de forma automatizada, o que impede o acesso da sociedade a grande parte dos documentos. “Para mim, vender ou não vender pode ser interessante, mas é fator secundário. Estamos bem mais preocupados em mover um outro universo, melhorar as bibliotecas. É uma contribuição muito mais acadêmica e social do que mercantil”, defende Zaira.


Atualmente, o desenvolvimento do software está no início de sua segunda fase. A primeira, de concepção, teve o objetivo de fazê-lo funcionar, mas o manteve em programação via linha de comando. Isso quer dizer que era necessário fazer um processamento manual para o upload da imagem e em seguida um processamento em um software de OCR, que transforma a imagem capturada em um texto editável, para somente depois passá-lo pelo Scan for MARC. Agora, na fase de compilação, pretende-se automatizar esse processo, embutindo o OCR no próprio Scan for MARC, de forma que seja possível inserir a imagem direto no programa criado.


Futuramente, a ideia é que a tecnologia, que apenas converte um registro já automatizado para o MARC, também consiga fazer a conversão diretamente das fichas manuais. Além disso, pretende-se que o Scan for MARC também capture os dados a partir da fonte, ou seja, da própria catalogação presente no livro e que sejam desenvolvidas mais versões do produto, adequadas ao registro de outros tipos documentais, como gravação de som, filmes e mapas.