terça-feira, 28 de outubro de 2008

Padrões no uso de repositórios

DOWNLOADS DO REPOSITÓRIUM EM ABRIL DE 2008

DOWNLOADS DO REPOSITÓRIUM EM JUNHO DE 2008

Um novo post do Repository Man (Les Carr) que me relembrou e me "forçou" a escrever sobre algo que já vinha reparando há cerca de um ano, e que tinha despertado a minha curiosidade e interesse.

Trata-se da existência de muita regularidade, de autênticos padrões, na utilização dos repositórios. De acordo com o Les Carr, no repositório da School of Electronics and Computer Science University of Southampton, que regista cerca de 30,000 downloads por mês, existe um padrão de utilização semanal com picos de utilização à segunda ou terça-feira, seguidos por uma pequena descida gradual no resto da semana, uma "queda" ao sábado (com cerca de 1/3 dos níveis de pico) e um ligeiro aumento ao domingo.

Este "padrão" reportado pelo Les Carr, pareceu-me muito familiar. Desde há muito que tinha reparado que, no RepositóriUM, na maioria das semanas, as terças-feiras eram o dia de maior utilização, que o número de downloads se reduzia sensivelmente à sexta-feira (mas nem sempre à quarta e quinta), e que o nível mínimo se regista quase sempre ao sábado, verificando-se um pequeno aumento ao domingo.

Fui olhar de novo para os dados de downloads do RepositóriUM (eles são públicos de um modo agregado), e na breve análise que pude fazer, confirmei a minha impressão da existência de alguma semelhança entre o padrão do uso do repositório de Southampton e os dados do uso do RepositóriUM. No entanto, a "olho nu", parecem existir também algumas diferenças:

1 - Parece existir maior variação do número de downloads mensais no RepositóriUM (em 2007 variou entre os 52.608 de Janeiro e os 101.166 de Outubro, enquanto em 2008 registou-se um mínimo de 58.951 em Agosto, e o máximo até ao momento foi de 119.101 em Junho) do que em Southampton;

2- A utilização do RepositóriUM parece apresentar maiores variações ao longo das semanas entre segunda e quinta-feira, do que acontece em Southampton, ainda que na maioria das semanas ocorra o fenómeno identificado pelo Les Carr do pico ocorrer no início da semana (segunda ou terça) e registar-se depois uma ligeira diminuição, que é mais (e sempre) significativa à sexta.

A partir desta análise preliminar julgo que uma das explicações para esta diferença poderá estar relacionada com uma maior correlação e "dependência" dos níveis de uso do RepositóriUM com os calendários e ritmos de trabalho (feriados, férias, calendário escolar, etc.) dos dois países que originam cerca de 2/3 dos downloads: Portugal e Brasil.

No entanto será necessário fazer uma análise mais detalhada (nomeadaamente identificando o que são semanas "normais" e semanas "atípicas" - semanas com feriados e "pontes", semanas em períodos não lectivos, como as férias de Natal, Páscoa, de Julho a Setembro) para tirar algumas conclusões mais seguras, poder fazer um estudo comparativo com outros repositórios e avançar com alguma explicação para o fenómeno.


Quando eu e o Ricardo Saraiva (que me ajudará também nesta tarefa) tivermos algum tempo para isso, darei aqui mais notícias.




Sem comentários:

 
Creative Commons License
Cibertecário 0.2 by Eloy Rodrigues is licensed under a Creative Commons Atribuição-Uso Não-Comercial-Partilha nos termos da mesma Licença 2.5 Portugal License.