Após um período-piloto de testes e de consultas à comunidade de pesquisa, entrou em operação nesta quarta-feira (1º) o COVID-19 Data Sharing/BR, o primeiro repositório de dados abertos do Brasil com dados demográficos e exames clínicos e laboratoriais de pacientes que fizeram testes para a doença em unidades laboratoriais no país e em hospitais do estado de São Paulo.
O repositório abriga dados abertos e anonimizados de, inicialmente, mais de 177 mil pacientes, 9.634 dados de desfecho e um total de quase 5 milhões de resultados de exames clínicos e laboratoriais realizados em todo o país pelo Grupo Fleury e na cidade de São Paulo pelos hospitais Israelita Albert Einstein e Sírio-Libanês desde novembro de 2019.
Ainda que o primeiro caso da doença no Brasil tenha sido registrado em fevereiro, pelo Hospital Albert Einstein, o período de cobertura dos dados permitirá aos pesquisadores analisarem o histórico de saúde, bem como buscar evidências de sintomas de COVID-19 em pacientes atendidos anteriormente.
Novos dados serão inseridos regularmente pelo Grupo Fleury, Hospital Sírio-Libanês e Israelita Albert Einstein e gerenciados no repositório, sediado na Universidade de São Paulo (USP). As quatro instituições disponibilizaram informações, infraestrutura, tecnologias e recursos humanos próprios para viabilizar o compartilhamento de dados.
A Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp) está em tratativas avançadas com outras instituições de atendimento a pacientes, públicas e privadas, para compartilhar informações no repositório COVID-19 Data Sharing/BR.
A base de dados é resultado de uma iniciativa da Fapesp, em parceria com a Universidade de São Paulo (USP), e tem o objetivo de compartilhar informações clínicas anonimizadas de pacientes para subsidiar pesquisas científicas sobre a doença nas diversas áreas de conhecimento.
“Ciência é cada vez mais uma atividade coletiva e as iniciativas de compartilhamento de dados têm se ampliado em todo o mundo. A estratégia de Open Science da Fapesp é o pano de fundo desta iniciativa. Buscamos aproveitar a crise para alavancar a iniciativa de Data Sharing sediada na USP. Nossa expectativa é que possamos não apenas agregar novos parceiros, mas, sobretudo, contribuir para que a comunidade cientifica tenha dados de qualidade para propor soluções que nos permitam enfrentar a pandemia”, afirma à Agência Fapesp Luiz Eugênio Mello, diretor-científico da Fundação.
Categorias
O repositório disponibiliza três categorias de informação: dados demográficos (gênero, ano de nascimento e região de residência do paciente) e de exames clínicos e/ou laboratoriais, além de informações, quando disponíveis, sobre a movimentação do paciente, como internações, por exemplo, e desfecho dos casos, como recuperação ou óbitos.
Em uma segunda etapa, que já está sendo planejada pela iniciativa, o COVID-19 Data Sharing/BR abrigará também dados de imagens, como radiografias e tomografias.
O lançamento do repositório teve um cronograma de três etapas. Uma versão pequena do conjunto de dados foi inicialmente disponibilizada no dia 17 de junho para um período-piloto de consultas. Dessa forma, a comunidade de pesquisa pôde baixar os dados e começou a analisá-los e visualizá-los usando técnicas de ciência de dados.
Até o dia 24 de junho, os grupos de pesquisa interessados puderam enviar dúvidas e comentários para os responsáveis pelo repositório COVID-19 Data Sharing/BR. Nesse período, foram recebidos cerca de 30 e-mails com perguntas e sugestões de pesquisadores.