Artigo publicado no TKDE
terça-feira, 10 jul 2012O pesquisador Moises Carvalho teve seu artigo “A Genetic Programming Approach to Record Deduplication” (Uma abordagem de programação genética para identificar réplicas em registros, em tradução livre) publicado no Transactions on Knowledge and Data Engineering, um dos periódicos mais respeitados e conceituados da IEEE Computer Society. É um dos principais expoentes de trabalhos na área de gerência e gestão de dados e conhecimento na área da computação. O artigo apresenta uma proposta para resolver um problema antigo de banco de dados – identificação de registros duplicados.
Muitas vezes, os bancos de dados recebem informações em duplicidade. Isso ocorre por problemas com a identificação das informações no coletor de informações, dados parecidos, senhas erradas ou pouco confiáveis e, principalmente, quando há integração informações distintas associadas ao mesmo usuário.
Esse tipo de inconsistência na gestão de informações duplicadas não apenas aumentam custos de manutenção, como também demandam mais tempo para processar consultas.
A solução proposta por Moises define um meio de limpar o banco de dados por meio de função capaz de identificar essas entradas duplicadas. Uma vez identificadas as réplicas, é possível tornar os bancos de dados mais enxutos e concisos – mas sem perder informações. O artigo propõe o uso de uma técnica chamada Programação Genética para gerar e configurar adequadamente essa função que identifica as réplicas.
O artigo pode ser acessado pelo link abaixo:
http://www.computer.org/csdl/trans/tk/2012/03/ttk2012030399-abs.html
Imprensa, Notícias