Deduplicação de Contatos em Dispositivos Móveis Utilizando Similaridade Textual e Aprendizado de Máquina

  • Rafael F. Machado Univ. Federal do Rio Grande
  • Rafael F. Pinheiro Univ. Federal do Rio Grande
  • Karina S. Machado Univ. Federal do Rio Grande
  • Eduardo N. Borges Univ. Federal do Rio Grande

Resumo


Informações redundantes e muitas vezes incompletas reduzem consideravelmente a produtividade oferecida pelos dispositivos móveis. Este artigo apresenta um método que identifica contatos duplicados, ou seja, registros que representam a mesma pessoa ou organização, coletados automaticamente de múltiplas fontes de dados. Os contatos são comparados utilizando diversas funções de similaridade cujos escores são combinados por um modelo de classificação baseado em árvores de decisão, que elimina a necessidade do especialista para configurar limiares de similaridade. Os experimentos realizados mostram que o método proposto identificou corretamente até 92% dos contatos duplicados.

Palavras-chave: Deduplicação, gerência de contatos, similaridade, aprendizado de máquina

Referências

ABES - Associação Brasileira de Empresas de Software. 2015. Disponível em: . Acesso em: 08/02/2016.

ABPMP. BPM CBOK - Guide to the Business Process Management Common Body of Knowledge. Versão 3. 2013.
ABREU, M. F. Os riscos da terceirização da TI e da adoção de novas TIs e suas relações com os riscos para as estratégias competitivas das organizações. 2009.

BERGAMASCHI, Sidnei. Modelos de Gestão da Terceirização de Tecnologia da Informação: Um Estudo Exploratório. Tese (doutorado) – Universidade de São Paulo, 2004.

BERNSTORFF, V. H; CUNHA, J. C. O. que as organizações buscam e alcançar com a terceirização da tecnologia da informação In: XXIII Encontro Anual da ANPAD, 1999, Foz do Iguaçu/PR ANAIS. ANPAD, 1999.

BRAGA, R. Auditoria de Governança de TI. Brasília: TCU/ISC, 2009.

CAVALCANTI, S.C. O Novo Modelo de Contratação de Soluções de TI pela Administração Pública Federal. 2a. Ed. Belo Horizonte. Editora Fórum, 2015.

CHRISSIS, M. D., KONRAD, M. E SHRUM S. “CMMI: guidelines for process integration and product improvement”. Addison-Wesley. 2010.

CRUZ, C. S. da. Governança de TI e Conformidade Legal no Setor Público: Um Quadro Referencial Normativo para a Contratação de Serviços de TI. 2008. Dissertação de Mestrado. Universidade Católica de Brasília, Brasília, 2008. Disponível em: . Acesso em: 15/12/2016.

FORRESTER, E., BUTEAU, B., SHRUM, S. CMMI: Guidelines for Superior Service. Addison-Wesley. 2010.

GALLAGHER, B., PHILLIPS, M., RICHTER, K., SHRUM, S. CMMI: Guidelines for Improving the Acquisition of Products and Services. Addison-Wesley. 2010.

ISO/IEC, 2011. International Organization For Standardization/ International Electrotechnical Comission. ISO/IEC 20000 Information Technology– Service Management, Geneve: ISO, 2011.

LIRA, W. S.; CÂNDIDO, G. A.; ARAÚJO, G. M. & BARROS, M. A. A busca e o uso da informação nas organizações. Perspectivas em Ciência da Informação. Vol. 13, n. 1, Belo Horizonte, 2008.

SEI, 2010. Software Engineering Institute. CMMI for Development. 2010.

SILVA, L. S. P. Modelo de Contratação de Soluções de TI: Uma Analise Comparativa para Identificar a Maturidade e a Aderência aos Modelos CMMI-ACQ, CMMI-DEV e CMMI-SVC. 2013. Dissertação (Mestrado em Ciência da Computação) - Centro de Informática – Universidade Federal de Pernambuco, Recife, Pernambuco, 2013.

TRIBUNAL DE CONTAS DA UNIÃO. Acórdão 2.308/2010- TCU-Plenário. 2010. Disponível em: . Acesso em: 15/12/2016
Publicado
17/05/2016
MACHADO, Rafael F.; PINHEIRO, Rafael F.; MACHADO, Karina S.; BORGES, Eduardo N.. Deduplicação de Contatos em Dispositivos Móveis Utilizando Similaridade Textual e Aprendizado de Máquina. In: SIMPÓSIO BRASILEIRO DE SISTEMAS DE INFORMAÇÃO (SBSI), 12. , 2016, Florianópolis. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2016 . p. 160-167. DOI: https://doi.org/10.5753/sbsi.2016.5958.