Detecção Multilíngue de Serviços Web Duplicados Baseada na Similaridade Textual

  • Erick Nilsen Pereira Souza UFBA
  • Daniela Barreiro Claro UFBA

Resumo


O agrupamento por similaridade representa uma etapa relevante nas estratégias de descoberta e composição de serviços web. Muitos métodos de agrupamento processam as descrições dos serviços em linguagem natural para estimar o grau de correlação entre eles. Entretanto, a utilização de bases de conhecimento em idiomas específicos limita a aplicabilidade desses métodos. Neste artigo e proposto um modelo multilíngue para agrupamento de serviços web similares a partir das suas descrições em linguagem natural. Em particular, foi aplicado o Latent Semantic Indexing (LSI), um método de Recuperação da Informação (RI) independente da língua e do domínio. Além disso, foi feita uma análise experimental com três medidas de similaridade, a fim de determinar qual delas e mais adequada à detecção de serviços web duplicados a partir das descrições dos serviços em dois idiomas.

Publicado
27/05/2014
SOUZA, Erick Nilsen Pereira; CLARO, Daniela Barreiro. Detecção Multilíngue de Serviços Web Duplicados Baseada na Similaridade Textual. In: SIMPÓSIO BRASILEIRO DE SISTEMAS DE INFORMAÇÃO (SBSI), 10. , 2014, Londrina. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2014 . p. 506-517. DOI: https://doi.org/10.5753/sbsi.2014.6140.

Artigos mais lidos do(s) mesmo(s) autor(es)