Uso de Aprendizado de Máquina para Categorização Automática de Conjuntos de Dados de Portais de Dados Abertos
Para disponibilizar seus dados para a sociedade, governos de cidades ao redor do mundo estão usando portais de dados abertos. Na maioria dos portais, os conjuntos de dados estão distribuídos por diversas categorias que representam os tópicos abordados pelo portal. Nesse contexto, oferecer mecanismos para auxiliar a categorização dos conjuntos de dados se torna importante, para facilitar o trabalho de um administrador de portais de dados abertos. Neste trabalho, apresentamos uma analise experimental para a categorização automática de conjuntos de dados de portais de dados abertos utilizando aprendizado de máquina supervisionado. Utilizamos o nome do conjunto de dados e os seus atributos de arquivos anexados para a inferência de sua categoria. Para processamento de textos, usamos técnicas de processamento de linguagem natural.
