Optimized Extraction of Records from the Web Using Signal Processing and Machine Learning
Resumo
É apresentado, neste artigo, uma otimização realizada em cima de um trabalho anterior, dos mesmos autores, que propõe uma técnica de extração de registros estruturados de páginas web. A otimização proposta melhora a complexidade de tempo de O(nlogn) para O(n) enquanto mantém os mesmos resultados qualitativos apresentados anteriormente (i.e., sem perda de eficácia). Os seguintes resultados foram obtidos: melhoria de 47% no tempo de execução quando comparado com o trabalho anterior e f-score de 95% (mesmo obtido no trabalho anterior).
Referências
Goodman, B. and Flaxman, S. (2017). European union regulations on algorithmic decision making and a "right to explanation". AI Magazine, 38(3):50–57.
Hu, M. and Liu, B. (2004). Mining and summarizing customer reviews. In 10th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pages 168–177.
Ju, H. and Yu, H. (2018). Sentiment Classication with Convolutional Neural Network using Multiple Word Representations. In 12th Int. Conf. on Ubiquitous Information Management and Communication, pages 1–7.
Liu, B. (2012). Sentiment Analysis and Opinion Mining. Morgan & Claypool Publishers. Pontiki, M., Galanis, D., Androutsopoulos, I., Manandhar, S., and Papageorgiou, H. (2014). SemEval-2014 Task 4: Aspect Based Sentiment Analysis. In 8th International Workshop on Semantic Evaluation, pages 27–35.
Pontiki, M., Galanis, D., Papageorgiou, H., Manandhar, S., and Androutsopoulos, I. (2015). Semeval-2015 task 12: Aspect based sentiment analysis. In 9th International Workshop on Semantic Evaluation, pages 486–495.
Scheicher, R. B., Sinoara, R. A., Felinto, J. C., and Rezende, S. O. (2019). Sentiment In 19th ACM classication improvement using semantically enriched information. Symposium on Document Engineering, pages 1–4.
Scheicher, R. B., Sinoara, R. A., Koga, N. J., and Rezende, S. O. (2016). Uso de expressões do domínio na classicação automática de documentos. Nacional de Inteligência Articial e Computacional, pages 625 – 636.
Xiong, S. (2016). Improving twitter sentiment classication via multi-level sentiment-enriched word embeddings.