Avaliação do Controle de Acesso de Múltiplos Usuários e Múltiplos Arquivos em um Ambiente Hadoop
Resumo
O processamento massivo de dados é uma realidade para diversos sistemas computacionais. A segurança dos dados processados é de grande importância, uma vez que o ambiente normalmente é compartilhado entre múltiplos usuários. Este artigo apresenta uma avaliação do controle de acesso de múltiplos usuários a múltiplos arquivos, considerando os diferentes níveis de controle de um ambiente Hadoop (sistema operacional, sistema de arquivo distribuído e interface web). Um cenário de teste é proposto e validado nos diferentes níveis e diferentes versões de uma distribuição do Hadoop (Hortonworks). As versões apresentaram mesmo comportamento mas identificamos erros e diferenças entre os níveis de controle.
Referências
Hadoop. “The Apache Hadoop.” http://hadoop.apache.org/.
HadoopIssues. “Hadoop Issues Tracking.” https://issues.apache.org/jira/browse/HADOOP.
HDFS. “Hadoop Distributed File System.” http://hadoop.apache.org/hdfs/.
HDFSIssues. “HDFS Issues Tracking.” https://issues.apache.org/jira/browse/HDFS.
Hortonworks. “Hortonworks: Open Enterprise Hadoop.” http://hortonworks.com.
Hue. “Hue - Hadoop User Experience - The Apache Hadoop UI.” http://gethue.com/.
Shvachko, Konstantin, Hairong Kuang, Sanjay Radia, and Robert Chansler. 2010. “The Hadoop Distributed File System.” In Proc. of the MSST - Symp. on Mass Storage Systems and Technologies, IEEE, 1–10.
Tabatabaei, Mahsa. 2014. “Evaluation of Security in Hadoop.” KTH Royal Institute of Technology.
Tankard, Colin. 2012. “Big Data Security.” Network Security 2012(7): 5–8.
Thusoo, Ashish, J.S. Sarma, Namit Jain, Zheng Shao, Prasad Chakka, Suresh Anthony, Hao Liu, Pete Wyckoff, and Raghotham Murthy. 2009. “Hive - A Warehousing Solution Over a Map-Reduce Framework.” Proceedings of the VLDB Endowment 2(2): 1626–29.
White, Tom. 2012. Hadoop: The Definitive Guide, 3rd Edition. 3rd ed. O’Reilly Media.
Zikopoulos, Paul C., Chris Eaton, Dirk DeRoos, Thomas Deutsch, and George Lapis. 2012. Understanding Big Data: Analytics for Enterprise Class Hadoop and Streaming Data. McGraw-Hill.