Análise de um Serviço Virtual de Armazenamento que Explora Classes de Objetos na Nuvem e Padrões de Acesso
Resumo
Serviços de armazenamento de dados geralmente utilizam uma infraestrutura terceirizada de nuvem. Os dados são armazenados como objetos em diferentes classes da infraestrutura da nuvem, o que impacta diretamente no custo do provedor de serviço. Nesse sentido, investigamos um aspecto chave para serviços de armazenamento ``virtual'': a predição da frequência de acessos aos dados para alocá-los em classes de armazenamento adequadas. Com base no padrão de acesso aos dados dos usuários, propomos um arcabouço que prediz, dinamicamente, as classes adequadas para armazenar dados (objetos) em um futuro próximo. Avaliamos a eficiência desse arcabouço através de simulações baseadas em traços de acesso a dados de um dos serviços mais populares de armazenamento em nuvem, o Dropbox. Nossos resultados mostram uma acurácia de 81% na predição e uma economia de até 14% nos custos de armazenamento, aplicando a melhor qualidade de serviço no acesso aos dados.
Referências
Cisco (2019). Cisco Global Cloud Index: Forecast and Methodology, 2016–2021 WhitePaper. Disponível em https://www.cisco.com- Document ID 1513879861264127.
Gonçalves, G. et al. (2016). The impact of content sharing on cloud storage bandwidth consumption. IEEE Internet Computing, 20(4):26–35.
Gracia-Tinedo, R., García-López, P., Gómez, A., and Illana, A. (2016). Understanding data sharing in private personal clouds. In Proc. of the IEEE CLOUD.
Hsu, Y., Irie, R., Murata, S., and Matsuoka, M. (2018). A novel automated cloud storage tiering system through hot-cold data classification. In Proc. of the IEEE CLOUD.
Irie, R., Murata, S., Hsu, Y., and Matsuoka, M. (2018). A novel automated tiered storage architecture for achieving both cost saving and qoe. In Proc. of the IEEE SC2.
Josep, A. D., Katz, R., Konwinski, A., Gunho, L., PattErson, D., and Rabkin, A. (2010). A view of cloud computing. Communications of the ACM, 53(4).
Kaushik, R. T. and Bhandarkar, M. (2010). Greenhdfs: towards an energy-conserving, storage-efficient, hybrid hadoop compute cluster. In Proc. of the USENIX.
Liu, M., Pan, L., and Liu, S. (2019). To transfer or not: An online cost optimization algorithm for using two-tier storage-as-a-service clouds. IEEE Access, 7:94263–94275.
Mesnier, M., Ganger, G. R., and Riedel, E. (2003). Object-based storage.IEEE Communications Magazine, 41(8):84–90.
Muralidhar, S. et al. (2014). f4: Facebook’s warm blob storage system. In Proc. of the OSDI.
Ribeiro, S. O. et al. (2019). Análise de um serviço virtual de armazenamento em nuvem ciente de padrões de acesso por usuários. In Proc. of the ERCEMAPI.