Ir para o conteudo 1 Ir para o menu principal2

Usamos cookies para melhorar sua experiência de navegação no Portal Dataprev. Para ter mais informações sobre como isso é feito, acesse nosso Aviso de PrivacidadeAo continuar navegando, você confirma que leu, compreendeu e consente com a utilização de cookies.

Atualizado em: 
sex, 19/04/2024 - 18:13

Nesta quinzena o tema é armazenamento de objeto, ou object storage, no termo em inglês. Entenda como funciona essa solução, que está em processo de expansão na empresa

arte em triângulo com imagem abstrataNesta quinzena, o Dataprev Explica é sobre armazenamento de objeto, ou object storage, no termo em inglês. Confira abaixo como funciona essa solução, que está em processo de expansão na empresa.

O armazenamento de objeto é um modelo de armazenamento projetado para lidar com grandes quantidades de dados, especialmente não estruturados – ou seja, em vez de tabelas e números, são arquivos de fotos, áudios, vídeos e documentos de texto mais extensos, ou mapeamentos de geolocalização, por exemplo.

Os dados não estruturados são aqueles que não obedecem a um formato rígido, por isso não podem ser organizados em uma tabela. Ao enxergar esses dados como objetos, a arquitetura de storage object não usa uma hierarquia de arquivos em pastas. Eles são dispostos em um único grande ambiente, conhecido como “lago" ou "pool" de dados (data lake).

Cada dado está associado a seus metadados, que, basicamente, são informações sobre o próprio arquivo, como nome, tipo e tamanho, ou alguma tag que agregue informação extra sobre o conteúdo ou finalidade do arquivo. Por exemplo, CPF do cidadão, tipo de serviço, nome da mãe, ou qualquer outro atributo relevante. Além disso, cada objeto possui um indicador único, que permite a sua busca e recuperação por meio de APIs.

Esse modelo simplifica a estrutura, já que, nesse caso, não é necessário que um sistema operacional faça a intermediação no acesso aos dados. Ou seja, uma aplicação pode se comunicar via API diretamente com a camada de armazenamento. O acesso direto aos arquivos facilita a integração com aplicações e serviços de nuvem, proporcionando vantagens como escalabilidade, que é a maior capacidade para aumentar o volume de dados sem as limitações típicas de um hardware físico.

A eficiência do armazenamento de objeto, contudo, depende das características ou necessidades específicas dos aplicativos. É uma solução que funciona melhor para armazenamento de dados estáticos. Ou seja, aqueles que podem ser lidos diversas vezes, mas não são modificados com frequência. Um exemplo seria um documento em formato PDF de uma identidade ou certidão de nascimento.

No caso de arquivos dinâmicos, que são alterados constantemente, a melhor opção ainda deve ser o armazenamento em sistemas de armazenamento mais rápidos (no caso da Dataprev, o Hitachi VSP F1500, onde estão discos sólidos). Essa solução mais tradicional divide os dados em blocos de tamanho fixo e é recomendada, entre outros casos, para bancos de dados, que exigem taxas de leitura e gravação mais rápidas. Entretanto, é uma opção mais cara, que não oferece o recurso de metadados e demanda um sistema operacional para intermediar o acesso a esses blocos de dados.

Outra tecnologia, bastante adotada no mercado, é o NAS (Network Attached Storage), um modelo de armazenamento que trabalha com o compartilhamento de arquivos em uma rede, e pode ser eficiente para aplicações que dependem de uma estrutura de diretórios hierárquica, organizada em pastas. Portanto, tudo depende da funcionalidade desejada. No caso do armazenamento de objeto, a menor complexidade do sistema, a sua capacidade de expansão e a comunicação com serviços de nuvem garantem economia e um melhor custo-benefício, em muitos casos.

A empresa já faz uso do armazenamento de objetos há dois anos e vai investir em maior capacidade da tecnologia até junho. Cada um dos três data centers (Brasília, Rio de Janeiro e São Paulo) possui 700 Terabytes (TB) nessa arquitetura. E soluções importantes da empresa, como o e-Consignado ou o Brasil Participativo (plataforma digital utilizada pelo governo para participação cidadã e consultas públicas) já fazem uso do storage object.