- Pesquisadores do MIT criaram o Sandook, um sistema de software que gerencia workloads em pools de SSDs para aumentar desempenho e uso efetivo de armazenamento em data centers.
- O Sandook usa arquitetura de duas camadas: um escalonador global define tarefas para o conjunto e controladores locais reorientam dados rapidamente conforme a demanda.
- O método lida com três variações de desempenho de SSDs — diferenças entre unidades, mistura de leituras e gravações, e coleta de lixo — simulando situações reais sem hardware especializado.
- Em testes com dez SSDs e quatro tarefas (banco de dados, treinamento de modelo, compressão de imagens e armazenamento de dados de usuários), houve ganho de vazão entre 12% e 94% frente métodos estáticos, com melhoria de 23% na utilização.
- A solução atingiu 95% do desempenho máximo teórico dos SSDs, abrindo caminho para maior eficiência sem substituir hardware, com potencial de futuras integrações e otimizações baseadas em IA.
O MIT desenvolveu um sistema que aumenta o desempenho de unidades de armazenamento em data centers ao equilibrar cargas de trabalho de forma inteligente. O objetivo é melhorar a eficiência sem exigir hardware especializado, adaptando-se a workload dinâmico.
O estudo apresenta Sandook, um software que gerencia várias SSDs em pool para múltiplas aplicações. A ideia é evitar que a capacidade ociosa de dispositivos se torne gargalo por variação de desempenho entre eles.
O sistema opera sem necessidade de hardware novo e foi testado em tarefas realistas, como treinamento de modelos de IA e compressão de imagens. Em comparação com métodos tradicionais, houve ganho de desempenho significativo.
Sandook: como funciona
Sandook usa uma arquitetura de duas camadas: um controlador global decide a distribuição de tarefas no pool, enquanto controladores locais reencaminham dados rapidamente quando um dispositivo fica sobrecarregado.
A estratégia rotaciona leituras e gravações entre SSDs para reduzir interferência, acelerando operações. Perfis de desempenho de cada unidade ajudam a detectar gargalos de coleta de lixo.
Duas frentes estratégicas acompanham a variabilidade: diferenças entre SSDs por desgaste e idade; e a discrepância entre operações de leitura e escrita no mesmo dispositivo. A coleta de lixo é monitorada para ajustar a carga.
“Não basta jogar mais recursos; é preciso preservar a longevidade dos dispositivos caros”, afirma Chaudhry, autor principal do estudo. A solução adapta-se em tempo real a cargas flutuantes.
Resultados e perspectivas
Em testes com pool de 10 SSDs, Sandook elevou a taxa de transferência entre 12% e 94% por tarefa, e aumentou a utilização da capacidade em 23%. O sistema atingiu 95% do rendimento teórico sem hardware específico.
Os pesquisadores destacam que o modelo pode melhorar ainda mais com protocolos de SSDs atuais e previsibilidade de workloads de IA. A equipe pretende futuras integrações com novas rotas de dados.
O trabalho foi apresentado no USENIX Symposium on Networked Systems Design and Implementation. Financiamento veio de instituições como NSF, DARPA e Semiconductor Research Corporation.
Entre na conversa da comunidade