Introdução

No dia 5 desse mês participei de um evento promovido pela AWS sobre como usar nuvem (especialmente a deles) para acelerar pesquisa. Além de adesivos, levei algumas coisas comigo desse evento e gostaria de compartilhar.

Esse evento foi dividido em duas partes. De manhã houve palestras sobre diferentes usos de AWS para pesquisa e estudos de casos com pesquisadores e de tarde houve um workshop.

sim@cloud

Para mim, o destaque das palestras foi a apresentação da professora Lucia Drummond sobre o SIM@CLOUD, que é um framework que otimiza custo de simulações feitos na nuvem usando instâncias spot da AWS.

Essas instâncias possuem um desconto consideravel em seu custo, as vezes de até 90%, pois usam uma capacidade ociosa dos datacenters. No entanto, quando a AWS precisar dessa capacidade, ela vai deletar sua máquina após um aviso prévio de 2 minutos. Por tanto sua aplicação deve ser tolerante a falhas e estar preparada para tratar esse aviso de desligamento. SIM@CLOUD automatiza a migração de simulações entre instâncias spot, assim mitigando o problema de desligamento prématuro.

O time dela já usou essa ferramenta com a Petrobras para rodar algumas simulações de forma mais econômica. Em tese a ferramenta é open-source, mas estou com dificuldade para encontrar o código fonte da mesma. Se eu encontrar o código, vou editar esse texto e adicionar um link para ele.

Pesquisando sobre o tema encontrei os seguintes artigos que parecem interessantes:

Workshop

No workshop, usamos o jupiter notebook integrado a AWS. O material utilizado está disponivel nesse repositório. Em particular, utilizamos esse notebook.

Percorremos o básico de containers e subimos uma aplicação de comparação de DNA na infra da AWS. Ainda não tive tempo para revisitar o material após o workshop, se fizer isso, atualizo esse tempo com mais comentários sobre.