Entenda o que é Big Data

Com o aumento do volume de dados gerados que cresce a cada dia, juntamente com a redução do preço do hardware de armazenamento, possibilitou que empresas privadas e instituições de pesquisa armazenassem mais dados sobre seus usuários, negócios, mídias sociais, etc.

Para poder lidar com esse grande volume de dados não-estruturados é utilizado o Big Data. Através do Big Data é possivel análisar e a interpretar grandes volumes de dados com diferentes formatos. Os dados podem variar bastante desde posts nas redes sociais como Facebook, fotos, vídeos, tweets, informações de sensores, etc.

A análise dos dados através das ferramentas de Big Data permitem que as empresas melhorem suas estratégias de marketing, produtividade, reduzir custos e tomar decisões rápidas.

As empresas usam o Big Data para saber a preferência dos clientes. Um exemplo disso são as sugestões de sites de compras, como a Americanas, ou sugestões de vídeos no youtube.

As principais características do Big Data são: Volume, Variedade, Velocidade, Veracidade e Valor.

Os aspectos de Volume, Variedade e Velocidade, estão relacionados a grande quantidade de dados não-estruturados que devem ser analisados pelas soluções de Big Data a uma grande velocidade.

A Veracidade diz respeito as fontes e a qualidade dos dados, pois eles devem ser confiáveis.

Já o valor é relacionado aos benefícios que as soluções de Big Data vão trazer para uma empresa, sendo necessario analizar o custo-beneficio trazidos pelo uso de Big Data.


Bancos de Dados

Os bancos de dados para Big Data são diferentes dos modelos tradicionais, como o MySQL e PostgreSQL. Devido a necessidade de lidar com grandes volumes de dados e de vários tipos, é necessário usar processamento distribuído e ter elasticidade, suportando aplicações com volumes de dados que crescem muito em pouco tempo. Para tal, é usando bancos do tipo NoSQL, (Not only SQL).

Bancos do tipo NoSQL permitem armazenamento de diversas formas, não se limitando ao modelo relacional tradicional. Eles permitem maior escalabilidade com melhor custo-beneficio. Alguns exemplos de bancos de dado NoSQL são: o Cassandra, o MongoDB, o HBase, o CouchDB e o Redis.