O que é Big Data?

Hoje daremos início a uma pequena série de posts sobre Big Data e iremos falar sobre o que é o Big Data em si. Nos próximos posts abordaremos as diferenças entre Big Data e BI, e como essas ferramentas em conjunto estão revolucionando o mercado. Fique ligado!

Antes de definirmos o que é Big Data e de falar sobre qual o rumo que essa ferramenta está tomando, uma pergunta pertinente é:

Por que surgiu o Big Data?

O motivo é claro: com o advento da internet (e posteriormente das redes sociais), o volume de dados nos últimos anos aumentou significativamente, fazendo com que as ferramentas até então utilizadas para manipular esses dados se tornassem limitadas e insuficientes.

Para ter uma ideia da quantidade de dados que é gerada atualmente, confira o infográfico desenvolvido pela good.is em colaboração com a IBM:

 

 

O Big Data então vem suprir a demanda que os bancos de dados tradicionais (como SQL server e oracle database, por exemplo) não são capazes de atender, por melhores e maiores que sejam.  

Formalmente, Big Data é definido como um conjunto de técnicas e recursos computacionais baseados em programação e algorítmos que é capaz de processar e analisar um volume de dados extremamente grande.

Os dados referentes ao Big Data podem ser oriundos de diversas fontes, que são classificadas em duas categorias:

Fontes Estruturadas

São dados armazenados em bancos de dados tradicionais, organizados em tabelas, que se manifestam na forma de números ou caracteres. Esses dados possuem esquema fixo, formato bem definido e simplicidade para relacionar informações.

Fontes Não-Estruturadas

São dados mesclados, provenientes dos mais diversos tipos de fontes, como vídeo, texto, áudio, imagens, etc. Esses dados não possuem um tipo predefinido ou estrutura regular, e possuem uma certa facilidade de alteração. É esse tipo de dado que compõem a maior parte do Big Data.

Ferramentas tradicionais possuem capacidade de lidar com dados estruturados, mas não conseguem associar dados não-estruturados. Quando misturamos esses dois tipos de dados e conseguimos encontrar a correlação entre ambos, temos um volume gigantesco de informações. É disso que se trata o Big Data.

 

O Big Data é caracterizado em 5 V’s:

Volume

Diz respeito a enorme quantidade de dados envolvidos, como o próprio nome já diz. De acordo com um estudo realizado pela IDC, o volume de conteúdo digital está dobrando a cada dois anos. Em 2013 existiam cerca de 4,4 trilhões de gigabytes no planeta, e esse número está previsto para atingir os 44 trilhões de gigabytes até 2020.

 

Velocidade

Os dados em Big Data são gerados muito rapidamente. Cada vez mais é aparente a necessidade da geração de dados em tempo real, fato que pode ser claramente observado em casos de utilização de sensores, digitais e senhas. A velocidade é definida de acordo com o quão rápido os dados são resgatados, armazenados e recuperados. 

 

Variedade

Um grande volume de dados precede uma grande variedade de dados. Assim, o Big Data inclui não apenas dados transacionais comuns mas também dados provenientes de páginas da web, índices de pesquisa, fóruns, mídias sociais, dados de sensores variados, IoT, e por aí vai. 

 

Veracidade

Esse quesito se refere à confiabilidade dos dados. Para a manipulação dos dados em Big Data ser efetiva, os dados devem ser consistentes, realistas, e oriundos de fatos, jamais de opiniões.

 

Valor

O valor nada mais é do que encontrar no Big Data uma aplicação que permita aumentar a receita da empresa de algum modo. Identificar novas oportunidades, economizar custos, melhorar a qualidade do produto – independente de qual seja a melhor aplicação para uma empresa, só faz sentido ter todo o uso do Big Data se os dados agregarem valor à organização.

 

Aplicações do Big Data

Os usos do Big Data são variados, e empresas dos mais diversos segmentos tem se beneficiado dessa ferramenta. Grandes exemplos são o Netflix e o Youtube, que através da manipulação de bancos de dados gigantescos conseguem recomendar filmes e vídeos que se encaixem ao perfil do usuário. Nessa mesma linha de raciocínio, também podemos citar o Spotify como grande exemplo.

Outros exemplos incluem o monitoramento em redes sociais, web analytics (sites de e-commerce), análises de dados financeiros para evitar fraudes, análises de dados médicos, publicidade e propaganda personalizados e direcionados, informações sobre trânsito em tempo real, etc.

Como podemos observar, o Big Data não é só um tema corriqueiro na vida das pessoas que trabalham com tecnologia, mas sim uma realidade que está presente e influenciando a vida de todos nós.

 

Tecnologias Envolvidas em Big Data

Para conseguir manipular diferentes tipos de dados e encontrar aplicações eficientes para os mesmos, o Big Data conta com uma vasta gama de tecnologias, como: sistemas de arquivos distribuídos, processamento paralelo massivo, computação em nuvem, grids de mineração de dados, redes de alta velocidade, sistemas de armazenamento escaláveis, algorítmos específicos, inteligência artificial, entre outros. Em suma, o Big Data é composto por diversas diretrizes.

Para saber mais sobre o Big Data, curta nossa página nas redes sociais e acompanhe nossos próximos posts!


Entre em contato conosco!

Please follow and like us:

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *