Hoje daremos início a uma pequena série de posts sobre Big Data. Nesse post, iremos falar sobre o que ele é em si. Nos próximos posts, abordaremos as diferenças entre Big Data e Business Intelligence, e como essas ferramentas em conjunto estão revolucionando o mercado. Fique ligado!
Antes de definirmos o que é Big Data e de falar sobre qual o rumo que essa ferramenta está tomando, uma pergunta pertinente é:
Por que surgiu e o que é Big Data?
Com o advento da internet, e posteriormente das redes sociais, o volume de dados nos últimos anos aumentou significativamente. Isso fez com que as ferramentas até então utilizadas para manipular esses dados se tornassem limitadas e insuficientes.
O Big Data, então, vem suprir a demanda que os bancos de dados tradicionais (como SQL server e oracle database, por exemplo) não são capazes de atender, por melhores e maiores que sejam.
Formalmente, é definido como um conjunto de técnicas e recursos computacionais baseados em programação e algorítmos que é capaz de processar e analisar um volume de dados extremamente grande.
Quais são as categorias do Big Data?
Os dados referentes ao Big Data podem ser oriundos de diversas fontes, que são classificadas em duas categorias:
Fontes Estruturadas
São dados armazenados em bancos de dados tradicionais, organizados em tabelas, que se manifestam na forma de números ou caracteres. Esses dados possuem esquema fixo, formato bem definido e simplicidade para relacionar informações.
Fontes Não-Estruturadas
São dados mesclados, provenientes dos mais diversos tipos de fontes, como vídeo, texto, áudio, imagens, etc. Esses dados não possuem um tipo predefinido ou estrutura regular, e possuem uma certa facilidade de alteração. É esse tipo de dado que compõem a maior parte do Big Data.
Ferramentas tradicionais possuem capacidade de lidar com dados estruturados, mas não conseguem associar dados não-estruturados. Quando misturamos esses dois tipos de dados e conseguimos encontrar a correlação entre ambos, temos um volume gigantesco de informações.
Como o Big Data é caracterizado?
Ele é caracterizado em 5 V’s:
Volume
Diz respeito a enorme quantidade de dados envolvidos, como o próprio nome já diz. De acordo com um estudo realizado pela IDC, o volume de conteúdo digital está dobrando a cada dois anos. Em 2013 existiam cerca de 4,4 trilhões de gigabytes no planeta, e esse número está previsto para atingir os 44 trilhões de gigabytes até 2020.
Velocidade
Os dados em Big Data são gerados muito rapidamente. Cada vez mais é aparente a necessidade da geração de dados em tempo real, fato que pode ser claramente observado em casos de utilização de sensores, digitais e senhas. A velocidade é definida de acordo com o quão rápido os dados são resgatados, armazenados e recuperados.
Variedade
Um grande volume de dados precede uma grande variedade de dados. Assim, o Big Data inclui não apenas dados transacionais comuns mas também dados provenientes de páginas da web, índices de pesquisa, fóruns, mídias sociais, dados de sensores variados, IoT, e por aí vai.
Veracidade
Esse quesito se refere à confiabilidade dos dados. Para a manipulação dos dados em Big Data ser efetiva, os dados devem ser consistentes, realistas, e oriundos de fatos, jamais de opiniões.
Valor
O valor nada mais é do que encontrar no Big Data uma aplicação que permita aumentar a receita da empresa de algum modo. Identificar novas oportunidades, economizar custos, melhorar a qualidade do produto – independente de qual seja a melhor aplicação para uma empresa, só faz sentido ter todo o uso se os dados agregarem valor à organização.
Quais as aplicações dessa tecnologia?
Os usos do Big Data são variados, e empresas dos mais diversos segmentos tem se beneficiado dessa ferramenta. Grandes exemplos são a Netflix e o YouTube, que através da manipulação de bancos de dados gigantescos conseguem recomendar filmes e vídeos que se encaixem ao perfil do usuário. Nessa mesma linha de raciocínio, também podemos citar o Spotify como grande exemplo.
Outros exemplos incluem o monitoramento em redes sociais, web analytics (sites de e-commerce), análises de dados financeiros para evitar fraudes, análises de dados médicos, publicidade e propaganda personalizados e direcionados, informações sobre trânsito em tempo real, etc.
Como podemos observar, o Big Data não é só um tema corriqueiro na vida das pessoas que trabalham com tecnologia, mas sim uma realidade que está presente e influenciando a vida de todos nós.
Tecnologias Envolvidas em Big Data
Para conseguir manipular diferentes tipos de dados e encontrar aplicações eficientes para os mesmos, o Big Data conta com uma vasta gama de tecnologias, como: sistemas de arquivos distribuídos, processamento paralelo massivo, computação em nuvem, grids de mineração de dados, redes de alta velocidade, sistemas de armazenamento escaláveis, algorítmos específicos, inteligência artificial, entre outros. Em suma, é composto por diversas diretrizes.
Para saber mais sobre o assunto, curta nossa página nas redes sociais e acompanhe nossos próximos posts!