Hadoop é uma solução open-source de processamento de dados que foi desenvolvida pela Apache Software Foundation e tem como principal objetivo o processamento de dados com alto volume e variedade por meio de computação de larga escala.
Mês: agosto 2015
Processamento Distribuído com MapReduce
MapReduce foi projetado para usar computação paralela distribuída em Big Data e transformar os dados em pedaços menores.
Big Data’s 4 Vs
Os 4 Vs do Big Data são: Volume, Variety, Velocity e Veracity.
Fascinante Machine Learning
Machine Learning (ou Aprendizado de Máquina) é uma das tecnologias atuais mais fascinantes. Você provavelmente usa algoritmos de aprendizado várias vezes por dia sem saber.
Cientista de Dados x Engenheiro de Dados
Ciência de Dados e Engenharia de Dados são 2 diferentes ramos de atuação dentro do conceito de Big Data e as funções de Cientista de Dados e Engenheiro de Dados são normalmente confundidas.
Ciência de Dados e Soluções
Com uma quantidade imensa de dados sendo gerados e coletados, as empresas estão focadas na criação de vantagens competitivas pela exploração destes dados.
Cientista de Dados – Parte 2
Enquanto a maioria dos Cientistas de Dados trabalhou como analistas de dados estatísticos, outros vêm de campos não técnicos, como administração ou economia.
Cientista de Dados – Parte 1
Cientistas de Dados são uma nova geração de especialistas analíticos que têm as habilidades técnicas para resolver problemas complexos.
O que é Data Science?
A ciência de dados difere das análises estatísticas e da ciência da computação em seu método que é aplicado a dados coletados usando princípios científicos.