Vamos abrir uma série de artigos sobre conceitos básicos de Estatística, que são fundamentais no universo da Ciência de Dados. Neste primeiro artigo, vamos falar sobre Descriptive statistics vs Inferential statistics (Estatística Descritiva vs Estatística Inferencial). Probabilidade é um dos conceitos mais básicos e fundamentais na Estatística. Até mesmo para começar a entender o sentido dos seus…
Autor: David Matos
Business Intelligence x Data Science
Business Intelligence e Data Science tem muita coisa em comum e Cientistas de Dados focados em negócios e Analistas de Negócios que trabalham com Business Intelligence são como primos. Ambos usam dados para trabalhar para o mesmo objetivo, mas a sua abordagem, tecnologia e função diferem de diversas maneiras. Vamos definir, comparar e diferenciar Business…
Tipos de Analytics
Cientistas de dados centrados em negócios utilizam análise de dados para gerar insights a partir de dados brutos e obter informação que gere benefício para as organizações. Os tipos de análise abaixo, são os mais comuns e estão listados em ordem crescente de complexidade: Análise Descritiva (Descriptive Analytics): Este tipo de análise responde à pergunta:…
Ciência de Dados Centrada em Negócios
Para a maioria dos gerentes e diretores de grandes e médias empresas, a Ciência de Dados é interessante por causa dos benefícios que ela pode gerar. A maioria dos gerentes de negócios e líderes organizacionais não poderia se importar menos sobre codificação e algoritmos estatísticos complexos. Eles são, por outro lado, extremamente interessados em encontrar…
A Internet das Coisas (IoT – Internet of Things)
A Internet das Coisas (IoT – Internet of Things) é um cenário em que os objetos, animais e pessoas possuem identificadores únicos e a capacidade de transferir dados através de uma rede sem a necessidade de interação humana.
Processamento de Dados com Hadoop
Hadoop é uma solução open-source de processamento de dados que foi desenvolvida pela Apache Software Foundation e tem como principal objetivo o processamento de dados com alto volume e variedade por meio de computação de larga escala.
Processamento Distribuído com MapReduce
MapReduce foi projetado para usar computação paralela distribuída em Big Data e transformar os dados em pedaços menores.
Big Data’s 4 Vs
Os 4 Vs do Big Data são: Volume, Variety, Velocity e Veracity.
Fascinante Machine Learning
Machine Learning (ou Aprendizado de Máquina) é uma das tecnologias atuais mais fascinantes. Você provavelmente usa algoritmos de aprendizado várias vezes por dia sem saber.
Cientista de Dados x Engenheiro de Dados
Ciência de Dados e Engenharia de Dados são 2 diferentes ramos de atuação dentro do conceito de Big Data e as funções de Cientista de Dados e Engenheiro de Dados são normalmente confundidas.