Ciência de Dados é uma mistura de arte com engenharia. Reconhecer padrões nos dados, considerar que questionamentos devem ser feitos e determinar o melhor algoritmo para extrair a informação, seria o lado “arte” da Ciência de Dados.
Autor: David Matos
Chief Data Officer
Embora o volume de dados aumente a cada dia, o que requer investimento em armazenamento e análise, a má gestão dos dados ainda tem sido o que mais se vê no ambiente corporativo. Gerenciar dados custa caro e de acordo com o Gartner, estima-se um prejuízo na ordem de 13 bilhões de dólares com o gerenciamento ineficaz dos dados.
Análise de Sentimentos e Machine Learning
A ascensão das mídias sociais, como blogs e redes sociais tem despertado interesse em análise de sentimento. Com a proliferação de opiniões, avaliações, recomendações e outras formas de expressão on-line, a opinião se transformou em uma espécie de moeda virtual para empresas que desejam comercializar os seus produtos, identificar novas oportunidades e gerenciar suas reputações.
Pesquisa Salarial 2015 – Data Science
Foi publicada hoje pela O’Reilly a Pesquisa Salarial 2015 – Data Science, uma ampla pesquisa sobre o mercado de trabalho na área de Ciência de Dados. O relatório com a pesquisa completa pode ser acessado aqui. A pesquisa foi realizada com mais de 600 profissionais de Data Science em todo o mundo e mostrou muitos números…
Design de Visualização de Dados
Qualquer definição padrão de Ciência de Dados diz que sua principal função é “ajudá-lo a extrair significado e valor a partir de seus dados brutos“. Ou seja, encontrar e extrair insights de dados brutos está no cerne da Ciência de Dados. Entretanto, encontrar os insights certos, que possam fazer diferença na tomada de decisão, não…
Predictive Analytics
Predictive Analytics (Análise Preditiva) é a prática de extrair informações de conjuntos de dados, a fim de determinar padrões e resultados futuros. Perceba que não existe mágica: o Predictive Analytics não prevê o que vai acontecer exatamente no futuro. Ele prevê o que pode acontecer no futuro com um nível aceitável de confiabilidade e inclui…
Por quê escolher R?
R faz estatísticas. Você pode vê-lo como um concorrente de sistemas analíticos como SAS Analytics, para não mencionar os pacotes mais simples como StatSoft ou Minitab. Muitos estatísticos profissionais, sejam do governo, nos negócios ou na indústria farmacêutica passam suas carreiras usando IBM SPSS ou SAS sem escrever uma linha de código R. Por isso,…
Uma Breve Introdução ao R
R é uma linguagem de programação de computadores, que é usada para manipulação de dados estatísticos e gráficos. A linguagem R é amplamente utilizada entre os estatísticos e mineradores de dados para o desenvolvimento de software estatístico e análise de dados. Pesquisas recentes mostram que a popularidade do R tem aumentado substancialmente nos últimos anos….
Vocabulário Básico de Big Data
O campo de Big Data exige cada vez mais clareza, por conta da variedade de termos utilizados para descrever esta tecnologia e por isso podemos até mesmo dizer que já existe um vocabulário básico do Big Data, próprio desta tecnologia. Este post lista todos os principais termos, direta ou indiretamente, envolvidas com Big Data, com…
Conceitos Fundamentais de Machine Learning
Se você está iniciando sua jornada no mundo do Machine Learning e suas aplicações, provavelmente já se deparou com alguns termos muito técnicos que são muitas vezes de difícil compreensão. Neste post, vou descrever alguns conceitos fundamentais de Machine Learning e suas respectivas aplicações. De forma bem simples, Machine Learning é um conjunto de regras…