O objetivo deste post é definir e descrever as principais etapas do Processo de Data Science. Para os iniciantes isso ajuda a compreender as técnicas e ferramentas usadas em cada parte do processo.
Categoria: Ciência de Dados
Por Que Você Deve Aprender Álgebra Linear Para Trabalhar com Machine Learning?
Assim como uma base sólida é essencial para um edifício, a Álgebra Linear constitui um segmento de aprendizado essencial para trabalhar com Machine Learning. Este artigo apresenta as cinco principais razões Por Que Você Deve Aprender Álgebra Linear Para Trabalhar com Machine Learning?
Kubernetes: Pods, Nodes, Containers e Clusters
O Kubernetes surgiu como plataforma de orquestração de containers, sendo ferramenta essencial para equipes de Engenharia de Dados. Sua importância é cada vez maior na infraestrutura de Big Data e no deploy de modelos de Machine Learning. Vamos compreender o que é o Kubernetes.
DaaP – Data as a Product
Vamos discutir alguns dos principais desafios atuais e como Data as a Product pode ser uma alternativa para aumentar o uso da análise de dados nas empresas.
O Que é Linhagem de Dados (Data Lineage)?
Podemos definir a linhagem de dados como o ciclo de vida dos dados ou a jornada dos dados. Esse ciclo de vida inclui onde os dados se originam, como foram obtidos ponto a ponto e, claro, onde estão hoje.
Benefícios do Data Mesh
Aqui estão os principais benefícios do Data Mesh.
3 Pacotes Python para Análise Interativa de Dados
Este artigo lista 3 Pacotes Python para Análise Interativa de Dados. Clique no nome de cada pacote para acessar a documentação oficial.
5 Melhores Pacotes da Linguagem R Para Cientistas de Dados
No site oficial do CRAN você encontra a lista de todas as bibliotecas disponíveis atualmente para Linguagem R e neste post veremos os 5 Melhores Pacotes da Linguagem R Para Cientistas de Dados.
O Que é Data Economy e Como o Canadá Está Crescendo Sua Economia Baseada em Dados
A economia baseada em dados (Data Economy) está crescendo. Em 2021, a IDC estimou o valor da Data Economy nos EUA em US$ 255 bilhões e na União Europeia em US$ 110 bilhões. Nessas e em muitas outras regiões, o crescimento da Data Economy supera o PIB. A IBM examinou o potencial específico do Canadá para liderança de dados, com lições para qualquer outro país que pretenda competir na Data Economy.
Top 8 Operações SQL Para Manipulação de Dados
A Linguagem SQL é usada ativamente por Analistas de Dados e Cientistas de Dados para tarefas de extração de dados e manipulação de dados. Neste artigo você encontra as Top 8 Operações SQL Para Manipulação de Dados.