DAT Linux é uma distribuição Linux para Data Science (Ciência de Dados) que reúne todas as ferramentas e aplicativos em um ambiente de área de trabalho pronto para ser executado.
O Que é Infraestrutura como Código (IaC)?
Infraestrutura como código (IaC) é o gerenciamento e provisionamento de infraestrutura por meio de código em vez de processos manuais. E vem crescendo em popularidade.
10 Termos de Inteligência Artificial Explicados de Forma Simples
Inteligência Artificial, e uma das suas sub-áreas, Machine Learning, estão cada vez mais presentes em nossas vidas. Aqui estão 10 Termos de Inteligência Artificial Explicados de Forma Simples.
Por Que Usar Airbyte Para Seu Processo ETL?
Como experimentar rapidamente um pipeline de dados e um grupo de conectores de forma simples e robusta? É aqui que entram ferramentas como o Airbyte.
Os 7 Passos Para Construir Modelos de Machine Learning
Aqui estão os 7 passos principais para construir modelos de Machine Learning, com o percentual em relação ao total, de cada um dos passos.
Kubernetes: Pods, Nodes, Containers e Clusters
O Kubernetes surgiu como plataforma de orquestração de containers, sendo ferramenta essencial para equipes de Engenharia de Dados. Sua importância é cada vez maior na infraestrutura de Big Data e no deploy de modelos de Machine Learning. Vamos compreender o que é o Kubernetes.
DaaP – Data as a Product
Vamos discutir alguns dos principais desafios atuais e como Data as a Product pode ser uma alternativa para aumentar o uso da análise de dados nas empresas.
O Que é Linhagem de Dados (Data Lineage)?
Podemos definir a linhagem de dados como o ciclo de vida dos dados ou a jornada dos dados. Esse ciclo de vida inclui onde os dados se originam, como foram obtidos ponto a ponto e, claro, onde estão hoje.
Pipelines de Dados com Apache Hop
O Apache Hop permite projetar visualmente pipelines de dados e workflows. Programação é uma opção, não uma necessidade.
6 Bibliotecas Python Para Processamento de Texto
Essas 6 bibliotecas Python podem ser bastante úteis no processamento de texto. Experimente-as em seus projetos de Ciência de Dados.