Data Lake é um termo recente, criado pelo CTO (Chief Technical Officer) do Pentaho, James Dixon, para descrever um componente importante no universo da análise de dados e do Big Data.
Autor: David Matos
A Transformação do Aprendizado – Social, Informal, Self-Service e Prazeroso
A Transformação do Aprendizado – Social, Informal, Self-Service e Prazeroso, já é uma realidade que tende a aumentar nos próximos anos com a chegada de uma geração que nasceu em um mundo digital.
15 Repositórios no Github para Cientistas de Dados
Como Cientista de Dados, você vai trabalhar em muitos projetos e experimentos. O Github é uma chance de ouro para aprender, compartilhar conhecimento e ver quais são as principais tendências em Data Science, usando Python, R, Spark e outras ferramentas de Ciência de Dados.
Cientista de Dados – Júnior, Pleno e Sênior
Cientista se Dados continua sendo a profissão em maior demanda em todo mundo e as empresas estão contratando Cientistas de Dados em três níveis: Júnior, Pleno ou Sênior (também chamado Principal). Esteja você apenas começando em Data Science ou procurando mudar de carreira, inevitavelmente se encontrará em um desses níveis.
6 Novos Recursos Incríveis com Python 3.10
Python é uma das linguagens de programação mais populares da atualidade. A linguagem é usada em uma ampla variedade de campos e aplicações, desde o aprendizado da ciência da computação, passando pela execução de tarefas de computação científica complexas, até a construção de jogos, sendo amplamente usada em ciência de dados e computação quântica.
7 Maneiras Eficazes de Trabalhar com Pequenos Conjuntos de Dados
Em um cenário prático, você poderá ter dados limitados para resolver um problema. Reunir um grande conjunto de dados pode ser proibitivamente caro ou simplesmente impossível (por exemplo, ter apenas registros de um determinado período de tempo ao fazer uma análise de séries temporais). Como resultado, geralmente não há escolha a não ser trabalhar com um pequeno conjunto de dados, tentando obter previsões o mais precisas possível.
7 E-Books Gratuitos Sobre Big Data, IA, Machine Learning e Deep Learning
Para começar – ou para ajudá-lo a dar o próximo passo – veja uma lista de 7 E-Books Gratuitos Sobre Big Data, IA, Machine Learning e Deep Learning.
TorchIO Para Imagens Médicas 3D
TorchIO é um pacote Python que contém um conjunto de ferramentas para ler, pré-processar, amostrar, aumentar e gravar imagens médicas 3D em aplicativos de aprendizagem profunda (Deep Learning) escritos com PyTorch, incluindo intensidades e transformações espaciais para aumento e pré-processamento de dados.
FLAML – Fast and Lightweight AutoML
FLAML é uma biblioteca Python leve que encontra modelos precisos de aprendizado de máquina de forma automática, eficiente e econômica.
NoSQL Database
Bancos de Dados NoSQL, são bancos de dados distribuídos e não-relacionais, que foram projetados para atender os requerimentos de Big Data.