A métrica AUC, que representa a Área sob a Curva ROC (Receiver Operating Characteristic), é amplamente utilizada para comparar modelos de Machine Learning para classificação, especialmente em contextos onde as classes estão desbalanceadas.
Tag: Data Science
Dados Linearmente x Não Linearmente Separáveis
A questão da linearidade em dados, especialmente no contexto de algoritmos de classificação, refere-se à capacidade de separar classes de dados usando uma linha reta (em duas dimensões), um plano (em três dimensões) ou um hiperplano (em dimensões mais altas). Essa separação linear é fundamental para entender como diferentes algoritmos de aprendizado de máquina modelam e fazem previsões a partir dos dados.
7 Datasets Públicos Para Projetos de Data Science
Ter um bom portfólio de projetos para buscar vagas em Data Science é um diferencial. E isso já não é novidade! Mas encontrar bons datasets públicos pode ser um desafio. Para ajudar você, uma lista de 7 Datasets Públicos Para Projetos de Data Science.
Data Science na Indústria de Videogames
De acordo com uma estimativa da Accenture, o mercado global de videogames vale mais de US$ 300 bilhões. Vamos explorar as várias maneiras pelas quais a Ciência de Dados é usada na indústria de jogos.
8 Conceitos Estatísticos Fundamentais Para Data Science
Neste artigo veremos 8 Conceitos Estatísticos Fundamentais Para Data Science que você precisa entender ao estudar ou trabalhar com Ciência de Dados.
O Processo de Data Science
O objetivo deste post é definir e descrever as principais etapas do Processo de Data Science. Para os iniciantes isso ajuda a compreender as técnicas e ferramentas usadas em cada parte do processo.
DAT Linux – The Data Science OS
DAT Linux é uma distribuição Linux para Data Science (Ciência de Dados) que reúne todas as ferramentas e aplicativos em um ambiente de área de trabalho pronto para ser executado.
DaaP – Data as a Product
Vamos discutir alguns dos principais desafios atuais e como Data as a Product pode ser uma alternativa para aumentar o uso da análise de dados nas empresas.
5 Melhores Pacotes da Linguagem R Para Cientistas de Dados
No site oficial do CRAN você encontra a lista de todas as bibliotecas disponíveis atualmente para Linguagem R e neste post veremos os 5 Melhores Pacotes da Linguagem R Para Cientistas de Dados.
O Que é Data Economy e Como o Canadá Está Crescendo Sua Economia Baseada em Dados
A economia baseada em dados (Data Economy) está crescendo. Em 2021, a IDC estimou o valor da Data Economy nos EUA em US$ 255 bilhões e na União Europeia em US$ 110 bilhões. Nessas e em muitas outras regiões, o crescimento da Data Economy supera o PIB. A IBM examinou o potencial específico do Canadá para liderança de dados, com lições para qualquer outro país que pretenda competir na Data Economy.