Python é uma linguagem de programação que foi concebida no final de 1980 e sua implementação foi iniciada em Dezembro de 1989 por Guido van Rossum no CWI na Holanda, como um sucessor para a linguagem de programação ABC capaz de manipulação de exceção e interface com o sistema operacional Amoeba . Van Rossum é o principal autor da linguagem Python e continua como líder nas decisões que envolvem o futuro da linguagem.
Python é realmente uma grande ferramenta e há várias razões pelas quais os Cientistas de Dados usam Python. Cientistas de Dados precisam criar visualizações de dados para comunicar claramente os resultados e as previsões em qualquer nível de um negócio. Este é o valor real que um grande Cientista de Dados pode fornecer – sem isso, seu trabalho perde valor.
Portanto, nós escolhemos Python não só por causa de sua intensidade computacional – nós também escolhemos Python porque é uma linguagem de programação comum que pode ser encontrada entre equipes diferentes em qualquer empresa. Python se tornou uma linguagem de programação que permite criar um canal direto para a análise de dados.
Por que os Cientistas de Dados preferem codificação em Python?
Perceba que este pode ser um tema polêmico. Outras linguagens de programação podem ser usadas para o mesmo fim e fatores muitas vezes pessoais estarão envolvidos nesta escolha. Mas aqui seguem algumas razões porque usar Python.
Grande comunidade – com Python, você pode encontrar uma grande (e crescente) Comunidade. No final do dia, se você se perder, pode contar com uma grande comunidade de especialistas para ajudá-lo a encontrar uma solução adequada para a codificação (mesmo em nichos específicos) além de respostas a perguntas relacionadas com a Ciência de Dados e Análise de Dados.
Crescente número de bibliotecas de análise de dados – Com Python, você pode encontrar uma grande variedade bibliotecas de Ciência de dados (como por exemplo: NumPy, SciPy, StatsModels, scikit-learn, pandas, etc.), que estão em crescimento exponencial. Restrições (em métodos de otimização / funções) que estavam faltando um ano atrás já não são um problema e você pode encontrar uma solução robusta adequada, que funciona de forma confiável.
Juypyter-Notebook – esta é simplesmente uma grande ferramenta. Você pode executar múltiplas linhas / blocos de código em diferentes células, você pode brincar com os dados, movê-los para cima ou para baixo e você ainda pode obter seus resultados logo abaixo da célula. É realmente como um organizador mágico que Cientistas de Dados (e as pessoas que executam código) sempre sonharam. Você também pode escrever em R, SQL, Scala, e outras linguagens com Jupyter-Notebook o que faz com que o fluxo de trabalho seja muito mais fácil e eficiente.
Python é fácil de aprender – principal vantagem do Python é que qualquer pessoa pode aprendê-la rapidamente e facilmente. A linguagem foi projetada para ser simples.
Escalabilidade – em relação a outras linguagens / pacotes para a Ciência de dados (como MatLab, Stata, R) Python é muito mais rápido. É verdade que Java e Scala são muito mais rápidos do que Python, mas com Anaconda (Continuum Analytics) Python pode ser a solução certa.
Visualização / Gráficos – Python não é tão bom como R (ainda), mas vamos ver mais e mais APIs (por exemplo, Plotly) e bibliotecas de visualização de dados que fazem a vantagem parcial de R insignificante em comparação com Python. Você pode fazer coisas bem legais com Python.
O Papel da Indústria no ao escolher uma linguagem de programação
Acredito que os Cientistas de Dados preferem (ou são mais propensos a usar) Python. Mas no final do dia, a indústria desempenha um papel muito maior na popularidade de Python que são as habilidades computacionais. Python é muito comum na maioria das equipes de ciência de dados em diferentes empresas. Mas nós nunca trabalhamos sozinhos. É provável que você vá encontrar alguém que esteja familiarizado com o Python através das áreas de marketing, operações, vendas e outras partes da empresa. Python é uma ótima maneira de compartilhar projetos com outras equipes.
A tecnologia está em constante evolução. Python é apenas mais uma tendência da indústria que pode ficar por aqui por um tempo ou pode ser completamente substituída por algo no futuro. Atualmente, Python desempenha um papel importante e é por isso que os Cientistas de Dados a usam extensivamente.
Para resumir, Python tem muitos pontos fortes para o fluxo de trabalho na Ciência de Dados e é muito mais rápido e mais fácil de começar a usar em relação a outros pacotes disponíveis. A probabilidade de encontrar alguém em uma outra equipe em sua empresa que saiba Python, pode ser uma vantagem interessante.
Lembre-se, um bom Cientista de Dados pode executar código e obter uma saída. Um grande Cientista de Dados é capaz de comunicar artisticamente seus resultados e colaborar com cada parte de uma empresa.
Aqui uma dica de um dos melhores cursos online gratuitos de Python: Python Fundamentos Para Análise de Dados.
David Matos
Ótima! Ricas explicações.
Obrigado.
Excelente explicação e para quem quer mesclar dados com programação web, o Python é excelente, sem falar no Kyvi para criação de apps para Android e IOS, uma linguagem bem versátil.