O Microsoft Azure Machine Learning é um serviço em nuvem (Cloud) que tem como objetivo implementar modelos de Machine Learning de forma rápida e fácil. Com o Azure Machine Learning é possível construir modelos de análise preditiva, usando datasets de treino das mais variadas fontes e então fazer o deploy destes modelos através de web services com o serviço Cloud da Microsoft. Com o Azure Machine Learning Studio, é possível criar experimentos de dados, usando os módulos disponíveis ou construindo seus próprios modelos usando R, Python e SQL por exemplo. O serviço está disponível no portal do Azure, o mesmo que oferece outros serviços do tipo PaaS (Platform as a Service) e onde é possível, usar criar um espaço de trabalho (workspace) com o Machine Learning Studio.
Uma das grandes vantagens do Azure ML é a possibilidade de rapidamente criar experimentos, avaliar sua efetividade e como a Microsoft gosta de chamar “fail fast”, ou seja, cometer os erros de forma antecipada no seu projeto, o mais rápido possível, visando reduzir o ciclo total de desenvolvimento dos modelos analíticos. E tudo isso no melhor estilo Microsoft “arrastar e soltar”.
Mas não pense que as facilidades trazidas pelo Azure, significam que você não tenha que conhecer bem os algoritmos de Machine Learning e teorias necessárias para compreender claramente o que pode ser feito com o Azure ML. Muito pelo contrário. Para uma efetiva utilização da plataforma, é preciso conhecer bem todo o processo de Data Science.
Atualmente o Azure está disponível, em mais de 140 países, suporta 10 idiomas, 19 moedas e segundo a Microsoft, o investimento no desenvolvimento do Azure está na ordem de 15 bilhões de dólares.
Azure ML Workflow
Vejamos como é o fluxo de trabalho no Azure ML:
Dados – isso você já sabe o que é. Tudo que pode ser coletado, compilado, organizado e analisado, vindo das mais diferentes fontes, formatos e tamanhos. Big Data, basicamente.
Criando o Modelo – etapa de criação do modelo usando algoritmos de ML.
Avaliando o Modelo – etapa de avaliar a acurácia do modelo preditivo, baseado na habilidade de prever o resultado correto, quando os valores de entrada e saída são conhecidos.
Refinar e Avaliar o Modelo – fazer comparações, contrastes e combinar modelos alternativos a fim de encontrar a correta combinação que vai levar aos resultados mais consistentes.
Deploy – nesta etapa, publicar seu modelo como uma solução web service, disponível para acesso pela internet.
Testar e Usar o Modelo – implementar seu modelo e criar processos automáticos de teste para continuar melhorando o modelo e aumentar a acurácia. À medida que o modelo vai aprendendo com os erros, ao contrário dos humanos, ele não vai repeti-los novamente.
O Cientista de Dados pode usar o Machine Learning Studio e sua interface visual “drag-and-drop”, para executar este workflow em seus projetos de Data Science. O ML Studio tem suporte a análise estatística com R e suporte a mais de 300 pacotes nativos do R, bem como a possibilidade de criar seus próprios scripts. É possível também utilizar Python e SQL.
Seus modelos de ML podem acessar dados dentro do ML Studio, dados que venham da plataforma de Big Data da Microsoft, o HDInsight ou mesmo importar os dados que estejam no seu desktop.
Uma vez que os modelos estejam prontos para publicação, eles então ficam disponíveis através de API’s. Os resultados dos modelos podem ser acessados pelos usuários de qualquer lugar e qualquer dispositivo. Este basicamente é o conceito de MLaaS (Machine Learning as a Service).
O objetivo da Microsoft com o Azure Machine Learning é tornar mais fácil o começo da exploração dos dados – basta criar uma assinatura Azure, criar um espaço de trabalho e começar a trabalhar no ML Studio. A Microsoft fornece uma ampla documentação técnica adicional com muitos vídeos e tutoriais educacionais e acesso trial gratuito de 30 dias. Você também pode navegar na galeria ML Studio para saber como obter dados de exemplo, realizar experimentos e muito mais.
O Azure ML não é gratuito, mas pode ser usado por 8 horas sem a necessidade de efetuar login, ou 30 dias gratuitamente com a criação de uma conta de acesso.
Referências:
Big Data Analytics com R e Microsoft Azure Machine Learning
What is Azure Machine Learning Studio?
David Matos
Neste caso o Microsoft Azure ML tem apenas o objetivo de facilitar o processo de análise de Big Data? Usando apenas R e/ou Python é possível chegar aos mesmos resultados?
Olá Douglas. O Microsoft Azure Machine Learning é um framework e seu uso é totalmente opcional. É possível sim chegar aos mesmos resultados utilizando apenas linguagens R ou Python. A principal vantagem do Azure ML é o fato de estar em nuvem, o que facilita bastante a disponibilização do resultado final do seu processo de análise. Abs. David