IBM Watson Analytics
Existe um número cada vez maior de ferramentas de visualização de dados no mercado e se manter atualizado sobre tudo que está acontecendo quando o assunto é Big Data e Data Science, não é uma tarefa fácil. Além disso, um outro conceito vem ganhando força nos EUA, o de “Citizen Analyst”, ou seja, cada cidadão poderia analisar seus próprios dados, mesmo sem os skills de um Cientista de Dados. Isso significa que precisamos ficar atentos às soluções criadas para nós Cientistas de Dados, bem como para os “Citizen Analyst”.
Pensando nisso, a IBM recentemente redesenhou o IBM Watson Analytics, um serviço em nuvem da IBM para computação cognitiva e análise preditiva. Agora, qualquer cidadão pode fazer o upload dos seus dados, descobrir os insights neles contidos e criar visualizações de dados que contem a história por trás dos dados. Existem 2 serviços principais: o IBM Watson Analytics Professional e o IBM Watson Analytics for Social Media. Você pode testar os serviços de forma gratuita por 30 dias (veja os links no fim do artigo).
A ideia por trás do IBM Watson Analytics, é remover a parte difícil da análise de dados e tornar o processo disponível para qualquer usuário, mesmo que sem conhecimentos de análise, mas que queiram ter uma outra visão sobre determinado conjunto de dados. Basicamente é uma espécie de AaaS (Analytics as a Service). Outras plataformas de AaaS tem surgido, mostrando que esta é uma tendência que veio para ficar.
O IBM Watson Analytics é um serviço e usa como engine o IBM Watson, o supercomputador da IBM, famoso por ter vencido concorrentes humanos no programa de TV americano de perguntas e respostas, Jeopardy. O IBM Watson Analytics também utiliza o SPSS Modeler, da própria IBM. Na prática é isso: SPSS Modeler + IBM Watson = IBM Watson Analytics.
Utilizar o Watson Analytics é bastante fácil. Não é preciso conhecimento de estatística ou linguagem de programação. O Watson faz todo o trabalho para o usuário final. Após fazer o upload de uma planilha com dados regionais de vendas por exemplo, basta fazer perguntas ao Watson, como: “Quais os países que tiveram maior lucratividade e qual a relação entre lucro e custo por país? ” ou ainda criar modelos preditivos de vendas por região ou produto.
Mas o IBM Watson Analytics possui algumas limitações importantes. Uma vez importados os dados, não é possível exportá-los após o processamento. Você pode salvar apenas os gráficos gerados com seus dados. Isso significa que as empresas teriam que submeter seus dados e não poderiam exportá-los de volta, depois de limpos e tratados. Seus modelos preditivos também são limitados. Outra desvantagem: o IBM Watson não é gratuito. Mas a maior limitação na minha opinião, é o fato de não ter controle sobre a lógica por trás do tratamento dos seus dados.
O IBM Watson Analytics é na verdade como a peça de um quebra-cabeça, que pode sim ajudar em determinadas etapas do processo de análise de dados, mas que não resolve diretamente o problema de Big Data Analytics, que é um processo bem mais complexo que apenas a análise de dados. Existem algumas etapas antes de se começar a falar em análise de dados, que é a coleta e armazenamento dos dados e como unir dados de diferentes fontes, formatos e gerados em diferentes velocidades, limpá-los e filtrá-los, além de empregar técnicas de Machine Learning e permitir interação do usuário. O IBM Watson Analytics tem sido visto como um “modelo mágico”: ele te dá uma resposta, mas não explica as razões por trás das respostas, fazendo do processo de análise de dados algo misterioso.
Acredito que o IBM Watson Analytics está trazendo a análise de dados e o Big Data para cada vez mais próximo do nosso dia a dia. E então, o que isso significa para você, profissional de Ciência de Dados? Bem, isso significa que se você quiser realmente entender e otimizar o valor a partir de seus dados com o IBM Watson Analytics, certamente serão necessárias habilidades em Matemática e Estatística. Além do mais, como você não pode exportar os dados do Watson Analytics, pode ser mais útil para você usar SQL ou Python e escrever seus próprios scripts de limpeza de dados, antes de importa-los na ferramenta. Na verdade, no mundo real, o Watson Analytics não cobre com sucesso os requisitos de codificação que estão envolvidos na Ciência de Dados. Isso significa que você ainda precisa de conhecimento técnico – e eu não posso imaginar como essa exigência poderia ser totalmente substituída por nenhum aplicativo de software no futuro.
Percebeu? Apesar de soluções que prometem entregar aos usuários comuns, sem conhecimento de análise de dados, um produto pronto e acabado, na verdade, quem pode extrair mais valor das ferramentas, são aqueles que compreendem claramente o que elas fazem. Portanto, continue firme na sua caminhada para se tornar um Cientista de Dados. O mundo vai precisar cada vez mais destes profissionais.
David Matos
Referências:
IBM Watson Analytics
https://watson.analytics.ibmcloud.com/product
The Rise of the Citizen Analyst
http://www.christopherspenn.com/2015/10/the-rise-of-the-citizen-analyst
IBM Watson Analytics Goes Public
Test drive: IBM Watson Analytics free beta
http://www.computerworld.com/article/2860857/test-drive-ibm-watson-analytics-free-beta.html