Business Intelligence & Business Analytics Blog

Como 'Simpsons' consegue prever o futuro da tecnologia e do mundo?

Simpsons previu Trump presidente em 2000

Viagem no tempo, coincidência, análise de Big Data... Muitas as razões são especuladas como brincadeira para a série no ar há décadas continuar surpreendendo seus telespectadores com previsões que pareciam inimagináveis.

William Edwards Deming

"Em Deus nós confiamos; todos os outros devem trazer dados."

"In God we trust; all others must bring data."

A lista de vezes em que "Os Simpsons" previram o futuro da tecnologia e da sociedade em geral é extensa. Volta e meia vemos casos do tipo – já rolou com a eleição de Donald Trump, com smartwatches, correções automáticas no celular... Mas como o desenho consegue acertar tanto?

Viagem no tempo, coincidência, análise de Big Data... Muitas as razões são especuladas como brincadeira para a série no ar há décadas continuar surpreendendo seus telespectadores com previsões que pareciam inimagináveis.

O site Mic conversou com ex-executivo dos Simpsons, um estatístico e um professor de matemática para tentar entender o que está por trás de tantos acertos. E as razões são mais mundanas do que você imagina.

1 - É tudo questão de quantidade

Episódio futurístico de 1995 tem Lisa falando com sua mãe por um telefone que continha uma tela de vídeo em tempo real
A série "Os Simpsons" está no ar desde 1989. São mais de 600 episódios já mostrados na TV. Em cada episódio, há uma quantidade enorme de piadas. Deu pra entender, né? Quanto mais conteúdo, mais chance de pelo alguma das cenas retratadas em certos episódios estar certa.

"Nós fizemos um zilhão de episódios de televisão, então são muitas oportunidades para fazer previsões. Não acho que alguém fale das previsões que os Simpsons erraram, mas a lista é muito mais longa do que as coisas que foram certas", apontou ao site Daniel Chun, ex-executivo do seriado.

O número de previsões da série realmente não é baixo. Matt Zaremsky, professor assistente de matemática da Universidade de Albany, estima que o desenho fez mais de 120 mil piadas em suas 29 temporadas, levando como base uma média de 8,54 por minuto nas primeiras 12 temporadas. À conta, são adicionadas mais de 1.200 "previsões explícitas sobre o futuro".

"Dos episódios baseados no futuro, estimo em 500 no total as previsões. Dos outros episódios regulares, estimo uma por episódio, o que daria 624 (até a realização da entrevista)", aponta.

De todas as previsões, muitos citam como 20 o número de previsões acertadas, apesar de que o número pode e deve ser maior. Se forem consideradas 20 entre 1.224, a porcentagem de sucesso é de 1,6%.

Com 20 previsões acertadas entre 1.224, a porcentagem de sucesso é de 1,6%

Matt Zaremsky

"As estatísticas dizem que os Simpsons tiveram tantas piadas e previsões que essencialmente tiveram apenas sorte."

2 - O que é uma previsão?

Simpsons e uma espécie de Apple Watch em 1995
Outro tema levantado pelo site é que as pessoas são generosas com a palavra "previsão". Muitos artigos e vídeos são feitos sobre as profecias dos Simpsons, mas essas visões do futuro não são necessariamente chocantes ou específicas do seriado. Um exemplo citado é que o celular no pulso (que lembra os atuais smartwatches) em um episódio de 95 não é tão original.

"O exemplo é que o Simpsons tinha algo que parecia um Apple Watch. Bom, um dispositivo de comunicações no pulso remonta a até Dick Tracy (tira de quadrinhos que estreou em 1931) e os recursos do Apple Watch não vão ser exatamente os mesmos que os Simpsons tinham no relógio. Você tem que dizer se isso é uma previsão ou não", opina Gary Simon, professor aposentado de estatística da New York University Stern School of Business.

3 – O estilo da série

Chapéu com câmera em episódio de 1994 lembra muito as câmeras GoPro
Pelos Simpsons serem um cartoon, os roteiristas podem colocar no seriado qualquer celebridade da vida real nos episódios que quiserem – como ocorreu com Donald Trump em 2000. Os roteiristas também podem criar previsões realísticas diferentes porque a série se passa em dias atuais muito parecidos com a nossa sociedade do presente.

Obviamente, um cartoon pode fazer muito mais previsões do que dramas da TV que se passam no passado, como Downton Abbey. Programas de comédia também são escritos de uma maneira que os espectadores consideram mais realista, segundo Chun. Muitos médicos consideram a comédia Scrubs mais realista da vida em um hospital do que o drama ER, de acordo com o ex-executivo.

"Quando escreve um drama, o roteirista normalmente tenta ter princípios e trata uma sociedade que realmente respeita a moral, onde todos são muito sérios e atuam com máxima integridade em todos os momentos", aponta.

É claro que nos últimos anos a família Simpsons ganhou um concorrente de peso para prever o futuro: a série de ficção Black Mirror, atualmente na Netflix, mas que tem como função exatamente prever uma sociedade futurística baseada em nossas tecnologias atuais.

4 – O cinismo dos roteiristas

Espécie de autocorretor apareceu em episódio de 1994 com um aparelho Newton da Apple
Uma parte das previsões acertadas do Simpsons também é associada ao estilo dos roteiristas. Eles são cínicos e retratam sua visão de mundo no seriado.

"Existe uma visão de mundo que os roteiristas dividem com alguns princípios básicos. Entre eles, de que as pessoas são gananciosas e que as corporações são terríveis e têm uma tendência de arruinar tudo. A corrupção é desenfreada e a sociedade como um todo tem a memória de um peixe", cita Chun, ex-executivo do seriado.

Alguma semelhança com a realidade? Bom, então enquanto a sociedade seguir desta maneira, os Simpsons continuarão acertando.

Fonte:
https://tecnologia.uol.com.br

Escrever um comentário (0 Comentários)

A Internet das Coisas (IoT) na prática - Desafios e Case de Sucesso

É bastante promissor observar que muitas empresas já estão evoluindo e colocando em prática os pilotos desenvolvidos nos últimos anos.

Em outubro de 2017, a segunda edição do IoT Snapshot, Um retrato da adoção e do potencial da internet das coisas no mercado brasileiro, revelou uma evolução bastante promissora em relação ao que o mercado espera da internet das coisas (IoT - Internet of Things) e o quanto essa tecnologia está sendo adotada pelas empresas. Para citar um exemplo, as organizações que estão investindo em IoT, em processo de adoção ou que pretendem adotar a tecnologia em 2018 já são mais de 60% dos respondentes.

Nos últimos anos, aconteceram muitos testes, protótipos, experimentações e aprendizados. Além disso, surgiram modelos de negócios diferentes, parcerias e o florescimento de um novo mercado. Mas em meio a esse ambiente de pioneirismo, observamos empresas que já começaram a se deparar com um novo conjunto de desafios: os projetos-piloto começaram a dar certo e é hora de fazer o roll-out – e agora

Abaixo, listo quatro fatores que surgiram na pauta dessas empresas que já se convenceram dos benefícios da internet das coisas e agora querem usá-la na prática:

1 - Mensuração dos benefícios frente aos investimentos

As iniciativas de inovação e os projetos de IoT vinham, e ainda vêm, muitas vezes, sendo desenvolvidos com investimentos e budgets direcionados à experimentação. Esse movimento também contava com uma boa parcela de patrocínio da indústria, que queria mostrar suas soluções e se posicionar no mercado.

Quando esses projetos ganham proporções de operação real, a conta muda de dimensão. O entendimento dos benefícios se torna uma questão crítica, uma vez que os investimentos passam a concorrer com orçamentos direcionados a outras prioridades da organização.

2 - Robustez financeira e técnico-operacional dos parceiros

Outra mudança de patamar que acontece nesse momento diz respeito aos players envolvidos nas iniciativas de IoT. Enquanto teste, PoC ou piloto, exige-se pouca robustez dos participantes envolvidos – até porque muitas das soluções demandadas não são desenvolvidas por grandes players, mas sim por start-ups focadas em nichos muito específicos de mercado.

Quando a empresa passa dos testes para tentativas de roll-out, entram em cena necessidades como solidez financeira, volume de produção, suporte operacional às soluções e outros requisitos que são muito menos atrativos, mas que não podem falhar em uma operação real. Equilibrar as especificidades das soluções com a necessidade de robustez para um ambiente operacional é um dos desafios de quem está amadurecendo.

3 - Maturidade das equipes quanto às novas tecnologias e processos

A identificação, desenvolvimento e retenção de profissionais capacitados e motivados sempre foi um desafio comum de qualquer gestor. Esta complexidade aumenta consideravelmente quando estamos tratando de temas que ainda não estão maduros.
Muitas empresas contam com alguns profissionais de referência, que têm conseguido acompanhar essas inovações, mas têm dificuldade em construir equipes que possibilitem a concretização dos projetos. Contar com profissionais capacitados (e em constante aprimoramento) foi e, provavelmente, continuará sendo um tema relevante para os gestores de tecnologia.

4 - Segurança da informação, continuidade de negócios e governança – gestão de riscos

É sabido que, com a IoT, a quantidade de dispositivos conectados se multiplica e cada um deles pode se tornar um ponto de vulnerabilidade no ambiente tecnológico das empresas. Mas mesmo que este fato seja de conhecimento geral, o tema de segurança ainda não aparece de maneira voluntária como um elemento essencial na arquitetura de IoT. Isso ficou comprovado no IoT Snapshot 2017 – quando provocados, os respondentes concordaram que esse é um tema crítico, mas foi um dos menos citados de maneira voluntária.

Além disso, com as soluções de internet das coisas, a tecnologia passa a integrar elos da cadeia que usualmente contavam com pouco suporte tecnológico. Com isso, o escopo de continuidade de negócios tende a se ampliar de maneira significativa. A cobertura da tecnologia se amplia e, proporcionalmente, a necessidade de uma gestão de riscos relacionados à segurança e à continuidade das operações.

De qualquer forma, é bastante promissor observar que muitas empresas já estão evoluindo e colocando em prática os pilotos desenvolvidos nos últimos anos. O que eram promessas e apostas começam a se concretizar como uma realidade tangível. Mas a IoT, na prática, traz à tona novos desafios, que não são mais de experimentação, mas sim de operação, resiliência e confiabilidade. Por isso, é necessário manter o espírito jovem e a mente ainda mais aberta às novidades, mas amadurecer e ganhar robustez para se encaixar no ambiente real de operações.

Carros e caminhões da Volvo vão compartilhar alertas de trânsito

A Volvo decidu se unir na busca de um trânsito mais seguro e anunciou que seus veículos vão compartilhar em tempo real as informações recolhidas por suas tecnologias de alertas de trânsito.

Com isso, quando o pisca-alerta de um carro equipado com o sistema Hazard Light Alert for acionado, um alerta será enviado tanto para outros carros equipados com a tecnologia quanto para caminhões da Volvo Trucks que possuem sistema semelhante. O mesmo acontecerá caso o motorista de um desses caminhões ligue o pisca-alerta de seu veículo.

A partir da informação de que há automóveis diminuindo a velocidade ou completamente parados adiante, os motoristas poderão tomar atitudes que reduzem a chance de acidentes, como ir mais devagar ou até alterar a rota.

Esta é a primeira vez que a Volvo Cars divide com outra empresa (apesar de ambas serem Volvo, as companhias pertencem a grupos diferentes) os dados compartilhados entre carros com o sistema Hazard Light Alert, que é item de série de diversos modelos da marca desde 2016.

De acordo com a vice-presidente do Centro de Segurança Volvo Cars, Malin Ekholm, a expectativa é de que novas colaborações ocorrem nesse sentido. “Quanto mais veículos temos compartilhando dados de segurança em tempo real, mais seguras se tornam nossas estradas. Estamos ansiosos para estabelecer novas colaborações com outros parceiros que compartilham nosso compromisso com a segurança no trânsito”, disse em comunicado à imprensa.

Por enquanto, a comunicação entre carros e caminhões acontecerá somente entre veículos vendidos na Suécia e na Noruega. Para garantir o cumprimento da Regulação Geral de Proteção de Dados da União Europeia, que entra em vigor no fim de maio, os dados serão anônimos e agregados.

Referências:
http://cio.com.br/opiniao/
https://www.tecmundo.com.br/mobilidade-urbana-smart-cities

Escrever um comentário (0 Comentários)

6 DICAS para fazer das METAS uma Estratégia de Vendas Vencedora

Estabelecer metas para cada vendedor é uma estratégia de vendas das mais usadas e consagradas na gestão comercial de uma empresa.

Estabelecer metas para cada vendedor é uma estratégia de vendas das mais usadas e consagradas na gestão comercial de uma empresa. Ao mesmo tempo em que incentiva os colaboradores a darem seu melhor para alcançar os objetivos, permite acompanhar, no decorrer dos meses, se o andamento do planejamento anual está conforme o previsto.

Mas, antes de avançarmos, é bom lembrar que as metas em si de pouco valem. O importante é saber como poderão ser batidas. E isso só pode ser feito com um plano que leve em conta:

  • Quantas vendas devem ser realizadas para alcançar o objetivo;
  • Como a base de clientes compõe essa expectativa;
  • Que melhorias nos processos comerciais podem ser realizados em relação ao período anterior;
  • Quais serão os principais desafios para que a meta seja cumprida.

São questões que não podem ser ignoradas, até para que o vendedor saiba claramente quais são as etapas necessárias para conquistar o objetivo. Você já deve ter testemunhado como metas aparentemente impossíveis desanimam um funcionário em vez de motivá-lo. Por isso, o primeiro passo é o mais importante:

1 – Estabeleça metas de forma inteligente

Para isso, é preciso recolher informações de mercado, e plataformas de geomarketing são soluções com essa finalidade. Esse tipo de tecnologia tem melhorado o trabalho da gestão comercial em muitos setores de atividade. Por meio de uma rica variedade de fontes, como IBGE, Ministério do Trabalho, Receita Federal, MEC, IPC Marketing, Dados Abertos, portais de transparência, entre muitos outros, os profissionais têm acesso fácil a informações valiosas. E tudo em poucos cliques.

Imagine uma indústria alimentícia que comercialize seus produtos principalmente para supermercados, de tamanhos diversos. Ao mapear pontos de interesse por meio do geomarketing, é possível visualizar a quantidade de potenciais clientes e a localização de cada um, bem como traçar variáveis de acordo com o porte de cada empreendimento.

O geomarketing e o mapeamento de territórios dá também transparência ao processo para o vendedor que consegue enxergar com clareza sua zona de atuação.

2 – Ajuste as metas quando circunstâncias mudarem

É importante ter em mente, contudo, que o mercado é dinâmico, tanto para o bem quanto para o mal. A instabilidade econômica vivida no Brasil, principalmente entre os anos de 2014 e 2016, fez com que muitas metas, antes plenamente compatíveis, se tornassem imbatíveis. Não rever a estratégia de vendas em uma situação dessas é dar murro em ponta de faca, pois vai colocar sobre as costas do vendedor toda uma conjuntura que foge do controle dele.

Em momentos como esse, a inteligência geográfica de mercado pode apoiar o ajuste de metas e até mesmo do território dos vendedores. Analisando dados atualizados mês a mês sobre determinadas regiões, é possível detectar mercados com maior e menor potencial para as vendas. Afinal, distribuir vendedores em locais estratégicos aumentam o poder comercial e a visibilidade dos seus produtos.

3 – Faça uma justa divisão das oportunidades entre os vendedores

De maneira nenhuma quero dizer que todos precisam ter metas iguais. Um novo integrante do time normalmente recebe objetivos menos ousados, enquanto os mais experientes têm a chance de levar uma comissão maior para casa. Mas tanto um quanto o outro têm que estar em iguais condições para bater a meta.

Para realizar esse balanceamento de territórios de venda, uma plataforma de geomarketing também é muito útil. A visão espacial da área de atuação facilita uma divisão justa das oportunidades entre os vendedores. Isso acontece quando a estratégia é estabelecida por meio de critérios geográficos, analisando o potencial de cada território.

Uma fábrica de sapatos, por exemplo, que tenha como clientes lojas especializadas no interior de São Paulo, por falta de informação ou comodidade, deixa um vendedor responsável pela região de São Carlos e outro pela região de Ribeirão Preto. Mas, certamente, esses territórios não oferecem o mesmo número de oportunidades.

É aí que a inteligência geográfica pode ajudar o seu negócio, pois você consegue distribuir de uma melhor forma seus vendedores em regiões estratégicas de atuação.

4 – Faça pequenos ajustes nas metas sempre que necessário

Mesmo para quem cerca-se de toda informação de mercado possível, estabelecer metas é um trabalho que precisa ser feito com cuidado e atenção. Porém, tendo o seu objetivo de longo prazo definido, fica mais fácil definir os de curto prazo e, possivelmente, ajustá-los quando for preciso. Além do mais, essa é uma medida eficaz para que seu time comercial melhore a cada dia.

As metas menores, sejam elas diárias, semanais ou até mesmo mensais, devem ser encaradas como pequenos passos, um por um, que vão levar sua equipe de vendas ao topo, em algum momento no futuro. Com isso, o acompanhamento fica mais assertivo e você poderá fazer ajustes continuamente para atingir o resultado final.

Para que essas adaptações sejam direcionadas a cada membro do time, solicite relatórios frequentes e individuais sobre o resultado do trabalho em campo. Dessa forma, a gestão pode orientar pontualmente sobre acertos e erros e corrigir qualquer desvio.

5 – Tenha a sua Solução Analítica como parceira indispensável

Para dar visibilidade e transparência aos dados da insituição, uma solução de Inteligência Empresarial (Business Intelligence) será peça chave para que todos tenham a visão dos indicadores e metas, diariamente, pela internet, em relatórios e dashboards interativos, com vastos filtros e totalizadores. Existem várias alternativas, das mais simplistas às mais absurdas, chegando a custar verdadeiras fortunas sem entregar uma contrapartida à altura.

Uma Solução de Apoio à Decisão não precisa custar milhões de dólares tampouco exigir a venda casada de equipamentos, treinamentos, consultorias e serviços. Pelo contrário, com software livre e custo zero em licenças, pode-se atingir resultados excelentes e sustentáveis utilizando o equipamento já existente, com qualquer sistema operacional do mercado, podendo ser acessado desde celulares e computadores até mesmo em grandes painéis televisores. Isso tudo com toda a segurança e liberdade de quem tem todo o código fonte em seu poder. Em caso de dúvidas, procure sempre por especialistas.

6 – Valorize as metas batidas

Enquanto servem de ferramenta para que a gestão comercial faça o acompanhamento da performance de sua equipe, as metas são como promessas para os vendedores - alguma coisa boa acontecerá se elas forem cumpridas.

Incentivar a disputa entre os integrantes do time é, em muitos casos, uma maneira de melhorar o desempenho. Mas a valorização de um trabalho bem feito independe de competição. É uma virtude do gestor demonstrar reconhecimento a quem merece.

Uma pesquisa do International Stress Management Association realizada em 2015 com profissionais de São Paulo e do Rio Grande do Sul indicou que 89% dos respondentes sofre de estresse por falta de reconhecimento no trabalho. E, muitas vezes, isso vai além de comissões ou bônus.

Acredite: enaltecer a competência de um vendedor perante a equipe pode ser ainda mais gratificante do que simplesmente a recompensa monetária.




adaptado de blog.geofusion.com.br 

Escrever um comentário (0 Comentários)

10 Mapas para entender o perfil do consumidor brasileiro

Você arriscaria dizer em que parte do país a população mais dedica o orçamento a gastos com alimentação? Ou então onde custos com veículos próprios mais pesam no bolso dos brasileiros?

Você provavelmente sabe que a renda média em São Paulo ou no Rio de Janeiro é mais alta do que no resto do país. Mas saberia dizer onde ela cresceu ou diminuiu nos últimos anos?

Variedade de Cenários

Entender o perfil do consumidor brasileiro é tarefa das mais árduas, porque há no Brasil todo tipo de público-alvo. Particularidades regionais, entretanto, são observadas por qualquer rede do varejo interessada em encontrar seu mercado consumidor ideal. Por isso mapas podem ser riquíssimas fontes de informação para a inteligência de mercado de empresas varejistas.

Há uma infinidade de cenários que são mais facilmente apresentados e compreendidos com ajuda de representações geográficas.

Na sequência você confere 10 mapas do Brasil. Alguns talvez confirmem sua intuição, outros com certeza vão te surpreender!

População

É bastante coerente no mapa o bloco de estados onde os jovens são público-alvo em maior abundância. No Amazonas, quase 52% da população tem menos de 25 anos.

Parte desses estados se inclui no grupo de territórios com maior presença de perfil de consumidor morador de zonas rurais. A exceção é o Amapá, onde 50% tem menos de 25 anos e 90% vive em áreas urbanizadas.

Renda

Dos três estados que têm renda média superior a R$ 4 mil, apenas o Distrito Federal viu a renda cair no período entre 2010 e 2014.

Grande parte da região Norte também teve rendimentos depreciados no período, enquanto no Nordeste todos os estados tiveram aumento, com exceção do Ceará. Santa Catarina foi o único estado onde a renda pouco oscilou desde 2010.

Consumo

Recentemente apresentamos no blog como o Potencial de Consumo indicou expansão de alguns mercados nos últimos anos. A comparação de diferentes categorias de consumo mostra ainda como há diferentes perfis de consumidor espalhados pelo país.

Grande parte do mercado consumidor no Norte e Nordeste tem ⅕ do orçamento reservado para alimentação.

Nenhum deles está entre os estados onde perfil do consumidor inclui gastos mais representativos com veículos próprios: Roraima, Mato-Grosso, Goiás, Tocantins, Espírito Santo, Paraná e, principalmente, Santa Catarina, onde a média da população tem mais de 15% da renda dedicado à aquisição e manutenção de automóveis.

Turismo

O brasileiro reserva, em média, 1,66% do orçamento a despesas de viagens. Em apenas 3 estados essa proporção supera os 2%: Distrito Federal, Tocantins e Rondônia.

A região que mais fatura com o mercado consumidor de turistas, no entanto, é o Sudeste. São Paulo e Rio de Janeiro, principalmente, concentram grande parte dos desembarques feitos em territórios brasileiros, enquanto a região Sul, assim como os estados de Minas Gerais, Bahia e Pernambuco seguem na zona intermediária, entre 10 e 30 milhões de turistas ao ano. A maior parte do território nacional ainda aguarda entrar para a lista de principais destinos turísticos do país.

Educação

Distrito Federal e São Paulo são os dois únicos estados onde mais de 10% da população tem nível superior completo. A região Sul e o Espírito Santo se aproximam disso, com pelo menos 8% de habitantes graduados, mas na maioria das unidades federativas essa proporção gira em torno dos 5%.

Um dado curioso, contudo, une dois extremos: no Amazonas e em São Paulo, Administração é o curso com maior número de adeptos. Em todos os outros estados, a carreira mais escolhida é a do Direito.

fonte: blog.geofusion.com.br 

Escrever um comentário (0 Comentários)

CIENTISTA DE DADOS – POR ONDE COMEÇAR EM 8 PASSOS

Ansioso por desbravar o universo da Ciência de Dados e não sabe por onde começar? Nós ajudaremos você. Preparamos um guia que vai ajuda-lo a compreender o que faz um Cientista de Dados e como iniciar sua preparação! Confira.

McKinsey Global Institute

Big Data Report 2015

"Até 2018, haverá um deficit de 140 a 190 mil profissinais com habilidades em análise de dados e mais de 1,5 milhão de gerentes e analistas que saibam usar Big Data de forma efetiva para tomada de decisões."

Vamos começar definindo o que é um Cientista de Dados:

Cientistas de Dados são uma nova geração de especialistas analíticos que têm as habilidades técnicas para resolver problemas complexos – e a curiosidade de explorar quais são os problemas que precisam ser resolvidos.

Eles também são um sinal dos tempos modernos. Cientistas de dados não estavam no radar há uma década, mas sua popularidade repentina reflete como as empresas agora pensam sobre Big Data. Essa incrível massa de informações não estruturadas já não pode mais ser ignorada e esquecida. É uma mina de ouro virtual que ajuda a aumentar receitas – contanto que haja alguém que escave e desenterre insights empresariais que ninguém havia pensado em procurar. Entra em cena o Cientista de Dados.

Para a comunidade em geral, um Cientista de Dados é um desses “Magos de Dados”, que pode adquirir massas de dados de diversas fontes e então limpar, tratar, organizar e preparar os dados; e, em seguida, explorar as suas habilidades em Matemática, Estatística e Machine Learning para descobrir insights ocultos de negócios e gerar inteligência.

Os dados utilizados por um Cientista de Dados podem ser tanto estruturados (bancos de dados transacionais de sistemas ERP ou CRM, por exemplo) e não estruturados (e-mails, imagens, vídeos ou dados de redes sociais). O Cientista de Dados cria algoritmos para extrair insights destes dados. Em seguida, cabe ao Cientista de Dados, apresentar estes dados, de forma que os tomadores de decisão possam utilizar o resultado da análise ao definir as estratégias empresariais ou mesmo para criar novos produtos ou serviços baseados em dados.

De acordo com Anjul Bhambhri, ex Vice Presidente de Big Data da IBM e atual Vice Presidente da Adobe, o Cientista de Dados é o profissional capaz de trazer a mudança para uma organização através da análise de diversas fontes de dados. Anjul Bhambhri escreve:

“Um Cientista de Dados representa uma evolução do papel de Analista de Negócios ou Analista de Dados. Estes profissionais possuem uma base sólida normalmente em ciência da computação, aplicações, modelagem, estatísticas, análises e matemática. O que define o Cientista de Dados é a forte visão de negócios, juntamente com a capacidade de comunicar os resultados, tanto para os líderes de negócios quanto para seus pares, de uma forma que influencie como uma organização posiciona-se diante dos desafios do mercado”.

Não existe uma formação que prepare Cientistas de Dados, pois esta é uma profissão relativamente nova. Tem havido muito debate sobre isso no ambiente acadêmico (principalmente nos EUA), pois o mercado precisa de profissionais agora e o tempo de preparação de um profissional como estas habilidades, pode levar algum tempo. E por isso formações técnicas em determinadas áreas, podem ajudar a preparar estes profissionais.

Com tantas informações sobre a profissão de Cientista de Dados e seu crescimento exponencial nos últimos anos, é fácil se perder diante de tantos artigos e materiais com fórmulas mágicas sobre qual caminho seguir. Vou fazer um alerta: não existe caminho fácil para se tornar um Cientista de Dados! É preciso estudar, aprender diferentes técnicas e ter conhecimento interdisciplinar. Por esse motivo, os Cientistas de Dados são bem remunerados e difíceis de encontrar no mercado.

Abaixo, os 8 passos que consideramos fundamentais para a preparação de um Cientista de Dados:

Passo 1: Faça uma auto avaliação

Este é o primeiro passo e acredite, é fundamental. Você, como profissional, precisa avaliar o momento atual da sua carreira e como pretende estar em 5 ou 10 anos. Se pretende seguir uma carreira em Analytics, seja como Cientista de Dados, Engenheiro de Dados ou Analista, precisa compreender quais são suas habilidades atuais, onde pretende chegar, avaliar os gaps e traçar um plano de ação.

Como não existe uma formação acadêmica específica para se tornar um Cientista de Dados, este profissional pode vir de áreas como Estatística ou Ciência da Computação, sendo comum encontrar profissionais de outras áreas atuando como Cientistas de Dados (Marketing, Economia, Ciências Sociais, etc..). Mas independente da área de formação, algumas características serão comuns a todos os profissionais que trabalham com Ciência de Dados:

Programação – Conhecimento de programação é necessário. Linguagens de programação como R, Python, Julia, Scala, Java são parte do arsenal de ferramentas utilizadas em Data Science. Mesmo outros pacotes de análise de dados, como SAS, Matlab, Octave, SPSS e até o IBM Watson Analytics, requerem conhecimento em programação, para se extrair o melhor de cada ferramenta. É a habilidade de programação, que permite ao Cientista de Dados colocar em prática sua criatividade e extrair dos dados respostas para perguntas que ainda não foram feitas. Se você já tiver conhecimento em programação, isso será uma vantagem. Caso não tenha experiência em programação, mas tenha uma boa noção dos conceitos envolvidos em programação de computadores, isso vai ajudar muito. Avalie de forma clara seu nível de conhecimento em programação.

Pensamento Lógico – Cientistas de Dados usam o pensamento lógico para fazer análises. Programação requer lógica. Se você já possui esta habilidade, isso vai acelerar seu aprendizado em Data Science.

Habilidade com Números – Matemática é a base da Ciência de Dados. Programação de computadores, envolve habilidade com números. Os algoritmos de Machine Learning, são baseados em conceitos matemáticos. A Estatística, parte fundamental da Ciência de Dados, requer habilidade com números. Avalie suas características e na sua auto avaliação, verifique se esse item será um problema ou não.

Conhecimento em Banco de Dados – Em diversas fases do processo de análise de dados, interações com bancos de dados serão necessárias. Bancos de sados relacionais, Data Warehouses, bancos de dados NoSQL, Hadoop, linguagem SQL. Todas estas tecnologias estão diretamente ligadas ao trabalho do Cientista de Dados e pelo menos sua compreensão será um ponto que poderá fazer diferença. Avalie se você compreende o conceito de banco de dados, entende as diferenças entre bancos de dados relacionais e NoSQL e como utilizar linguagem SQL para consultas.

A esta altura, talvez você já esteja se perguntando: como você pretende que eu aprenda tudo isso? Aqui entra um dos conceitos mal interpretados sobre a profissão de Cientista de Dados. Acredita-se que este profissional precisa conhecer todas as ferramentas. Isso não é verdade e nem mesmo necessário. Escolha suas ferramentas e se especialize nelas. Por exemplo: conhecimento em linguagem R e Hadoop, permitirá fazer análises de grandes volumes de dados (Big Data). Você não precisa conhecer todas as linguagens de programação, bem como não tem que conhecer todos os bancos de dados. O mais importante é o pensamento lógico, esse sim indispensável (e esta habilidade talvez você já tenha). A tecnologia oferece ferramentas e nenhuma delas resolve sozinha 100% dos problemas, pois todas possuem suas limitações.

Ao fazer esta auto avaliação, será possível compreender seu nível atual de conhecimento e começar a pensar no plano de ação! 

Passo 2: Prepare seu computador

Surpreso com este passo? Esta é a etapa onde você prepara seu ambiente de testes e não deve ser subestimada. Pode ser frustrante durante seu processo e aprendizagem, não ter o equipamento ideal para instalar softwares ou executar operações que requerem poder computacional.

Ciência dados é computacionalmente intensa (isso não deve ser uma novidade para você!). Portanto, você precisa de um computador que permita processar seus scripts e aprender sobre análise de dados. Além disso, você vai precisar instalar ferramentas, interpretadores, pacotes office, etc…Para trabalhar com Ciência de Dados, um computador com 8GB de memória RAM, com um processador intel i5/i7 ou equivalente é a nossa recomendação. Naturalmente, quanto maior a capacidade do seu computador, melhor! É possível também utilizar serviços como o Cloud9 ou Amazon AWS e montar um ambiente virtual de trabalho.

Sistema Operacional – A decisão por qual sistema operacional utilizar é bastante pessoal e qualquer um dos 3 principais sistemas operacionais (Windows, Mac OS e Linux) vai atender as suas necessidades. De qualquer forma, você poderá instalar máquinas virtuais com outro sistema operacional. Boa parte do framework de Data Science e Big Data, foi construída sobre plataforma Unix. Para um servidor Hadoop ou Spark, um servidor Linux é a melhor recomendação. Já para a parte de apresentação de dados, Microsoft Office e outras ferramentas de visualização podem depender de um sistema Windows. Não há uma regra aqui, mas para usuários mais avançados, um sistema Unix é recomendado. Para aqueles que se sentem mais confortáveis com o Windows, não há problema algum. Utilize o Windows como seu sistema operacional e, se necessário, crie uma máquina virtual com Linux, se quiser processar arquivos com Hadoop e/ou Spark ou realizar outros testes. Os principais fornecedores do Hadoop (Cloudera, Hortownworks e MapR) fornecem gratuitamente máquinas virtuais com Linux e Hadoop, prontas para uso em poucos cliques. Já o Microsoft Azure Machine Learning pode ser utilizado online, por exemplo. É possível também fazer o download o SAS University Edition, uma máquina virtual com Linux e SAS, que em poucos segundos permite você utilizar o SAS (uma das principais soluções de Analytics atualmente) para seu aprendizado e totalmente gratuito.

Softwares – Independente da linguagem de programação que você escolher, você vai precisar instalar o interpretador e uma IDE. Se a sua escolha for pelo R, por exemplo, além de instalar a linguagem, você poderá instalar o R Studio. O mesmo vale para outras linguagens de programação. É possível criar seus scripts de Data Science 100% online, via browser, usando o Jupyter Notebook. Mas nem sempre você pode estar online e ter suas ferramentas instaladas localmente vai trazer uma série de vantagens. Além disso, considere instalar:

– Editores de texto: Sublime, Atom, Notepad++
– Software para Máquinas Virtuais: VirtualBox
– Git e Github: para criar seu portfólio de projetos em Data Science
– Suite Office: Microsoft Office, Libre Office

Com exceção do Microsoft Office, todas as demais ferramentas são gratuitas.

Passo 3: Estatística e Matemática

Conhecimentos de Estatística e Matemática fazem parte do pacote essencial para quem pretende trabalhar como Cientista de Dados. Modelos estatísticos e algoritmos de Machine Learning, dependem de conhecimentos em regressão linear, regressão múltipla, clustering, Álgebra Linear, etc… Você precisa ser especialista em Estatística ou Matemática ou mesmo ter feito uma graduação nestas áreas? A resposta é não. Apesar dessas áreas permitirem uma compreensão mais abrangente, é possível aprender estes conceitos e aplica-los, ao longo da sua jornada de aprendizagem em Data Science. Você não precisa aprender todos os tópicos relacionados à Estatística ou Matemática.

Existem muitas formas de aprender os conceitos de Estatística e Matemática aplicada e isso leva tempo. Para qualquer aspirante a Cientista de Dados a recomendação é aprender Estatísticas codificando, de preferência em Python ou R, de forma que você possa aplicar imediatamente um conceito aprendido. Nada substitui uma graduação em Estatística ou Matemática claro, mas você pode aprender os conceitos que serão usados no seu dia a dia em Data Science, aplicando estes conceitos através de uma linguagem de programação. Data Science é uma área multi-disciplinar.

No fim deste artigo, você encontra alguns recursos indicados por nosso time de especialistas!Analytics

Passo 4: Big Data

Big Data é a matéria prima da Ciência de Dados. A profissão de Cientista de Dados, surgiu da necessidade de criar novos métodos de análise do imenso volume de dados que vem crescendo exponencialmente. Técnicas analíticas já existem há muitas décadas (talvez há séculos), mas nunca na história da humanidade, gerou-se tantos dados como atualmente. Novas formas de coleta, armazenamento e análise de dados são necessárias e o Big Data está revolucionando o mundo atual, pois com tantos dados a nossa disposição, podemos tomar decisões em tempo real e isso gera impacto direto na vida de todos nós.

O Cientista de Dados vai consumir Big Data, ou seja, vai utilizar o Big Data como matéria prima, aplicar diversas técnicas e colher insights. Mas a responsabilidade por coletar e armazenar os dados normalmente é do Engenheiro de Dados. Criação de clusters Hadoop, streaming de dados com Spark, integração entre diferentes fontes de dados são todas atribuições novas e normalmente exercidas por Engenheiros de Dados. Mas é importante que o Cientista de Dados conheça bem como funciona a infraestrutura que armazena os dados que serão analisados, pois isso pode fazer a diferença na hora de analisar 1 trilhão de registros, por exemplo.

Hadoop – O Hadoop está se tornando o coração da infraestrutura de Big Data, o que vai revolucionar o sistema tradicional de armazenamento em bancos de dados como conhecemos hoje. Além de gratuito, o Hadoop foi criado para ser usado em hardware de baixo custo, uma combinação essencial para empresas que buscam reduzir seus custos de infraestrutura de TI e ainda capitalizar os benefícios do Big Data.

Spark – Spark é um projeto open source, mantido por uma comunidade de desenvolvedores que foi criado em 2009 na Universidade da Califórnia, Berkeley. O Spark foi concebido com o principal objetivo de ser veloz, tanto no processamento de queries quanto de algoritmos, além de processamento em memória e eficiente recuperação de falha. É atualmente um dos assuntos mais quentes em Data Science e vem ganhando muita popularidade.

Bancos de Dados NoSQL – Bancos de Dados tradicionais RDBMS (Relational Database Management Systems) são foram projetados para tratar grandes quantidades de dados (Big Data). Bancos de Dados tradicionais foram projetados somente para tratar conjuntos de dados que possam ser armazenados em linhas e colunas e portanto, possam ser consultados através do uso de queries utilizando linguagem SQL (Structured Query Language). Bancos de Dados relacionais não são capazes de tratar dados não-estruturados ou semi-estruturados. Ou seja, Bancos de Dados relacionais simplesmente não possuem funcionalidades necessárias para atender os requisitos do Big Data, dados gerados em grande volume e alta velocidade. Esta é a lacuna preenchida por Bancos de Dados NoSQL, como o MongoDB por exemplo. Bancos de Dados NoSQL, são bancos de dados distribuídos e não-relacionais, que foram projetados para atender os requerimentos deste novo mundo de dados em que vivemos.

Bancos de Dados Relacionais e Data Warehouses – Nas últimas décadas, todos os dados corporativos tem sido armazenados em bancos de dados relacionais e soluções de Business Intelligence usaram DataWarehouses para criar soluções analíticas. Estes dados estruturados, serão fonte de dados para Data Science e daí a importância do conhecimento em linguagem SQL, a linguagem padrão para consultar estes tipos de dados.

Como Cientista de Dados, você precisa ser especialista em todas as tecnologias? Não. Mas parte do trabalho do Cientista de Dados, será coletar dados do HDFS (Hadoop File system), criar RDD’s no Spark, aplicar algoritmos de Machine Learning em streaming de dados, cruzar dados não estruturados coletados de redes sociais, com bancos de dados de CRM, etc…portanto, o Cientista de Dados precisa estar confortável com a forma como os dados estão armazenados e extrair da tecnologia o melhor que ela pode oferecer.

Passo 5: Linguagem de Programação e Machine Learning

Existem diversas ferramentas de análise e o número de soluções não para de crescer. Mas a recomendação para quem está iniciando, é obter o conhecimento básico, antes de tentar usar ferramentas de análise ou pacotes comerciais, de forma a conseguir extrair o melhor destas ferramentas. Algumas linguagens de programação se tornaram ícones em Ciência de Dados, como Python e R, por diversas razões: são gratuitas, contam com uma comunidade ativa e crescente, já atravessaram o período de maturação, são amplamente utilizadas, tanto no meio acadêmico quanto no meio empresarial e se especializaram em Data Science.

Python – É uma linguagem de uso geral, que tem recebido nos últimos anos, mais e mais módulos e pacotes para Data Science como Pandas, Matplotlib, Scikit-Learn e Stats Models. Python é mais fácil de aprender em comparação a outras linguagens, tem uma comunidade ativa, muita documentação disponível (inclusive em português) e pode ser usada para outras atividades além de Data Science.

Linguagem R – Linguagem estatística, que existe há mais de 30 anos. Sua capacidade de processar estatísticas de grandes volumes de dados e criar gráficos sofisticados, fizeram com que gigantes do mercado de tecnologia, como Oracle e Microsoft, adotassem R como linguagem padrão para análises estatísticas. Um dos problemas mais comuns que as pessoas enfrentam em aprender R é a falta de um guia. As pessoas não sabem, por onde começar, como proceder e nem que caminho seguir. Há uma sobrecarga de bons recursos gratuitos disponíveis na Internet e isso torna o caminho de aprendizado muito mais tortuoso.

Por exemplo: a plataforma de Aprendizado de Máquina da Microsoft (Microsoft Azure Machine Learning), possui uma série de módulos Python e R, prontos para uso. O conhecimento de pelo menos uma destas linguagens é fundamental.

Outras linguagens como Julia, Scala e Java também são muito utilizadas em Data Science, mas se estiver começando, opte pelas linguagens R ou Python. Estas linguagens vão permitir uma base sólida, fazendo com o que o profissional avance para soluções comerciais como SAS, Microsoft Azure Machine Learning, Oracle Advanced Analytics, Microstrategy, SAP Predictive Analytics, Tibco Analytics, entre outros.

Se você já possui conhecimento em Matlab, Octave, Stata ou Minitab, saiba que seu conhecimento já pode ser utilizado em Data Science.

Uma dica importante: não tente aprender tudo! Selecione 2 ou 3 ferramentas e se dedique ao aprendizado delas de forma detalhada.

E claro, não dá para falar em Data Science, sem falar em Machine Learning.

Machine Learning (ou Aprendizado de Máquina) é uma das tecnologias atuais mais fascinantes. Você provavelmente usa algoritmos de aprendizado várias vezes por dia sem saber. Sempre que você usa um site de busca como “Google” ou “Bing“, uma das razões para funcionarem tão bem é um algoritmo de aprendizado. Um algoritmo implementado pelo “Google” aprendeu a classificar páginas web. Toda vez que você usa o aplicativo para “marcar” pessoas nas fotos, do “Facebook” e ele reconhece as fotos de seus amigos, isto também é Machine Learning. Toda vez que o filtro de spam do seu email filtra toneladas de mensagens indesejadas, isto também é um algoritmo de aprendizado.

Algumas razões para o crescimento Machine Learning são o crescimento da web e da automação. Isso significa que temos conjuntos de dados maiores do que nunca. Por exemplo, muitas empresas estão coletando dados de clicks na web, também chamados dados de “clickstream”, e estão criando algoritmos para minerar esses dados e gerar sistemas de recomendação, que “aprendem” sobre os usuários e oferecem produtos que muito provavelmente eles estão buscando. O Netflix é um dos exemplos mais bem sucedidos de aplicação de Machine Learning. Cada vez que você assiste um filme ou faz uma avaliação, o sistema “aprende” seu gosto e passa a oferecer filmes de forma personalizada para cada usuário.

Existem diversos algoritmos de aprendizagem de máquina, dependendo se a aprendizagem é supervisionada ou não supervisionada, tais como: Linear Regression, Ordinary Least Squares Regression (OLSR), Logistic Regression, Classification and Regression Tree (CART), Naive Bayes, Gaussian Naive Bayes, k-Nearest Neighbour (kNN), k-Means, Bootstrapped Aggregation (Bagging), Natural Language Processing (NLP), Principal Component Analysis (PCA), Principal Component Regression (PCR), Back-Propagation e muito mais.

Cada algoritmo será ideal para determinado tipo de dado e de acordo com a análise pretendida. Não há necessidade de aprender todos os algoritmos. Mas é importante compreender os conceitos e como implementa-los. Daí a importância da Matemática e da Estatística. Confira as dicas no fim do artigo.

Passo 6: Conhecimento de Negócios

Qual o objetivo da sua análise? Para que você vai coletar montanhas de dados e aplicar modelos de análise? Que problema você pretende resolver, analisando dados? O principal objetivo da Ciência de Dados, é resolver problemas. As empresas não vão iniciar um projeto de Data Science, se isso não for relevante para o negócio. Portanto, o Cientista de Dados deve estar familiarizado com a área de negócio para a qual ele está iniciando um projeto, utilizando Data Science.

Normalmente o mercado interpreta de forma equivocada este requerimento para a profissão de Cientista de Dados, fazendo crer que o profissional precisa ser expert em determinado segmento de negócio. Mas aqui vale fazer algumas considerações importantes. Primeiro, os profissionais de Business Intelligence sempre tiverem este requerimento, conhecer bem uma área de negócio, a fim de coletar os KPI’s (indicadores) e com isso prover soluções BI que atendessem as necessidades do cliente. Isso não mudou, o que mudou foi a forma como a análise é feita, uma vez que o Big Data entrou na equação. Em segundo, dada a amplitude de projetos de Data Science e Big Data, dificilmente haverá um único profissional atuando e sim uma equipe de Data Science, normalmente liderada pelo Cientista de Dados. E no Data Science Team, diferentes perfis irão atuar, como por exemplo especialistas em segmentos de negócio.

A dica aqui é simples. Procure compreender a área de negócio na qual você pretende atuar como Cientista de Dados. Se vai trabalhar em uma mineradora por exemplo, quais são so principais indicadores? De onde vem os dados? Que problemas a empresa precisa resolver? Que tipos de dados devem ser analisados e correlacionados? Como técnicas de Machine Learning podem ser empregadas para melhorar o faturamento da empresa? Como a análise de dados permite oferecer um serviço melhor aos clientes? Cada área de negócio tem as suas particularidades e uma compreensão ampla disso, vai permitir um trabalho que realmente gere valor.

Passo 7: Técnicas de Apresentação e Visualização de Dados

Com a massiva quantidade de dados aumentando a cada dia, um grande desafio vem surgindo para aqueles responsáveis por analisar, sumarizar e apresentar os dados: fazer com que a informação gerada, possa ser facilmente compreendida.

E uma das tarefas mais importantes do trabalho do Cientista de Dados, é ser capaz de transmitir tudo aquilo que os dados querem dizer. E às vezes os dados querem dizer coisas diferentes, para públicos diferentes. Pode parecer fácil em princípio. Hoje temos à nossa disposição os mais variados recursos para apresentação e exatamente aí que está o desafio. Nunca foi tão fácil gerar tabelas e gráficos, com diferentes estruturas, formatos, tamanhos, cores e fontes. Os gráficos estão deixando de ser gráficos e se tornando infográficos. Ter um volume cada vez maior de dados à nossa disposição, não torna mais fácil a apresentação da informação gerada. Pelo contrário, torna a tarefa mais complicada. Quase uma arte.

Uma das tarefas do Cientista de Dados, é apresentar seus resultados. Ninguém melhor que o profissional que faz a análise, desde a coleta, limpeza e armazenamento dos dados, até a aplicação de modelos estatísticos, para explicar seus resultados. Uma visualização efetiva de dados, pode ser a diferença entre sucesso e falha nas decisões de negócio. Particularmente, eu acredito que em breve, a capacidade de comunicar e contar as histórias dos dados, será uma das características mais valorizadas e buscadas pelas empresas. Técnicas de apresentação é um dos skills que fará a diferença na hora de contratar um Cientista de Dados, à medida que o conhecimento técnico estiver difundido.

O Cientista de Dados deve ser um contador de histórias e deve ser capaz de contar a mesma história de maneiras diferentes. O profissional que for capaz de unir as habilidades técnicas necessárias para análise de dados, com a capacidade de contar histórias, será um profissional único. Este é o verdadeiro conceito de unicórnio, atribuído aos Cientistas de Dados.

Diversas ferramentas possuem funcionalidades avançadas para visualização de dados: Pentaho, Tableau, QlikView, Microsoft Excel, Microsoft Power BI, Microstrategy, Weka, NetworkX, Gephi, bibliotecas Java Script (D3.js, Chart.js, Dygraphs), além de visualizações alto nível que podem ser feitas em Python ou R.

É importante não apenas estar familiarizado com uma ou mais ferramentas para visualizar dados, mas também os princípios por trás da codificação visual de dados e comunicação de informações.

Passo 8: Pratique!!

Não há outra forma de aprender qualquer que seja o assunto. É preciso praticar, testar, experimentar, cometer erros, aprender com eles, testar novamente, interagir com a comunidade.

Ufa. Se você chegou até aqui, parabéns! Agora você compreende melhor porque o Cientista de Dados é uma profissão em ascensão e porque sua remuneração está entre as maiores em qualquer pesquisa que se faça? Mas ainda não terminamos, continue sua leitura:

Erros que devem ser evitados ao longo da caminhada:

1- Achar que o aprendizado é fácil e rápido – Em nenhuma profissão, o aprendizado é rápido e fácil. Adquirir conhecimento e experiência requer tempo, esforço, investimento e bastante dedicação. Não caia nesta armadilha. Comece sua preparação hoje mesmo, mas esteja ciente que adquirir conhecimento leva tempo.

2- Aprender muitos conceitos ao mesmo tempo – Este é o erro mais comum. Por se tratar de uma área interdisciplinar, há normalmente a tendência em querer aprender muita coisa ao mesmo tempo. Não foque em quantidade e sim qualidade. Aprenda um conceito, consolide, pratique e só então avance para outra área de estudo. O começo será mais difícil, mas à medida que aprende e adquire experiência, o aprendizado de novas ferramentas fica mais fácil.

3- Começar por problemas muito complexos – A solução de problemas mais complexos em Data Science, requer tempo e experiência. Não tente fazer isso no começo da sua jornada.

4- Focar apenas na programação – Data Science não é apenas programação. Outros conceitos são tão importantes quanto. Estatística é importante. Visualização de dados e apresentação são importantes. Tenha seu foco em outras áreas e não apenas programação.

E como estudar?

Antes de investir em formação analítica, tome essas medidas para ter certeza de obter o valor real do seu investimento.

1. Defina suas metas. Como diz o ditado: “Quem não sabe para onde vai, qualquer caminho serve!”. Você fez a auto avaliação sugerida lá no início do texto? Qual foi o resultado? Quais são as áreas que você precisa se dedicar? Como será sua disponibilidade? Qual seu objetivo? Sei que são muitas perguntas, mas elas precisam ser respondidas, antes de definir sua trilha de aprendizagem.

2. Participe de comunidades. Cientistas de Dados costumam se encontrar em Meetups e em alguns blogs (links abaixo). Estas comunidades vão permitir a troca de experiências e isso é muito valioso.

3. Experimente. Enquanto você não executar um algoritmo de aprendizado de máquina em um dataset com milhões de registros, não criar um algoritmo de limpeza e transformação de dados, não coletar streaming de dados de redes sociais, você não vai compreender como as coisas funcionam. Experimente! Aprenda, faça, erre, faça novamente e quando você menos esperar, você vai ser capaz de analisar dados e contribuir para a empresa onde trabalha ou para seu próprio negócio.

Use as informações que você recolheu para selecionar opções de treinamento que ajudam você a alcançar seus objetivos, sem perder tempo e dinheiro.

Conhecimento em Ciência de Dados requer tempo e dedicação. O treinamento que você escolher deve ser um mix de fundamentação teórica, com prática e experimentação.

Recursos

Existem muitos recursos disponíveis para aprender Data Science e tantos recursos acabam gerando sobrecarga nos iniciantes, que podem perder o foco. Separamos aqui uma lista com as que consideramos as melhores fontes de aprendizagem em Data Science.

Blogs:

Data Science Central: http://www.datasciencecentral.com
KDD Nuggets: http://www.kdnuggets.com
Artigos sobre R: http://www.r-bloggers.com
Python Brasil: http://python.org.br

Estatística:

Statistics: http://www.statistics.com
Simply Statistics: http://simplystatistics.org

Machine Learning:

Machine Learning Coursera: https://www.coursera.org/learn/machine-learning
Deep Learning: http://deeplearning.net/
Deep Learning Book: http://www.deeplearningbook.com.br

Vídeos e Competições:

Top 10 TED Talks for Data Scientists: http://www.kdnuggets.com/2016/02/top-10-tedtalks-data-scientists.html
Data Science for Social Goods: http://dssg.uchicago.edu
Kaggle: https://www.kaggle.com
Data Science Game: http://www.datasciencegame.com

Capacitação:

Data Science from Harvard: http://cs109.github.io/2014
Visualização de Dados: https://columbiadatascience.com/category/course-topics/data-visualization
Open Data Science Master: http://datasciencemasters.org
Big Data e Social Analytics MIT: http://getsmarter.mit.edu/big-data-and-social-analytics-course-aw
Metis Data Science: http://www.thisismetis.com
Zipfian Academy: http://www.zipfianacademy.com
e-Setorial Business Analytics: http://www.e-setorial.com.br/servicos 

Fonte http://datascienceacademy.com.br

Escrever um comentário (2 Comentários)