2 de mar de 2014

BIG DATA: A REVOLUÇÃO DA GESTÃO DO CONHECIMENTO



Erik Brynjolfsson e Andrew McAfee

    "Não dá para administrar o que não se mede"

    Há muita sabedoria nesta máxima, que já foi atribuída tanto a W. Edwards Deming quanto a Peter Drucker e explica por que a recente explosão de dados digitais é tão importante. Resumindo, devido ao chamado “big data”, um gestor pode medir — e, portanto, saber — muitíssimo mais sobre o negócio, e converter esse conhecimento diretamente em decisões e resultados melhores.

    Peguemos o varejo. O comércio livreiro tradicional, com lojas físicas, sempre teve como saber que livros vendiam ou não. Se tivesse um programa de fidelidade, dava até para descobrir que cliente tinha comprado esse ou aquele livro. E era só. Quando o comércio foi para a internet, no entanto, o conhecimento sobre a clientela aumentou radicalmente. Varejistas eletrônicas podiam monitorar não só o que o público comprava, mas também que outros itens checava; como navegava pelo site; até onde era influenciado por promoções, resenhas e pela organização das páginas; e semelhanças entre indivíduos e grupos. Em pouco tempo, criaram algoritmos para prever que livro um certo cliente gostaria de ler em seguida — algoritmos que iam melhorando cada vez que o cliente aceitava ou ignorava uma recomendação. O varejo tradicional simplesmente não tinha como obter esse tipo de informação — que dirá agir com base nela no momento oportuno. Não é à toa que a Amazon levou à falência tanta livraria tradicional.

    A familiaridade da história da Amazon é tanta que quase mascara sua força. Hoje, é normal esperarmos, de empresas que já nasceram digitais, proezas que não passavam de sonho para executivos de uma geração atrás. Só que o fenômeno do big data tem o potencial de transformar empresas tradicionais também, ao abrir oportunidades ainda maiores para que consigam vantagem competitiva (empresas digitais sempre souberam que a vitória dependeria de quão bem entendessem seus dados). Como veremos em mais detalhe, o big data dessa nova revolução tem muito mais força do que a analítica usada ​​no passado. Podemos medir e, portanto, administrar de forma mais precisa do que nunca. Podemos fazer projeções melhores e tomar decisões mais inteligentes. Podemos promover intervenções direcionadas, mais eficazes — e isso em áreas onde até aqui imperavam o instinto e a intuição, não dados e rigor.

    À medida que forem se disseminando, ferramentas e filosofias do big data vão mudar velhas ideias sobre o valor da experiência, a natureza do conhecimento e a prática da administração. Líderes sagazes de tudo quanto é setor encararão o uso do big data como aquilo que realmente é: uma revolução na gestão. Mas, como com qualquer outra grande mudança na atividade empresarial, o desafio de habilitar a organização para o uso dessa imensidão de dados pode ser enorme e exigir o envolvimento direto — ou, em certos casos, o distanciamento — da liderança. É, contudo, uma transição que executivos precisam encarar hoje.

    Qual a novidade?

    Volta e meia executivos nos perguntam se “big data” não é apenas outro jeito de dizer “analítica”. É verdade que há relação entre os dois: o movimento do big data, assim como o da analítica antes dele, busca extrair informações de montanhas de dados e converter isso tudo em vantagem competitiva. Há, contudo, três grandes diferenças:

    Volume. No presente, 2012, cerca de 2,5 exabytes de dados são criados todo dia, número que dobra a cada 40 meses, por aí. O volume de dados que circulam a cada segundo pela internet é maior do que toda a informação armazenada na rede 20 anos atrás. Isso dá a empresas a oportunidade de trabalhar com vários petabytes de dados em um único conjunto de dados — e não só oriundos da internet. Calcula-se, por exemplo, que o Walmart reúna mais de 2,5 petabytes de dados por hora de transações de clientes. Um petabyte é um quatrilhão de bytes, ou o equivalente ao texto guardado em cerca de 20 milhões de arquivos de aço. Um exabyte é mil vezes esse número, ou um bilhão de gigabytes.


    clique na imagem para ampliar


    Velocidade. Em muitos casos, a velocidade de geração de dados é ainda mais importante do que o volume. A informação em tempo real, ou quase, permite à empresa ser muito mais ágil do que concorrentes. Um exemplo: nosso colega Alex Pentland (junto com sua turma no MIT Media Lab) usou ​​dados de localização de celulares para inferir quanta gente havia nos estacionamentos da loja de departamentos americana Macy’s durante a chamada Black Friday, que inaugura a temporada natalina de compras nos Estados Unidos. Com isso, foi possível estimar as vendas da varejista naquele dia crucial antes mesmo de a Macy’s ter registrado essas vendas. Insights rápidos como esse podem dar uma óbvia vantagem competitiva para analistas do mercado financeiro e gestores de empresas.

    Variedade. O big data inclui mensagens, atualizações e imagens postadas em redes sociais; leituras de sensores; sinais de GPS de celulares e por aí vai. Muitas das fontes mais importantes dessa profusão de dados são relativamente novas. A imensa quantidade de informação disponível em redes sociais, por exemplo, tem a mesma idade das redes em si: o Facebook foi lançado em 2004, o Twitter em 2006. O mesmo vale para smartphones e outros aparelhinhos móveis que hoje trazem levas imensas de dados ligados a pessoas, atividades e lugares. Dada a disseminação desses aparelhos, é fácil esquecer que o iPhone foi lançado há apenas cinco anos e o iPad, em 2010. Logo, bancos de dados estruturados que até bem pouco guardavam o grosso das informações de empresas são inadequados para armazenar e processar o big data. Ao mesmo tempo, a contínua queda no custo de todos os elementos da informática —armazenamento, memória, processamento, largura de banda e outros — significa que abordagens fundadas no uso intensivo de dados, até então caríssimas, rapidamente barateiam.

    Com mais e mais atividade empresarial sendo digitalizada, novas fontes de informação e equipamentos cada vez mais baratos se unem para inaugurar uma nova era — era que traz grandes volumes de informação digital sobre praticamente todo assunto de interesse para a empresa. Telefones celulares, compras na internet, redes sociais, comunicação eletrônica, GPS e maquinário computadorizado produzem torrentes de dados como subproduto de sua operação normal. Cada um de nós hoje é um gerador ambulante de dados. Embora os dados produzidos em geral sejam desestruturados (não organizados em bancos de dados) e confusos, há uma tremenda quantidade de sinal em meio ao ruído, só esperando para ser liberado. A analítica trouxe técnicas rigorosas à tomada de decisão; o big data é, a um só tempo, mais simples e mais poderoso. É como diz o diretor de pesquisa do Google, Peter Norvig: “Não temos algoritmos melhores. Temos apenas mais dados”.

    Como se saem empresas movidas a dados

    A segunda pergunta que a ala cética pode fazer é a seguinte: “Onde está a prova de que um uso inteligente do big data irá melhorar o desempenho da empresa?”. Publicações de negócios estão cheias de relatos e estudos de caso que supostamente demonstrariam o valor de agir com base em dados. Mas a verdade, descobrimos há pouco, é que ninguém estava sendo rigoroso na busca de uma resposta. Para preencher essa lacuna constrangedora, lideramos uma equipe no MIT Center for Digital Business, trabalhando em parceria com o departamento de tecnologia empresarial da McKinsey e com a colega Lorin Hitt, da Wharton, e Heekyung Kim, doutorando do MIT. Queríamos testar a hipótese de que empresas movidas a dados teriam um desempenho melhor. Fizemos entrevistas estruturadas com executivos de 330 empresas norte-americanas de capital aberto sobre suas práticas de gestão organizacional e de tecnologia, e reunimos dados de desempenho disponíveis em balanços anuais e fontes independentes.

    Nem todo mundo abraçara a tomada de decisões movida a dados. Aliás, descobrimos uma grande variedade de atitudes e abordagens em todo setor. Em todas as análises que fizemos, contudo, uma relação se destacou: quanto mais a empresa se caracterizava como movida a dados, melhor era seu resultado em indicadores objetivos de desempenho financeiro e operacional. Em particular, empresas no terço superior do respectivo setor no uso de dados na tomada de decisões eram, em média, 5% mais produtivas e 6% mais rentáveis do que as concorrentes. Essa diferença de desempenho seguia forte mesmo após computada a contribuição de mão de obra, capital, serviços adquiridos e investimentos tradicionais em TI. Era estatisticamente relevante e economicamente importante e se refletia em um aumento mensurável do valor de mercado da empresa.

    Como, então, o big data está sendo usado por gestores? Examinemos em detalhe duas empresas que de novatas do Vale do Silício não têm nada. Uma usa o big data para criar novos negócios, a outra para turbinar as vendas.


    clique na imagem para ampliar


    Mais precisão no horário de chegada de aviões

    Em um aeroporto, todo minuto importa. A exatidão das informações sobre o horário previsto de chegada de voos também. Se um avião pousa antes de o pessoal em solo estar pronto, passageiros e tripulação ficam literalmente presos na aeronave. Já se chega depois do esperado, o pessoal fica parado, elevando custos. Logo, quando um estudo interno revelou a uma grande companhia aérea americana que havia uma diferença de dez minutos entre o horário previsto de chegada e o horário efetivo de chegada de cerca de 10% dos voos em seu principal aeroporto — e de pelo menos cinco minutos em 30% dos voos —, a diretoria decidiu agir.

    Na época, a companhia seguia a velha prática do setor de usar a estimativa de horário de chegada feita por pilotos. Era uma estimativa feita na fase final de aproximação do aeroporto, quando o tempo e a atenção do piloto estavam comprometidos com muitas outras coisas. Em busca de uma solução melhor, a companhia procurou a PASSUR Aeroespace, fornecedora de tecnologias de apoio a decisões para a indústria da aviação. Em 2001, a PASSUR lançou o serviço RightETA para informar suas próprias estimativas de horário de pouso. Para calcular esse horário, combinava dados de caráter público sobre o tempo, a programação de voos e outros fatores com dados exclusivos coletados pela própria empresa, incluindo registros de uma rede de estações de radar passivo que instalara perto de aeroportos para coletar dados sobre todo avião voando nas redondezas.

    A PASSUR começou com um punhado dessas instalações. Em 2012, já eram mais de 155. A cada 4,6 segundos, a empresa coleta uma grande variedade de informações sobre todo avião que “vê”. Isso produz uma leva imensa e constante de dados digitais. Além disso, já que guarda todos os dados registrados ao longo do tempo, a PASSUR tem um imenso estoque de informação multidimensional que abrange mais de uma década. Isso permite análise sofisticada e detecção de padrões. O mecanismo essencial de operação do RightETA é perguntar “o que aconteceu todas as outras vezes em que um avião se aproximou desse aeroporto nessas mesmas condições? Qual foi o horário efetivo de pouso?”.

    Depois de adotar o RightETA, a companhia aérea do caso praticamente eliminou o vão entre os horários estimado e efetivo de chegada de voos. A PASSUR acredita que a capacidade de saber quando seus aviões vão pousar e se planejar para isso representa um valor de milhões de dólares ao ano para uma companhia aérea em cada aeroporto. É uma fórmula simples: usar o big data leva a projeções melhores e projeções melhores levam a decisões melhores.

    Promoções mais rápidas, mais personalizadas

    Há coisa de dois anos, a Sears Holdings chegou à conclusão de que precisava aproveitar melhor o gigantesco volume de dados de clientes, produtos e promoções que obtinha das redes de varejo do grupo (Sears, Craftsman e Lands’ End). Obviamente, seria valioso combinar e fazer uso de todos esses dados para adaptar promoções e outras ofertas à clientela, e para personalizar ofertas a fim de tirar partido de condições locais. Valioso, mas difícil: a Sears precisava de cerca de oito semanas para conceber promoções personalizadas, altura na qual muitas já não eram ideais para a empresa. E demorava tanto, basicamente, porque os dados exigidos para essa análise de grande escala eram volumosos e altamente fragmentados, depositados que estavam em vários bancos de dados e “data warehouses” mantidos pelas distintas cadeias.

    Em busca de um meio mais rápido e barato de executar esse trabalho analítico, a Sears Holdings recorreu a tecnologias e práticas do big data. Uma das primeiras medidas foi criar um cluster Hadoop. É, basicamente, um conjunto de servidores comuns, de baixo custo, cujas atividades são coordenadas por um novo modelo de software, o Hadoop (nome de um elefantinho de brinquedo do filho de Doug Cutting, um de seus criadores).

    A Sears começou a usar o cluster para armazenar dados que chegavam de todas as lojas do grupo e que já estavam em data warehouses da empresa. Em seguida, fez análises diretamente no cluster, evitando a complexidade e a demora de coletar dados em distintas fontes e combiná-los para que pudessem ser analisados. Com essa mudança, a empresa ficou muito mais ágil e certeira em suas promoções. Segundo o diretor de tecnologia da Sears, Phil Shelley, o tempo exigido para produzir um grande bloco de promoções caiu de oito semanas para uma — e segue diminuindo. Além disso, são promoções melhores — pois chegam na hora certa, são mais focadas e mais personalizadas. O cluster Hadoop da Sears armazena e processa vários petabytes de dados a uma fração do custo de um data warehouse equiparável.
    Shelley se diz surpreso com o fácil que foi migrar de velhas para novas abordagens à gestão de dados e à analítica de alto rendimento. Já que o know-how e o conhecimento nessas novas tecnologias de dados eram coisa rara em 2010, quando a Sears iniciou a transição, foi preciso contratar outra empresa, a Cloudera, para realizar parte do trabalho. Com o tempo, no entanto, o próprio time de profissionais de TI e analítica do grupo passou a dominar as novas ferramentas e abordagens.

    Os dois exemplos — o da PASSUR e o da Sears Holdings — demonstram o poder do big data, que permite projeções mais certeiras, decisões melhores e intervenções precisas. E tudo isso em escala aparentemente ilimitada. Já vimos o big data sendo usado na gestão da cadeia de suprimento (para explicar por que índices de defeito de carros de uma montadora subiram repentinamente), no atendimento ao cliente (para monitorar e intervir continuamente em hábitos de saúde de milhões de pessoas), na atividade de planejamento e projeção (para prever melhor vendas por internet com base em dados sobre atributos de um produto) e por aí vai. Vimos retornos parecidos em várias outras áreas e atividades, de finanças a marketing, de hotelaria a jogos, da gestão de recursos humanos ao conserto de máquinas.

    Nossa análise estatística nos diz que o que estamos vendo não é só um punhado de exemplos extraordinários, mas uma transformação mais fundamental da economia. Estamos convencidos de que quase nenhuma esfera da atividade empresarial ficará de fora dessa mudança.

    Uma nova cultura para a tomada de decisões

    Desafios técnicos do uso do big data são bem reais. Mas os desafios de gestão são ainda maiores — a começar pelo papel da alta equipe executiva.

    Calar os HiPPOs. Um dos aspectos mais críticos do big data é seu impacto sobre a forma como decisões são tomadas — e quem as toma. Quando não há muitos dados, é caro consegui-los ou não estão disponíveis em formato digital, faz sentido deixar que indivíduos bem situados tomem decisões, pois o fazem com base na experiência que adquiriram e em padrões e relações que observaram e internalizaram. “Intuição” é o nome dado a esse estilo de inferência e tomada de decisão. A pessoa dá sua opinião sobre o futuro — o que vai acontecer, se algo dará certo ou não — e, com base nisso, traça planos (veja “As verdadeiras medidas do sucesso”, de Michael J. Mauboussin, nesta edição).

    Se a decisão é particularmente importante, esses indivíduos em geral são lá do alto da organização — ou, então, gente de fora contratada a peso de ouro por sua experiência e histórico. Na comunidade do big data, muitos sustentam que a maioria das 

    decisões importantes de uma empresa seguem a “HiPPO”: “the highest-paid person’s opinion”. Literalmente, a opinião da pessoa mais bem paga.

    É verdade que muitos executivos se pautam de verdade por dados e estão dispostos a passar por cima da própria intuição quando essa informação a contradiz. A nosso ver, no entanto, o meio empresarial hoje em dia aposta muito mais na experiência e na intuição do que em dados. Em nosso estudo, criamos uma escala composta de 0 a 5 para medir até que ponto uma empresa era movida a dados. Nada menos que 32% dos entrevistados deram à respectiva empresa nota igual ou inferior a 3 nessa escala.

    Novos papéis. Executivos interessados ​​em conduzir a transição para o big data podem começar com duas técnicas bem simples. A primeira é cultivar, quando diante de uma decisão importante, o hábito de perguntar o que os dados dizem e seguir essa pergunta de outras mais específicas, como “De onde vieram os dados?”, “Que tipo de análise foi feita?” e “Até que ponto acreditamos nos resultados?” (quando executivos adquirem essa disciplina, o pessoal logo capta a mensagem). A segunda é deixar que sua opinião seja mudada por dados; poucas coisas surtem mais efeito para transformar a cultura de tomada de decisões de uma empresa do que ver um alto executivo admitir que um palpite seu foi refutado por dados.

    Obviamente, quando o assunto é definir que problemas abordar, o conhecimento da área ainda é crítico. O tradicional especialista — gente que conhece a fundo uma determinada área — é aquele que sabe onde residem as maiores oportunidades e os maiores desafios. A PASSUR, por exemplo, está tentando contratar o maior número possível de profissionais com vasto conhecimento do lado operacional dos principais aeroportos dos EUA. Ao ajudar a empresa a decidir que produtos e mercados abordar em seguida, essa gente será de valor inestimável.

    À medida que o movimento do big data for avançando, o papel do especialista vai mudar. Esse profissional será valorizado não pelas respostas que dá no modelo “HiPPO”, mas por saber o que perguntar. Pablo Picasso podia estar pensando em um especialista desses quando disse: “O computador é algo inútil. O único que faz é dar respostas”.

    Cinco desafios de gestão

    Uma empresa só vai colher os benefícios da transição para o uso do big data se puder administrar a contento a mudança. Nesse processo, cinco áreas são particularmente importantes.

    Liderança. Uma empresa não triunfa na era do big data só por ter mais dados, ou dados melhores, mas sim porque a equipe de liderança traça metas claras, define o que será considerado sucesso e faz as perguntas certas. O poder do big data não elimina a necessidade de visão nem de sagacidade humanas. Longe disso: ainda precisamos de líderes empresariais capazes de detectar uma grande oportunidade, de entender como o mercado está evoluindo, de pensar com criatividade e de propor coisas realmente novas, de articular uma visão contundente, de convencer os outros a abraçá-la e a dar duro para que se materialize e de lidar bem com clientes, trabalhadores, acionistas e outros interessados. Na próxima década, vão triunfar empresas cujos líderes reúnam todos esses atributos e, ao mesmo tempo, consigam mudar o modo como muitas das decisões ali dentro são tomadas.

    Gestão de talentos. À medida que o custo dos dados cai, sobe o valor de complementos a esses dados. Entre os mais importantes estão cientistas de dados e outros profissionais capazes de trabalhar com grandes volumes de informação. Embora a estatística seja importante, muitas das principais técnicas para uso do big data raramente são ensinadas em cursos tradicionais de estatística. Mais importante ainda talvez seja a capacidade de depurar e organizar grandes conjuntos de dados, já que os novos tipos de dados raramente vêm em formato estruturado. Há, também, uma valorização de ferramentas e técnicas de visualização. Além de cientistas de dados, uma nova geração de especialistas em ciência da computação vem aplicando técnicas para trabalhar com blocos muito grandes de dados. O conhecimento na formulação de experimentos pode ajudar na transposição do fosso entre correlação e causalidade. Um bom cientista de dados sabe, além disso, falar a língua dos negócios e ajudar líderes a reformular os desafios de um jeito abordável pelo big data. Obviamente, quando a demanda é grande, é difícil achar profissionais com esse currículo (veja, ainda nesta edição, “Cientista de dados: o profissional mais cobiçado do século 21”, de Thomas H. Davenport e D.J. Patil).

    Tecnologia. As ferramentas disponíveis para lidar com o volume, a velocidade e a variedade do big data melhoraram muito nos últimos anos. Em geral, o custo dessas tecnologias não é proibitivo — e muito do software é de código livre. O Hadoop, o sistema mais usado, combina servidores comuns com software open source. O programa distribui os dados que chegam por discos baratos; além disso, traz ferramentas para a análise dos dados. A capacitação exigida por essas tecnologias é, contudo, novidade para a maioria dos departamentos de TI, que terão de dar duro para integrar toda fonte relevante de dados, interna e externa. Embora não seja tudo, a atenção à tecnologia é um elemento indispensável de uma estratégia de big data.

    Tomada de decisões. Uma organização eficaz situa a informação e direitos de decisão pertinentes no mesmo lugar. Na era do big data, contudo, a informação é gerada e transferida, e o conhecimento volta e meia não está onde costumava estar. O líder astuto vai criar uma organização flexível o bastante para minimizar a síndrome do “não foi inventado aqui” e maximizar a cooperação entre áreas distintas. É preciso reunir gente que entenda do problema em torno dos dados certos — e também gente dotada de técnicas de resolução de problemas que possam efetivamente explorar esses dados.

    Cultura da empresa. A primeira pergunta que uma organização movida a dados se faz não é “Qual nosso palpite?”, mas sim “Que informação temos?”. Para isso, é preciso deixar de agir com base apenas na intuição e no instinto. É preciso, ainda, abandonar um hábito péssimo de muitas organizações: fingir que são mais movidas a dados do que realmente são. Vimos muito executivo recheando relatórios com dados que sustentavam decisões que o dito-cujo já tinha tomado com o método tradicional, o HiPPO. Subalternos saíram a posteriori atrás de números que justificassem a decisão.

    Restam,  sem dúvida, muitos obstáculos no caminho. Há pouquíssimos cientistas de dados no mercado. Tecnologias são novas e, em certos casos, exóticas. É fácil demais confundir correlação com causa e achar padrões enganadores em dados. Desafios culturais são enormes e, naturalmente, a questão da privacidade vai ganhar cada vez mais importância. Mas tendências subjacentes, tanto na tecnologia como no retorno para a empresa, são inconfundíveis.

    A evidência é clara: decisões tomadas com base em dados tendem a ser decisões melhores. Ou o líder aceita esse fato, ou é substituído por alguém que o faça. Em setor após setor, empresas que descobrirem como combinar a tarimba em uma determinada área com a ciência dos dados vão deixar as rivais para trás. Não dá para dizer que toda vencedora estará usando o big data para transformar a tomada de decisão. Mas os dados nos dizem que essa é a aposta mais segura. 

    ____________________________________

    Andrew McAfee é diretor de pesquisas do Center for Digital Business do MIT, nos EUA, e autor de Empresas 2.0 (Campus, 2010).

    Erik Brynjolfsson é titular da cátedra Schussel Family Professor da Sloan School of Management, faculdade de administração do MIT, e diretor do Center for Digital Business, abrigado na instituição.  A dupla é autora de Race Against the Machine (Digital Frontier Press, 2012).