O jargão Big Data faz parte do conjunto de buzz words que um gestor empertigado é impelido a referir, seja perante uma audiência de investidores ou mesmo no meio de um discurso por altura do almoço de Natal da empresa. Este hábito quási-queirosiano de arremessar, de forma frenética, acrónimos da moda já não é de hoje. Porém, a utilização massiva e em série destes jargões (sem verdadeira cogitação sobre o seu impacto) redunda na banalização dos conceitos e na seleção sequencial de novos acrónimos (mais trendy) sem que os anteriores tenham sido implementados.

O conceito Big Data está associado à tendência de digitalização da economia, materializada pela sensorização de equipamentos, pela transição de tecnologias analógicas para digitais, pela massificação de smartphones e pela utilização de serviços na cloud. De acordo com a McKinsey & Company, a quantidade de dados produzidos na economia duplica a cada três anos, o que acaba por consubstanciar um enorme volume de informação para analisar. Se há uma década se trabalhava no domínio do Gigabyte, atualmente o Facebook produz diariamente 500 Terabytes (10¹²) de dados, enquanto a internet gera 1 Exabyte (mil milhões de Gigabytes) de informação por dia (o equivalente a 250 milhões de DVD)[1].

Não obstante as grandes empresas estarem particularmente atentas aos benefícios do Big Data, este conceito não é da exclusividade do S&P500 ou do PSI20. Também as micro, pequenas e médias empresas beneficiarão da gestão de informação ao serviço do processo de tomada de decisão. Tenho tido a oportunidade de trabalhar em diferentes tipos de organizações – PME, grandes empresas multinacionais e nacionais, e instituições públicas governamentais e de I&D –, sendo possível encontrar um denominador comum: cada colaborador tende a criar a sua própria base de dados. Esta difusão mandelbrotiana[2] de aplicações e bases de dados é geradora de decisões subótimas, já que o processo é suportado em informação inconsistente.

A construção de processos centrados em dados requer, desde logo, a decisão (ao mais alto nível) de centralização e de partilha da informação. Com o apoio das tecnologias de informação e comunicação, é possível construir uma plataforma de recolha e armazenamento de dados (seja na forma convencional ou utilizando o conceito de data lake). Uma PME pode recorrer a soluções freeware, enquanto uma grande empresa poderá investir em sistemas proprietários mais complexos. O segundo passo na transformação digital da empresa passa pela clara definição da governance das aplicações, isto é, uma política para a manutenção e atualização permanente das bases de dados, que inclua utilizadores e produtores de informação. Por último, é necessário adicionar a esta arquitetura de informação uma “camada” dedicada à modelação, estatística e apoio à decisão.

Este trabalho, realizado por data scientists (em grandes empresas) ou pelos gestores de marketing (numa PME), garante que a informação será transformada em conhecimento e que as decisões do negócio serão tomadas de forma fundamentada e alicerçada num registo histórico das operações. Caso contrário, continuamos a ter GIGO: garbage in, garbage out.

 

[1] Fonte: Microsoft.

[2] Benoit Mandelbrot foi um matemático polaco (posteriormente naturalizado francês), que ficou célebre por ter proposto a geometria fractal e a lógica das distribuições caóticas a um conjunto de aplicações, como os mercados financeiros e a física.