Que o tempo tem propriedades não lineares, já sabemos. Este conceito, algo estratosférico revolucionou o modo como nós, humanos, o entendemos, tendo inclusive encontrado o seu caminho na cultura popular através de filmes como o Arrival. Da mesma forma, também a maneira como trabalhamos os dados, que são um dos maiores potenciadores para a evolução da nossa sociedade, começa a sofrer uma alteração de paradigma.

Dizia Peter Sondergaard que "a informação é o petróleo do século XXI e a analítica o motor de combustão"; contudo, tendo em conta que a informação se extrai a partir dos dados, são de facto estes a matéria-prima nesta analogia. Há apenas uma década, a ciência de dados andava disfarçada sob o nome de data mining; os saltos, marcadamente olímpicos, que a tecnologia deu no início dos anos 2000 levou ao armazenamento colossal de dados pelas gigantes como a Google ou a Meta (anteriormente Facebook). Desde aí, o amontoar do volume de informação nunca mais abrandou - pelo contrário. A questão que se coloca agora é: quando conseguiremos conquistar esta montanha de dados?

De onde estamos, conseguimos facilmente ver a ciência de dados em ação no nosso quotidiano. Imaginemos que estamos a comprar numa Amazon ou um qualquer outro marketplace do género. Se forem como eu, muitas vezes andarão só a pesquisar aspiradores e brinquedos para os filhos sem nunca realmente adicionar nada ao carrinho. Momentos mais tarde, nessa ou noutra plataforma similar, será inevitável começarmos a ser bombardeados com produtos e sugestões que se alinham com o que andávamos a procurar. Esta mecânica é retirada de modelos que foram precisamente construídos por cientistas de dados, cujo fundamento assenta na previsão do nosso interesse com base em comportamentos passados.

Desta forma, numa sociedade crescentemente digital e que até já cria os seus próprios metaversos, o seu desenvolvimento prender-se-á necessariamente com a direção que o uso dos dados tome. Fomos já testemunhas de como estes podem influenciar decisões políticas, sabemos que são ferramentas incrivelmente úteis para otimizar a eficiência ao nível industrial e prometem revolucionar setores como o planeamento urbano. Tamanho potencial não deve ser menosprezado, mas como todas as áreas de estudo e aplicação de conhecimento, está sujeito a alterações profundas. De momento, prevejo três principais desafios e caminhos futuros para a evolução desta disciplina.

O primeiro debruça-se sobretudo sobre a maneira como encaramos a segurança e a privacidade destes dados, tema sobejamente discutido na arena pública. As previsões apontam para que em 2023, 65% da população mundial esteja abrangida por regulamentos de proteção de dados, um aumento de 55% em relação a 2019. Apesar de ainda recair sobre muitas vezes sobre os cientistas de dados a garantia desta segurança e anonimização, começam a surgir ferramentas que asseguram este processo. A ascensão do blockchain, imbuída numa filosofia compatível com este objetivo, poderá assim prestar uma contribuição significativa para garantir o acesso e utilização devida da informação.

O que atualmente já conhecemos enquanto realidade aumentada ou virtual será também amplamente impactada pela evolução da ciência de dados. A evolução do espaço digital, no qual retorno também ao ponto dos metaversos, tem ganhado popularidade e vindo a enfatizar a necessidade de impingir uma mais realista natureza nas nossas interações nesses ambientes. Tanto melhor será a nossa experiência quanto mais automática a reação do sistema for ao nosso comportamento. Esta automatização requer necessariamente velocidade, e é este ponto que quero enfatizar. Os modelos desenvolvidos com a computação tradicional não têm já a capacidade de resposta esperada aos desafios a que se propõem. Descortinando: teremos um futuro relativamente próximo marcado pela disseminação da computação quântica, e é irrevocável que esta irá requerer uma adaptação dos profissionais - bem como da natureza dos próprios algoritmos tradicionais. Uma mudança paradigmática em si, para corresponder às exigências da evolução da indústria e, subsequentemente, da sociedade.

Estas exigências e a necessidade de adaptação levam-me ao último ponto: a ideia formada que temos de um cientista de dados irá desaparecer. Ao longo da próxima década, as competências habitualmente atribuídas a alguém que ocupe essa posição sê-lo-ão a designações mais específicas, como engenheiro ou analista de dados. Não irá desaparecer o que fazem, mas a evolução da ciência de dados trará a já necessária reformulação deste papel.

"Porque o presente é todo o passado e todo o futuro", cantava Fernando Pessoa sob o heterónimo Álvaro de Campos na Ode Triunfal. Assim também se rege a ciência de dados: dependemos de tudo o que aprendemos para impulsionarmos a evolução tecnológica e empoderarmos a sociedade através dela. Façamos desta abordagem quase "quântica" o nosso mote para, eventualmente, alcançarmos o cume desta montanha.

João Martins, Diretor de Digital Insights na Hitachi Vantara em Portugal