A ideia foi encontrar uma métrica para o “sentimento” positivo ou negativo do mercado, a partir dos dados dessa rede social. A pesquisa apresenta vários avanços face a estudos similares, ao focar-se num período longo de tempo, tratar grande quantidade de informação (big data), usar dados diários e técnicas estatísticas robustas, evitando generalizações circunstanciais. O artigo saiu na revista “Expert Systems with Applications” e valeu a Nelson Areal o Prémio de Investigação da Escola de Economia e Gestão da UMinho pela melhor publicação de um cientista daquela Escola em 2017. A pesquisa decorreu durante quatro anos e teve a coautoria de Paulo Cortez, professor da Escola de Engenharia da UMinho, e de Nuno Oliveira, que foi orientado por ambos na sua tese doutoral no Centro Algoritmi e é, agora, data scientist no CEiiA.
A equipa usou para o efeito o software estatístico R, de código aberto. No artigo, explica a forma de execução de tarefas como a recolha de tweets, as ações de pré-processamento, o uso de léxicos de opinião e a aplicação e avaliação de métodos de aprendizagem automática, usando um léxico criado pelos autores. A equipa minhota aplicou esse léxico para texto de microblogues, neste caso o Twitter, relativos a mercados de capitais. “É o meio ideal para apurar a métrica de sentimento em posts de 140 carateres ou pouco mais, que é uma linguagem muito diferente de outros documentos”, justifica Nelson Areal. Mais: a ferramenta criada permite prever a evolução dos “índices do sentimento” apresentados semanal ou mensalmente pela própria Associação Americana de Investidores Individuais, pela Investors Intelligence e pela empresa Sentix.