Nos últimos anos, a expressão “dados são o novo petróleo” ganhou destaque, refletindo a importância crescente da informação na economia digital. No entanto, especialistas alertam que a escassez de dados de qualidade pode representar um desafio significativo para o desenvolvimento da inteligência artificial (IA) generativa. Daan Baldewijns, VP da Defined.ai, sublinha que, apesar da abundância de dados disponíveis, muitos não estão estruturados ou não podem ser utilizados legalmente para treinar algoritmos.
A realidade é que, enquanto a quantidade de dados gerados diariamente nunca foi tão alta, a qualidade e a acessibilidade desses dados estão a ser postas à prova. As empresas estão a valorizar cada vez mais as suas fontes de dados, mas a necessidade de dados específicos e bem catalogados está a aumentar. Baldewijns explica que, à medida que a tecnologia avança, a escassez de dados de qualidade pode tornar-se um obstáculo ao progresso.
Em resposta a esta situação, a Comissão Europeia apresentou a Data Union Strategy, que visa facilitar o acesso a dados fiáveis para aplicações de IA. Esta estratégia inclui a criação de “laboratórios de dados” que permitirão a empresas, incluindo pequenas e médias, aceder a conjuntos de dados diversificados e receber apoio técnico. Além disso, a iniciativa prevê o desenvolvimento de dados sintéticos, uma solução para áreas onde a informação real é escassa.
Contudo, a utilização de dados gerados por IA levanta questões sobre a sua fiabilidade. Um estudo da Graphite revela que, em novembro de 2024, o número de artigos criados por IA superou o de textos escritos por humanos. Embora essa prática possa ajudar a mitigar a escassez de dados, também pode introduzir enviesamentos e erros, comprometendo a qualidade dos modelos de IA.
A escassez de dados pode ser um desafio para muitas empresas que dependem de modelos de IA, mas também pode representar uma vantagem competitiva para aquelas que possuem dados proprietários. Ivo Bernardo, cofundador da Daredata, destaca o exemplo da Procter & Gamble, que detém uma vasta quantidade de dados sobre o consumidor que não são públicos. Para estas empresas, a escassez de dados pode ser uma oportunidade para desenvolver modelos de IA mais especializados.
À medida que o “poço dos dados” se torna mais limitado, a solução pode estar na adaptação de modelos menores e mais focados. No entanto, a necessidade de dados continuará a crescer, com empresas a procurar constantemente novas fontes de informação, desde gravações de chamadas a episódios de podcasts.
A escassez de dados é, portanto, um tema central na evolução da inteligência artificial. As empresas devem estar atentas a esta realidade e explorar novas formas de garantir o acesso a dados de qualidade. Leia também: O impacto da IA na economia global.
Leia também: Acordo entre PS e PSD garante liderança da ANAFRE
Fonte: ECO





