Os LLMs são, essencialmente, redes neurais. Redes neurais são usadas para aproximar funções e são treinadas com dados. Treiná-las significa ajustar os pesos de cada nodo (neurônio) para que as respostas saiam certas.
Entretanto, raramente os dados de entrada são exaustivos, então as respostas são sempre extrapolações sobre os dados de treinamento.
Um único neurônio com duas entradas e uma saída vai poder prever se o resultado de uma função está deste lado de uma reta ou daquele lado. Se a função for mais complexa que isso, mais neurônios serão necessários: as LLMs atuais têm bilhões deles, então conseguem fazer previsões boas. O que eles fazem é prever, não pensar.
O próprio termo Inteligência Artificial já é um engodo; o termo Alucinação é usado para reforçar a ilusão.
Pay no attention to that man behind the curtain!
As LLMs não alucinam; elas não perdem contato com a realidade. Elas simplesmente fazem aquilo que o algoritmo dita: cospem textos com base nos textos anteriores.
Um nome menos glamoroso para tudo isso seria Previsão Estocástica de Texto. Mas isso não animaria muito o setor de marketing.

Nenhum comentário:
Postar um comentário