Transcrição para o português:
O Llama 3.2 tem reconhecimento de imagem. O que isso significa é que, em vez de ser apenas texto, ele é multimodal.
Isso significa que você pode alimentar uma imagem no Lama 3.2 e obter uma saída.
Você pode manipulá-la, alterá-la, alterá-la. Este é um grande passo à frente. Agora, isso estará disponível no Leo AI? Não sei.
Temos que esperar para ver se há problemas de compatibilidade ou incompatibilidade. Mas o ponto é que, quanto mais poderoso o Meta torna o Lama, melhor para o Leo AI.