Multimodal
Capacité d'un modèle IA à traiter et générer plusieurs types de contenus : texte, image, audio et vidéo, dans une même conversation.
Un modèle multimodal ne se limite pas au texte : il comprend et produit des images, de l'audio, et parfois de la vidéo.
Exemples d'usage
- Analyser une capture d'écran pour diagnostiquer un problème technique
- Décrire le contenu d'une image pour le SEO (attribut alt)
- Transcrire et résumer un enregistrement audio
- Générer des visuels à partir d'une description textuelle
Pourquoi c'est important pour le marketing
Le multimodal permet d'automatiser des workflows qui mêlent plusieurs formats : créer un post LinkedIn avec texte + visuel, analyser un tableau en image, ou auditer visuellement un site web.