Le réseau neuronal de Cogvideo a été créé en Chine, qui génère de courtes vidéos de description vidéo

Le réseau neuronal de Cogvideo a été créé en Chine, qui génère de courtes vidéos de description vidéo

Jusqu'à présent, la durée ne dépasse pas 4 secondes

Les développeurs chinois ont créé un réseau de neurones appelé Cogvideo, qui peut générer de courtes vidéos en fonction d'une description de texte. Cogvideo sait comment créer une vidéo avec une fréquence d'images relativement élevée - 32 images sont 32 pendant 4 secondes.

À l'heure actuelle, le réseau neuronal peut déjà créer une vidéo à la demande de «Leo, eau potable», «une femme chevauchant un cheval en mer», «Un homme mange de la pizza» et ainsi de suite. Quant au principe du travail, il est similaire à ce qui est impliqué dans le Dall-E 2 et imaginez les réseaux de neurones, qui créent des images selon une description textuelle.

On fait valoir qu'en termes de qualité de travail, même la version préliminaire de Cogvideo dépasse tous les modèles accessibles au public des réseaux de neurones. Jusqu'à présent, les auteurs n'ont pas déjà été précédemment des codes source du programme ou des modèles pour enseigner leurs propres réseaux de neurones.

Et plus tôt, les scientifiques ont déclaré que le réseau neuronal avait créé sa propre langue dans le processus, tandis que les experts ne peuvent pas le déchiffrer.