La rete neurale di Cogvideo è stata creata in Cina, che genera brevi video di descrizione video

La rete neurale di Cogvideo è stata creata in Cina, che genera brevi video di descrizione video

Finora, la durata non è più di 4 secondi

Gli sviluppatori cinesi hanno creato una rete neurale chiamata Cogvideo, che può generare brevi video secondo una descrizione del testo. Cogvideo sa come creare un video con una frequenza fotogramma relativamente elevata: 32 fotogrammi sono 32 per 4 secondi.

Al momento, la rete neurale può già creare un video su richiesta di "Leo, acqua potabile", "una donna che cavalca un cavallo in mare", "un uomo mangia pizza" e così via. Per quanto riguarda il principio del lavoro, è simile a ciò che è coinvolto nel Dall-E 2 e immagina reti neurali, che creano immagini secondo una descrizione testuale.

Si sostiene che in termini di qualità del lavoro, anche la versione preliminare di Cogvideo supera tutti i modelli accessibili al pubblico di reti neurali. Finora, gli autori non hanno precedentemente precedenti ai codici di origine del programma o dei modelli per insegnare le proprie reti neurali.

E in precedenza, gli scienziati hanno affermato che la rete neurale ha creato la propria lingua nel processo, mentre gli esperti non possono decifrarla.