ニューラルネットワークは、Doomからヒーローを再描画します

ニューラルネットワークは、Doomからヒーローを再描画します

Redditポータルに写真が投稿され、すぐに昔ながらのゲーマーの間で論争が巻き起こりました。熱狂的なファンは、人工知能を使用して、1993年の元のラフなピクセル化された画像(同名のゲームの主人公であるDoom Guyの顔)をフォトリアリスティックな高解像度画像に再描画しました。多くの人は、結果として生じる顔が優しすぎて、30年前に想像していたほど残忍ではないと感じました。

90年代のアーティストが、聴衆の想像力を押し上げ、少数のピクセルを使用して独自の画像を形成するという課題に直面した場合、現代のAIは、正反対の課題、つまり詳細の描画を引き受けました。そして、それはプロジェクトの作者が考えていたよりもはるかに難しいことが判明しました。彼らはいくつかのニューラルネットワークを介して初期平均画像を実行する必要がありましたが、それでも結果は完璧にはほど遠いものでした。

最初のフェーズでは、ピクセル画像はFaceApp、Waifu2x、GIMPなどのAIアプリケーションによる処理を委託されました。写真は細部で飽和していましたが、ピクセルモザイクのままだったため、StyleGANニューラルネットワークが機能し始めました。 NvidiaのAIは、何度も繰り返した後、写真を写実的な画像に再描画することができましたが、元の比率は最初は人間の顔には正しくなかったことが判明しました。エディターでDoomGuyの顔を手動で編集する必要がありました。

しかし、ベンチャーの作者たちは動揺せず、代わりに、明確なアルゴリズムを作成するために、ピクセル画像をフォトリアリスティックな画像に再描画する手順を数回実行しました。そして今、AIは、多くのステップを伴いますが、迅速かつ効率的に作業を開始しました。たとえば、圧縮された唇の代わりに別々のピクセルの列でドゥームガイを描くことは価値があり、ニューラルネットワークは素直に主人公に広い「ハリウッド」の笑顔を提供しました。ゲーマーと喧嘩したのは彼女でした。厳しい宇宙船は、オリジナルのように、これではなく、苦笑しなければなりません。