- Daniel Voshart, egy torontói dizájner gépi tanulással és a Photoshop segítségével alakította át a római császárok mellszobrait fotorealisztikus képekké.
- Voshart úgy akarta bemutatni a császárokat, ahogyan uralkodásuk végén kinézhettek, nem számítva az esetleges betegségeket, amelyek megváltoztathatták a külsejüket.
- A művészek köztudottan eltúlozzák az uralkodó osztály jó megjelenését, így feltehetően ezek a képek igazságosabbak.
A művészek történelmileg eltúlozták, hogy az uralkodók mennyire voltak vonzóak portréikon és szobraikon. Caroline angol királynő mondta a legjobban 1795-ben, amikor leírta a pillanatot, amikor először pillantotta meg vőlegényét, IV. György királyt: “Nagyon kövérnek találom, és semmiképpen sem olyan szépnek, mint a portréja.”
Most egy torontói tervező korrigál néhányat ezekből a kreatív szabadságjogokból. A gépi tanulást, a Photoshopot és a történelmi feljegyzéseket egyesítve Daniel Voshart 54 római császár mellszobrát alakította át a principátus időszakából (Kr. e. 27-től Kr. u. 285-ig) fotórealisztikus képekké.
⏳ Ön szereti az ókori történelmet. Ahogy mi is. Kockázzunk rajta együtt.
Eredetileg Voshart egyfajta karanténprojektként vállalkozott a munkára. “Azt hiszem, a járvány természete volt az, ami miatt minden másra is gondoltam, és talán a császárok életének morbid részletei is vonzottak” – mondja a Popular Mechanicsnak. “Egy 2000 évvel a jövőben játszódó sci-fi sorozaton dolgoztam, így talán vonzott, hogy a múlton gondolkodjak.”
De Voshart nem tudta előre, hogy az első kiadású nyomataira – amelyeken olyan császárok szerepelnek, mint Augustus, Nero és Decius – érkeznek majd megrendelések az Etsy-oldalán. “Nem tudtam, hogy akkora lesz a visszhang, hogy valójában csökkenteni fogom a munkaidőmet, csak hogy kielégítsem a keresletet” – mondja.
A folyamat nem egyszerűen arról szólt, hogy a mellszobrokról készült fotókat beillesztve valamiféle tökéletes emberi arcot kell kiköpni, mondja Voshart. Az egyes császárok arcának durva vázlatainak létrehozásához Voshart nagymértékben támaszkodott az Artbreeder nevű gépi tanulási eszközre. A nyílt forráskódú szoftver generatív adverzális hálózatokat, azaz GAN-okat használ a kép létrehozásához.
Ha ezek ismerősen hangzanak, az valószínűleg azért van, mert hallottál már a deepfake-ekről, vagyis a gyakran aljas célokra használt szintetikus médiumokról. A GAN-ok, a deepfakes mögöttes technológiája segíthet az algoritmusoknak abban, hogy az adatok osztályozásának egyszerű feladatán túllépve az adatok – ebben az esetben a képek – létrehozásának birodalmába lépjenek. Ez akkor történik, amikor két GAN megpróbálja elhitetni egymással, hogy egy kép valódi. Egy kipróbált GAN mindössze egyetlen kép felhasználásával képes létrehozni egy videoklipet, mondjuk Richard Nixonról.
Római császárok árucikke
Voshart római császárai ugyan nem deepfakes, de hasonló a technológiai keretük – csak a gépi tanulás különböző alkalmazásai. Konkrétan az Artbreeder az NVidea StyleGAN-t használja, egy nyílt forráskódú GAN-t, amelyet az informatikusok még 2018 decemberében hoztak létre.
A szeptember 30-i “GANs for Good” című virtuális előadásban Anima Anandkumar, az NVIDIA gépi tanulási kutatási igazgatója elmagyarázza, hogyan működik a technológia. A GAN a szétválasztásos tanulásnak nevezett technikát alkalmazva jobban el tudja különíteni és ellenőrizni bizonyos stíluselemeket izoláltan, amit a Vosharthoz hasonló művészek természetesen sokkal jobban tudnak, mint a gépek.
“Az emberek nagyszerűek ebben” – magyarázta Anandkumar az előadáson. “Vannak különböző fogalmaink, amelyeket csecsemőkorunkban tanultunk meg, és ezt nem felügyelt módon tettük, és így most már képesek vagyunk komponálni, és teljesen új képeket vagy fogalmakat alkotni.” A gyakorlatban ez azt jelenti, hogy a felhasználónak nagyobb befolyása van arra, hogy a forráskép mely tulajdonságait szeretné felhasználni az új képben.
Tap ide a szavazáshoz
Joel Simon, az Artbreedert létrehozó fejlesztő a Popular Mechanicsnak elmondta, hogy minden azon múlik, hogy a program neurális hálózatai hogyan reprezentálják a “teret” a képeken.
“Amikor egy képet “feltöltünk”, az arcot levágjuk, majd egy keresési folyamatot végzünk, hogy megtaláljuk a képhez legközelebbi helyet a térben” – magyarázza. “Ha már ebben a “térben” van, könnyen “mozgatható” az olyan értékeknek megfelelő számok hozzáadásával vagy kivonásával, mint a kor vagy a nem, itt “géneknek” nevezett értékek. Tehát a szín hozzáadásával ezt nagyon intelligens módon teszi, nem csak a pixelek szerkesztésével, hanem az összes arc terében való mozgással.”
Ez egyszerűbbé teszi egy olyan művész számára, mint Voshart, hogy gyakorló adatokat töltsön fel – ebben az esetben körülbelül 800 római császár mellszobrának mintáját -, hogy hiperrealisztikus arcot kapjon, kevesebb artefaktummal, vagy a szoftver által bevezetett rendellenességgel.
Voshartnak még így is jelentős mennyiségű munka állt a rendelkezésére, még az Artbreeder szoftver használata után is. A tesztelési fázisában, mielőtt elkészítette volna a végső nyomatokon látható római császári arcokat, az eredmények rendellenességektől hemzsegtek.
“Az eredmény rengeteg furcsa leletet mutat, és hajlamos visszamorfózni a vonásokat valamiféle átlagos arccá, ami éppen az ellenkezője annak, amit az ember akar, amikor egy érdekes arckifejezést akar fenntartani” – mondja Voshart. “Az én eljárásom inkább az volt, hogy letöltöttem az Artbreederből, módosítottam a Photoshopban, majd megismételtem a folyamatot, és visszatöltöttem az Artbreederbe.”
Még ha fejfájást okozhat is a hibák eltávolítása a generált képekből, Voshart szerint “nincs semmi esélye”, hogy a gépi tanulás ereje nélkül is el tudta volna végezni a munkát.