Így teszi szinte észrevétlenül jobbá a fotóinkat a mesterséges intelligencia

Share

Ma már szinte mindenki hord a zsebében egy olyan kamerát, amellyel néhány évvel ezelőtt még csak a profi stúdiók versenyezhettek volna. Azonban a fejlődés kulcsa már nem feltétlenül a fizikai lencsék méretében, hanem a háttérben futó szoftveres megoldásokban rejlik. A mesterséges intelligencia beköltözött a telefonunkba, és minden egyes exponálásnál döntések ezreit hozza meg helyettünk, hogy a végeredmény tökéletes legyen.

Az intelligens képfeldolgozás alapjai

Amikor megnyomjuk az exponáló gombot, a telefonunk valójában nem egyetlen képet készít, hanem egy egész sorozatot. Az algoritmusok ezeket a képkockákat villámgyorsan elemzik, és kiválasztják mindegyikből a legélesebb és legjobban megvilágított részleteket. Ezt a folyamatot nevezzük számítógépes fotográfiának, amely ma már alapköve a modern mobiloknak. A végeredmény egy olyan fotó lesz, amelyen a sötét és a világos részek is részletgazdagok maradnak.

A gép tanulási folyamatokon keresztül felismeri, hogy éppen egy tájképet, egy tál ételt vagy egy kisgyereket próbálunk megörökíteni. Ennek megfelelően állítja be a színeket, a kontrasztot és az élességet, hogy a látvány a lehető legvonzóbb legyen. Régebben ehhez komoly utómunka és szakértelem kellett a számítógép előtt ülve. Ma már mindez a másodperc törtrésze alatt megtörténik, mielőtt még a kép megjelenne a galériánkban. A technológia fejlődésével a felhasználóknak egyre kevesebbet kell érteniük a záridőhöz vagy a fényérzékenységhez.

Nem csupán a színekről van szó, hanem a zajszűrésről is, ami különösen fontos a kisebb szenzorok esetében. Az algoritmus képes megkülönböztetni a kép valódi részleteit a digitális zajtól, ami a kevés fény mellett készített képeknél jelentkezik. Így a sötétebb területek is tiszták maradnak, anélkül, hogy elveszítenék a természetes textúrájukat.

A portré mód és a mélységérzékelés fejlődése

Az egyik leglátványosabb vívmány, amit a mesterséges intelligenciának köszönhetünk, az a szoftveres elmosás. Korábban ehhez nagy fényerejű, drága objektívekre volt szükség, amelyek fizikailag hozták létre az életlen hátteret. A mai telefonok viszont matematikai modellek segítségével számolják ki, mi van közelebb és mi távolabb a kamerától. Ezzel a módszerrel szinte bármilyen környezetben profi megjelenésű portrékat készíthetünk, ahol a főszereplő élesen elválik a környezetétől.

A technológia ma már ott tart, hogy még az olyan apró részleteket is képes felismerni, mint a kósza hajszálak vagy a szemüveg vékony széle. Ezek a finom határvonalak határozzák meg, hogy mennyire tűnik természetesnek az elmosás a néző számára. Ha az algoritmus hibázik, a kép azonnal mesterkéltnek hat, ezért a gyártók folyamatosan finomítják a neurális hálózatokat. Az eredmény pedig évről évre meggyőzőbb, ahogy a processzorok egyre több adatot képesek feldolgozni. A mobilunk gyakorlatilag megtanulta, hogyan lát az emberi szem.

Retusálás és tartalomfüggő kitöltés a zsebünkben

Nem csak a fotó elkészítésekor, hanem az utólagos módosítások során is hatalmas segítséget kapunk a szoftverektől. Ha egy idegen besétált a tökéletes tengerparti képünkbe, ma már egyetlen érintéssel eltüntethetjük onnan. Az intelligens rendszer elemzi a környező pixeleket, és hihető módon pótolja a hiányzó részt a háttérrel. Ez a funkció néhány éve még elképzelhetetlen lett volna egy egyszerű hordozható eszközön.

Az intelligens szerkesztők képesek megváltoztatni az égbolt színét vagy akár a fények irányát is az arcunkon. Ha borús időben fotóztunk, egy kattintással napsütéses hangulatot varázsolhatunk a képre az árnyékok átdolgozásával. Ez persze felvet bizonyos kérdéseket a valóság ábrázolásával kapcsolatban a közösségi médiában. Mégis, a legtöbb felhasználó számára ez egy kényelmes eszköz a szép emlékek esztétikus megőrzésére.

A régi, szemcsés családi fotók feljavítása is új értelmet nyert az algoritmusok korában. A mesterséges intelligencia képes kipótolni a hiányzó információkat és élesebbé tenni az elmosódott arcokat a régi papírképeken. Így a múltbéli emlékeinket is modern minőségben láthatjuk viszont a képernyőn.

A videózás terén is hasonló forradalom zajlik, ahol a remegő kézmozdulatokat simítja ki a szoftver valós időben. A digitális stabilizáció ma már olyan hatékony, mintha egy profi sínen mozogna a kamera a kezünkben. Ez a folyamatos korrekció teszi lehetővé, hogy séta vagy akár futás közben is élvezhető felvételeket készítsünk.

Hol húzódik a határ a valóság és a digitális javítás között?

Ahogy a technológia egyre okosabb lesz, felmerül a kérdés, hogy mennyire tekinthető még valódinak a telefonunkkal lőtt fotó. Ha az algoritmus minden pixelt átszámol és optimalizál, vajon a pillanatot rögzítjük, vagy egy idealizált verziót látunk? Ez a dilemma egyre gyakrabban foglalkoztatja a fotós közösséget és a technológiai szakírókat egyaránt.

Fontos azonban látni, hogy a fotográfia története során mindig is jelen volt valamilyen szintű manipuláció. A sötétkamrákban végzett vegyszeres előhívás során is sok döntés született a végső kép tónusairól és hangulatáról. A mesterséges intelligencia csupán egy újabb eszköz a kezünkben, amely segít kifejezni az alkotói látásmódunkat. Nem a gép készíti a képet, hanem az ember, a szoftver pedig csak a technikai akadályokat hárítja el az utunkból. Végső soron a gép segít abban, hogy a fotó olyannak tűnjön, amilyennek mi a szemünkkel láttuk.

A jövőben valószínűleg még szorosabb lesz az együttműködés az emberi szem és a digitális agy között a készülékeinkben. A kamerák talán már azelőtt tudni fogják a preferenciáinkat, mielőtt teljesen lenyomnánk az exponáló gombot. Ez a fejlődés demokratizálja az alkotás örömét, hiszen a technikai korlátok fokozatosan eltűnnek.

Az okostelefonunk tehát már nem csak egy lencse és egy érzékelő kombinációja, hanem egy digitális művész, amely a háttérben dolgozik értünk. Bár a technológia folyamatosan változik, a lényeg ugyanaz marad: megörökíteni egy fontos pillanatot, amit később szívesen nézünk vissza a családunkkal.

Dániel

Senki sem annyira objektív, hogy feltevés és bizonyított tény között mindenkor különbséget tudjon tenni. Van, hogy valamiről azt hisszük, bizton tudjuk, de elszámítjuk magunkat, és visszatalálni sokszor minden, csak éppen nem egyszerű. (Ferdinand von Schirach)

Ez is érdekelhet...