Până la cloud și înapoi. O (A)introducere

26 ianuarie, 2026

Cinemaul a fost amenințat cu dispariția încă de la începuturile sale, iar moartea cinemaului e în continuare o obsesie a cineaștilor și-a cinefililor deopotrivă. De data asta, știm deja, viața cinemaului e perturbată de apariția inteligenței artificiale – tehnologia care face din text scris, imagine în mișcare; din voci și mișcări de aparat arhivate în baze de date, altfel de voci și alte mișcări de aparat și tot așa. În atmosfera internetului au fost pulverizate o mulțime de videouri cu animații AI, pe care nimeni nu le-a creat în sensul tradițional, și totuși ele persistă, amenințând viitorul cinemaul, așa cum amenință, în ochii unora, și viitorul multor alte meserii, artistice sau nu. Ecranele noastre sunt inundate de postări care dezbat ce se întâmplă cu această tehnologie, iar acestea poartă chiar ele însele amprentele scriiturii automatizate: semne de punctuație precum em dash(—) și topică a frazelor precum „Nu e vorba despre x, ci despre y.”. Dar eu cred că cinemaul o să supraviețuiască și de data asta, absorbind, poate, un alt instrument cu care să opereze mai departe. Și totuși, trebuie că ceva se schimbă în urma apariției și rafinării acestei tehnologii care pare că e gata să scoată oricând orice din spațiul latent (un plan conceptual comprimat în care modelele AI organizează informațiile pentru a identifica tipare și conexiuni).

 

Încotro?

În legătură cu receptarea videourilor în format scurt, generate sau nu: într-un text despre schimbările tehnologice pe care le aduce radioul, Walter Benjamin amintea ce-i zisese șeful lui înainte de prima sa emisie la radio, anume că publicul de radio nu există ca un tot. Nu există o sală plină de oameni, iar un public de 1000 de persoane înseamnă că îl ascultă o mie de oameni, dar separat, fiecare la el acasă. Se poate face o analogie cu felul în care receptăm conținutul de pe social media. Aici, publicul este tot fragmentat, dar spre deosebire de radio, la fel este și conținutul. Iar dacă de câțiva ani de zile vorbim despre cum algoritmul știe întocmai ce vrea să vadă fiecare dintre noi și despre camerele de ecou, cum ar fi ca fiecare să primească în feed ceva special generat pentru el? Și dacă da, cum ne-ar influența asta la nivel colectiv? Cât de tare ne va separa această potențială fragmentare-în-fragmente-și-mai-mici a publicului? Cum ar arăta publicul care-i antrenat să privească doar imagini create special pentru ochii proprii într-o sală de cinema? O asemenea lume a camerelor de ecou ar duce la erodarea realității comune, înlocuită de un prezent hiper-personalizat, în care fiecare individ trăiește într-un flux de conținut croit doar pentru el.

Desigur, n-am ajuns încă în situația asta, dar cât mai e până acolo? O speculație destul de dulceagă se întreabă dacă nu cumva inteligența artificială visează, căci încă nu s-a trezit. De aici vine și calitatea ca de vis a imaginilor generate, fluiditatea cu care se schimbă cadrele sau greșelile anatomice regăsite în aceste imagini. Se presupune că momentul imperios al trezirii va coincide cu revoluții tehnice nemaivăzute în generarea conținutului și atunci poate că ne vom separa complet între noi, fiecare în perimetrul său virtual. Numai că cu cât căutăm să ghicim viitorul prin astfel de speculații, cu atât mai mult ne faultăm prezentul – concomitent cu dezvoltarea exponențială a inteligenței artificiale, lumea traversează o perioadă critică. Vorbim despre criza ecologică, criza economică a realităților post-pandemice, creșterea în popularitate a neo-fascismului, crize umanitare precum războiul din Ucraina și genocidul din Palestina, alături de multe alte conflicte armate. Contextul în care această tehnologie apare pe lume este unul al crizelor multiple. Cu cât încercăm să dibuim ce ne aduce viitorul, cu atât îngropăm mai mult crizele prezentului – transferând resurse limitate (energie, bani, timp, atenția publică) dintr-o parte în alta –, iar această obsesie pentru viitor maschează și incapacitatea de a gestiona realitățile actuale (în scenariile optimiste, toate problemele prezentului vor deveni ușor gestionabile odată ce tehnologia va atinge nivelul superinteligenței artificiale, AGI).

Ce ne spune inteligența artificială despre lumea în care trăim? Pe Facebook, vedem clipuri cu copii care construiesc cu mânuțele lor la care au (încă) degete deformate sculpturi ambițioase create din legume; și tot cu aceleași mânuțe ne imploră bunicii (alături de alte categorii care nu-și dau seama că ce văd nu-i real) să le ofere aprecierea. În altă zonă, pe contul oficial al președintelui SUA, avem Trump Gaza, un video generat cu ajutorul inteligenței artificiale cu un parcurs absurd. Clipul începe cu copii refugiați fugind dintre ruinele unui oraș și ajungând pe o plajă, într-un resort pe modelul Dubai construit în Gaza, țopăind fericiți sub o ploaie de bancnote aruncate în aer fără număr de Elon Musk. Trump și Netanyahu își fac și ei apariția, sorbind cocktail-uri la piscină. Pare că nici nu mai contează intenția inițială: un material satiric, care îl ia peste picior pe Trump, pentru declarațiile sale despre cum va transforma Gaza în Riviera Orientului Mijlociu. Primul „model” generat în totalitate a apărut în Vogue Italia lunile trecute. Iar, la polul opus, avem meme-urile post-post-post, cele care parodiază și deconstruiesc totul în jur ca o tornadă, și ele, generate, laolaltă cu artiști a căror practică se bazează pe lucrul cu AI, precum @voidstomper. Tehnologia-i la momentul actual suficient de performantă încât să ofere oricui ceva care să-l distreze, intrige sau satisfacă, fie el novice sau alfabetizat audiovizual; ea penetrează orice formă de media, fie ea tradițională sau din contră.

 

Cu ce cost?

Nimeni nu poate contesta că inteligența artificială e foarte, foarte hot. Atât de hot încât necesarul global de apă pentru răcirea centrelor de date în 2027 este estimat între 4,2 și 6,6 miliarde de m³ (jumătate din consumul anual al unei țări ca UK). În 2022, doar marile companii precum Google, Microsoft și Meta au consumat aproximativ 2,19 miliarde de m³ de apă pentru alimentarea și răcirea centrelor AI. La nivel global, emisiile de CO₂ generate de infrastructura necesară inteligenței artificiale depășesc 300 de milioane de tone pe an și nu-i de mirare: în articolul The Gentle Singularity de pe blogul său, Sam Altman, CEO-ul OpenAI, spune că vrea să facă ca „superinteligența să fie ieftină, accesibilă pe scară largă și descentralizată față de orice persoană, companie sau țară.” Numai că, ca să faci orice ieftin, accesibil și descentralizat, ai nevoie de resurse enorme. Multe voci acuză că inteligența artificială risipește resurse și creează lipsuri în alte părți ale lumii.

Iată cum aceste imagini sintetice sunt parte dintr-o axă care se extinde în natură. Generarea și circulația acestora înseamnă resurse consumate și poluare, contribuie la încălzirea globală, au un impact asupra alimentelor pe care le consumăm, în definitiv, contribuie la criza ecologică. Un potențial cititor s-ar putea întreba de ce are AI-ul nevoie să se răcorească în așa hal? Așa că haideți să lămurim, în linii mari, cum funcționează această tehnologie.

 

Ilustrație de Elodie Chiper

Cum funcționează?

Formele de inteligență artificială pot fi categorisite după paradigmele prin care învață, după modelul în baza căruia sunt construite și după funcția pe care o au. Cele mai populare sunt modelele generative, care creează conținut – text, cum e ChatGPT, căruia i se alătură modele de generare de imagini și videouri ca Sora sau Runway. Deși principiul în baza căruia funcționează această tehnologie este destul de asemănător de la model la model, o să mă concentrez pe modelele de generare a imaginilor și a imaginilor în mișcare.

În noul ei volum dedicat acestei tehnologii, Medium Hot: Images in the Age of Heat, Hito Steyerl observă paralelele care se leagă între AI și termodinamică: de la vocabularul comun până la modul în care ambele implică mecanisme similare și un consum considerabil de resurse. Unul dintre parametrii (manipulabili de către utilizator, ca un switch) cei mai folosiți în modelele generative este chiar temperatura. Acest parametru se referă la cât de aleator este rezultatul generat – cu cât temperatura e mai mică, cu atât cresc șansele ca rezultatul să fie corect, dar și mai plat și lipsit de nuanță; cu cât temperatura crește, cu atât sistemul face niște asocieri mai inedite, dar care vin împreună cu riscul halucinațiilor. Unora le atrage atenția acest termen, un nume cu valențe psihedelice dar care înseamnă, de fapt, glitch. În cazul unui model de limbaj, spre exemplu, halucinația va însemna că o să mintă ca să întrețină discuția cu utilizatorul (așa cum a fost programat să facă).

AI-ul generativ este construit după un model probabilistic, ceea ce înseamnă că nu-i chiar greșit să spunem că se orientează după șansă. Tehnologia asta funcționează prin a scufunda imaginea într-un lichid virtual al probabilităților. Imaginile, fie ele statice sau în mișcare, sunt scufundate într-o supă de informație în care se transformă, asemeni unei insecte în cocon, în funcție de prompt și de baza de date. În majoritatea cazurilor, ea se transformă în funcție de cea mai plauzibilă posibilitate. Înțeleasă printr-o analogie cu termodinamica, generarea de videouri se bazează pe faptul că imaginile apar ca transformări între ordine și dezordine. Procesul începe dintr-un zgomot asemănător entropiei extreme, un haos vizual lipsit de formă, care prin calcule statistice și selecții repetate capătă structură și contur. Modelul reface astfel traseul de la particule dezordonate către configurații stabile, producând cadre recognoscibile și coerente. În acest sens, temperatura reprezintă gradul de variație al rezultatelor, influențând cât de previzibil sau divers se conturează imaginea. Videoul rezultat este expresia unui echilibru între disipare și condensare; între fluxul de energie consumat de mașină și ordinea vizuală care se cristalizează în fața privitorului.

Acest proces se sprijină pe existența unor arhive vaste de date, stocate pe servere, rezervoare unde memoria se acumulează și de unde circulă. Arhivele oferă materia primă pentru formarea imaginilor, iar fiecare cadru nou se ridică din straturi de date anterioare remixate. Aceste date sunt ca un câmp energetic latent, în care ordinea trecutului se reconfigurează în prezent. Videoul generat devine o condensare automatizată a istoriei digitalizate, în care fluxul de date susține tranziția continuă dintre zgomot și structură. Acest mod de desfășurare este inițiat de utilizator, care trasează direcția principală a generării prin prompt. În esență, utilizatorul trebuie să formuleze ceea ce își dorește, iar sistemul poate relua procesul de nenumărate ori, inclusiv pe modele diferite de AI, până când rezultatul corespunde așteptărilor sale. Deși mecanismele interne sunt complexe, ele rămân invizibile și inaccesibile pentru cel care folosește tehnologia. Tocmai de aceea devine posibilă crearea unui număr uriaș de clipuri generate cu un efort minim din partea utilizatorului.

 

Slop-py

Nu-i, deci, de mirare că internetul s-a umplut de slop – mult conținut de proastă calitate generat cu ajutorul inteligenței artificiale – de la cărți puse la vânzare, la videouri și mai ales multe, multe imagini. Slop-ul înghite deja conținutul făcut de oameni. E suficientă o căutare pe Google Images ca să observăm că multe dintre rezultatele care ajung la suprafață sunt, deja, generate – imagini sintetice. Gunoiului digital în exces poluează atât fizic cât și intelectual, mai ales atunci când vorbim despre climatele politice. Și pentru că eșuăm să găsim o cale de aerisire ajungem la o stare de epuizate totală, la blazare. Estetica glossy a imaginii sintetice, la care s-a ajuns prin infinite remixuri ale trendurilor și ale imaginilor la calitate înaltă, devine impermeabilă și, paradoxal, îngreunează procesul de-a crea ceva nou. Slop-ul a deformat ideea de unicitate, pentru că inundă spațiul virtual cu o abundență de imagini generate și multiplicate instantaneu, o variație mai slabă a originalului. Atât spectatorii, cât și cineaștii ar putea să ajungă într-un cerc vicios în care căutarea noului devine paradoxal imposibilă în fața unei abundențe de „unicitate” generată automat.

 

Îmi amintesc că atunci când am văzut pentru prima dată videouri generate, uimirea mea avea de-a face cu faptul că ce se afla sub ochii mei era fără precedent. Imaginile sintetice se simțeau ca o realizare a unei ambiții sau dorințe care preceda existența lor așa cum ambiția zborului preceda existența avioanelor. Personajele își schimbă poziția, încadratura de cameră se transformă dintr-un prim plan într-un plan general fără nicio tăietură de montaj. Ceea ce pentru mine era, din punct de vedere cinematografic, inovația numărul unu adusă de această tehnologie s-a dovedit a fi doar o limitare tehnologică temporară: morphing-ul, în videoclipurile generate cu AI, este glitch-ul vizual prin care imaginile se transformă fluid și instabil unele în altele, ca și cum ar curge fără limite între forme și cadre. Legătură cu cinemaul, morphing-ul este o greșeală care lasă materialului o amprentă specifică sieși: acest accident n-ar putea fi reprodus într-o animație tradițională, fiindcă apare aleatoriu și poartă în sine un fel de dimensiune documentară. Așa cum o cameră care surprinde realitatea străzii poate înregistra accidental detalii neintenționate, tot astfel inteligența artificială „documentează” propriile erori vizuale. Pentru mine, morphing-ul este un semn că atunci când mă uit la o imagine sintetică nu privesc o animație oarecare, ci o imagine sintetică care poartă amprenta propriului proces tehnologic.

Cele mai recente modele de generare de video au pierdut aproape complet acest indiciu. Spre exemplu, un video vertical cu iepurași sărind pe trambulină a devenit viral pentru că ar arăta într-atât de realist ca și cum n-ar fi fost generat. Dacă nu cu mult timp în urmă preocuparea era de a identifica ce imagine pare sau nu generată, acum distincția asta pălește în importanță. Un nou scop apare la orizont, anume să învățăm să facem față la avalanșa de imagini care vin spre noi în lipsa unui reper comun și a unei înțelegeri colective. 

Ilustrație de Elodie Chiper

Da sau ba?

Genocidul din Gaza și războiul din Ucraina au accelerat masiv dezvoltarea armelor autonome, transformând frontul într-un laborator pentru testarea războiului bazat pe inteligență artificială. Aceste situații au oferit producătorilor de armament un cadru convenabil, lipsit de reglementări stricte, în care să își perfecționeze sistemele letale automatizate. În Gaza, inteligența artificială a fost folosită pentru recomandarea de ținte umane prin sisteme precum Gospel și Lavender, care automatizează identificarea și prioritizarea persoanelor suspectate de apartenență la grupuri militante, iar în Ucraina au fost colectate milioane de ore de imagini video de pe front, formând o arhivă uriașă folosită pentru antrenarea și perfecționarea modelelor AI. Iar pe feed-urile noastre aceste tipuri de materiale sunt aduse laolaltă într-un mod absurd: clipuri din război cu oameni care mor pe bune rulează în tandem cu clipuri sintetice, ale căror protagoniști nici măcar n-au existat vreodată. 

Ce știm acum despre AI este că consumă resurse naturale pe care și-așa nu prea le avem, că tehnologia este îmbunătățită profitând de violența și lipsa reglementărilor din zonele de conflict armat, că sporește confuzia și produce destabilizare. N-ar fi imoral ca inteligența artificială să fie utilizată în scopuri cinematografice atunci când perfecționarea ei s-a realizat pe victime umane și pe consumul masiv de resurse? Dilema evocă ecouri ale unei întrebări mult mai vechi, care a alimentat de-a lungul anilor numeroase polemici: care este, de fapt, rolul cinemaului? Privirii unui inginer, contabil, curios de pe internet, criminal sau multimiliardar i s-ar putea adăuga și privirea cineastului. Dacă această tehnologie nu ne va ajuta să înțelegem mai repede viitorul imaginii, atunci măcar ne va dezvălui ceva despre actualitate prin prisma recompunerii automatizate a unor imagini lucioase și la modă. Goana după futurism nu se mulțumește cu observații despre prezent, dar poate că pe termen lung acestea vor fi cele mai utile.

Niciodată n-ar trebui să ne mutăm privirea de pe punctele nevralgice ale lumii în care trăim, nici de pe cele ale inovației. Uneori două lucruri coincid, unul rău și unul care-ar putea fi oriunde pe spectrul dintre bun și rău – încă nu știm. Timpurile marcate de confuzie și instabilitate vestesc ecourile unei lumi diferite.

Acest text a fost publicat în ediția tipărită din 2025.

Cristina Iliescu
+ posts

Regizoare de film. Lucrează la un film de lungmetraj, câteva scurtmetraje și la o lucrare de doctorat la UNATC despre punctele de întâlnire dintre TikTok-uri și film experimental.



Cristina Iliescu
+ posts

[:ro]Regizoare de film. Lucrează la un film de lungmetraj, câteva scurtmetraje și la o lucrare de doctorat la UNATC despre punctele de întâlnire dintre TikTok-uri și film experimental.[:en]Film director. She is working on a feature film, several short films, and a doctoral thesis at UNATC on the intersections between TikToks and experimental film.[:]