Imagen - sztuczna inteligencja, która zabije fotografię stockową

Autor: Maciej Luśtyk

26 Maj 2022
Artykuł na: 6-9 minut

Google stworzyło układ AI, który jest w stanie kreować fotorealistyczne obrazy na podstawie opisu. Czy nadchodzi koniec fotografii stockowej i produktowej?

Układy AI operujące obrazami z roku na rok stają się coraz doskonalsze i bardziej zaskakujące. To, co jeszcze kilka lat temu wydawało się fikcją rodem z filmów science fiction dziś trafia już do programów graficznych. Wygląda jednak na to, że jesteśmy w przeddzień rewolucji, która może wstrząsnąć rynkiem fotografii użytkowej. Opracowywane są bowiem systemy, potrafiące tworzyć gotowe obrazy wyłącznie na podstawie opisów.

Zdjęcia ze słów - to można zrobić już dziś

Raptem w kwietniu informowaliśmy was o dokonaniu naukowców z firmy Open AI. Stworzony przez nich układ DALL-E 2 jest w stanie przygotowywać spójne, stosunkowo realistyczne obrazy na podstawie danych wpisywanych w formie zwykłych zdań i przygotowywać rezultaty w dowolnie określonym przez użytkownika stylu.

Przeczytaj także:
Dotarliśmy do końca fotografii. Nowy system AI tworzy zdjęcia i grafiki na podstawie opisówJeśli zastanawiacie się, jak rynek fotografii i grafiki będzie wyglądał za kilka lat, nowe dokonania programistów z Open AI mogą być tego ciekawą zapowiedzią. [Czytaj więcej]

Nowe dokonanie programistów z Google idzie jednak o krok dalej. Stworzony przez Amerykanów układ Imagen oprócz możliwości tworzenia grafik na podstawie prostych opisów, za cel obiera sobie także tworzenie obrazów, jak najbardziej przypominających zwykłe zdjęcia. A gotowe rezultaty oferuje w dużej, a przynajmniej zupełnie użytecznej rozdzielczości. Poniżej kilka przykładów wraz z opisami, które posłużyły do ich stworzenia.

 

"Logo Google Brain nad panoramą Toronto"

"Zdjęcie szopa w hełmie kosmonauty"

Powyższe przykłady to tylko kilka z przykładowych obrazów, które twórcy udostępniają na swojej stronie. Wchodząc na nią znajdziemy także prosty kreator, pozwalający zobaczyć jak zmieniają się rezultaty przy zmianach poszczególnych składowych opisu kreowanego „zdjęcia”.

Systemy tego typu są jeszcze niedoskonałe. Ale już niedługo

Oglądając gotowe grafiki w powiększeniu, jesteśmy oczywiście w stanie zauważyć pewne niedoskonałości i nienaturalne elementy, ale tak czy inaczej jest to jak do tej pory najdoskonalszy system tego typu, jaki widzieliśmy na oczy. Biorąc pod uwagę szybki rozwój technologii, pozostaje pytanie jak szybko znajdzie ona realne zastosowanie.

"Zdjęcie kota w okularach i koszulce, jeżdżącego na deskorolce w ogrodzie"

"Zdjęcie pluszowego misia pływającego motylkiem"

Już teraz śmiało można stwierdzić, że większość ze wspomnianych niedoskonałości prawdopodobnie nie zostałaby wychwycona przez oglądających podczas scrollowania Instagrama. W ciągu kilku lat układy tego typy dojrzeją zapewne na tyle, że będą w stanie oszukać widza także podczas oglądania zdjęć w większym rozmiarze. Jakie będą tego konsekwencje? 

Jednym z najbardziej prawdopodobnych skutków wdrożenia tego typu technologii na szeroką skalę będzie załamanie się rynku banków zdjęć i fotografii stockowej. Bo o ile większość fotografii komercyjnej wymaga (jeszcze) fizycznego pojawienia się fotografa w danym miejscu czy sfotografowania produktów, to w przypadku zdjęć użytkowych i ilustracyjnych zwyczajnie łatwiej będzie użytkownikowi wygenerować dany obraz na podstawie opisu, niż tracić czas na poszukiwanie go w serwisach stockowych. Na dodatek uzyska on w tej sposób obraz unikalny, który nie był używany wcześniej.

Czas przygotować się na diametralną zmianę w postrzeganiu fotografii

Naturalnie pojawiają się też pytania o etykę. Dziś, w erze deepfake’ów i fake newsów tego typu rozwiązania budzą uzasadnione obawy o wykorzystanie ich do niecnych celów. I właśnie dlatego twórcy jak na razie nie udostępniają swojej technologii szerszemu gronu, chcąc ją dopracować i ograniczyć możliwości tworzenia za jej pomocą krzywdzących obrazów. Jak sami piszą, ze względu na szkolenie sieci neuronowych na otwartych bazach zdjęć muszą na przykład uporać się z problemem uprzedzeń społecznych i kulturowych, które system przejawia nawet gdy w zadanych mu żądaniach nie pojawiają się ludzie.

"Modrosójka błękitna stojąca na koszu wypełnionym makaronikami w kolorze tęczy"

"Mózg ujeżdżający rakietę"

"Zdjęcie chromowanej kaczki ze złotym dziobek, która kłóci się ze wściekłym żółwiem"

"Zdjęcie podtopionej galerii sztuki, wystawiającej dzieła Moneta robotom"

Na gotowy, powszechnie dostępny system tego typu poczekamy zapewne jeszcze kilka lat, a jego ostateczna forma może być w pewien sposób ograniczona pod względem możliwości. Tak czy inaczej powinniśmy zacząć zdawać sobie sprawę, że w bardzo niedalekiej przyszłości technologia tego typu diametralnie zmieni nasz sposób postrzegania i używania fotografii, a wraz z kolejnymi usprawnieniami przewartościuje także zapewne segment fotografii reklamowej.

W końcu rozbudowanie danego systemu o możliwość dodania obrazu czy produktu, wokół którego AI budować ma narrację wizualną wydaje się jak najbardziej w zasięgu obecnych już możliwości programistów. Ba, prawdopodobnie problemem nie będzie nawet sprawienie, by rezultaty odpowiadały stylowi danego fotografa.

Czy jesteście na to gotowi?

Więcej informacji na temat układu Imagen znajdziecie na stronie imagen.research.google.

Skopiuj link

Autor: Maciej Luśtyk

Redaktor prowadzący serwisu Fotopolis.pl. Zafascynowany nowymi technologiami, choć woli fotografować analogiem.

Słowa kluczowe:
Komentarze
Więcej w kategorii: Branża
Canva przejmuje Affinity. Adobe będzie miało problem
Canva przejmuje Affinity. Adobe będzie miało problem
Znana wszystkim dobrze platforma do szybkiego projektowania graficznego przejmuje Affinity - producenta przystępnych cenowo alternatyw dla produktów z oferty Adobe. Czy to zapowiedź...
8
247 Mp - nowa średnioformatowa matryca Sony podnosi poprzeczkę w zakresie rozdzielczości
247 Mp - nowa średnioformatowa matryca Sony podnosi poprzeczkę w zakresie rozdzielczości
Myśleliście, że 150 megapikseli to przesada? Sony prezentuje nową matrycę średnioformatowa o niebotycznej rozdzielczości 247 Mp, która w niedalekiej przyszłości ma szansę trafić do...
9
Szukamy talentów - dołącz do zespołu Fotopolis!
Szukamy talentów - dołącz do zespołu Fotopolis!
Jeśli interesuje Cię film i fotografia, lubisz pisać, rozmawiać lub tworzyć treści wideo o nowinkach sprzętowych – napisz do nas! Szukamy nowych autorów i stałych współpracowników.
18
Powiązane artykuły
Wczytaj więcej (4)