Imagen - sztuczna inteligencja, która zabije fotografię stockową

Autor: Maciej Luśtyk

26 Maj 2022
Artykuł na: 6-9 minut

Google stworzyło układ AI, który jest w stanie kreować fotorealistyczne obrazy na podstawie opisu. Czy nadchodzi koniec fotografii stockowej i produktowej?

Układy AI operujące obrazami z roku na rok stają się coraz doskonalsze i bardziej zaskakujące. To, co jeszcze kilka lat temu wydawało się fikcją rodem z filmów science fiction dziś trafia już do programów graficznych. Wygląda jednak na to, że jesteśmy w przeddzień rewolucji, która może wstrząsnąć rynkiem fotografii użytkowej. Opracowywane są bowiem systemy, potrafiące tworzyć gotowe obrazy wyłącznie na podstawie opisów.

Zdjęcia ze słów - to można zrobić już dziś

Raptem w kwietniu informowaliśmy was o dokonaniu naukowców z firmy Open AI. Stworzony przez nich układ DALL-E 2 jest w stanie przygotowywać spójne, stosunkowo realistyczne obrazy na podstawie danych wpisywanych w formie zwykłych zdań i przygotowywać rezultaty w dowolnie określonym przez użytkownika stylu.

Przeczytaj także:
Dotarliśmy do końca fotografii. Nowy system AI tworzy zdjęcia i grafiki na podstawie opisówJeśli zastanawiacie się, jak rynek fotografii i grafiki będzie wyglądał za kilka lat, nowe dokonania programistów z Open AI mogą być tego ciekawą zapowiedzią. [Czytaj więcej]

Nowe dokonanie programistów z Google idzie jednak o krok dalej. Stworzony przez Amerykanów układ Imagen oprócz możliwości tworzenia grafik na podstawie prostych opisów, za cel obiera sobie także tworzenie obrazów, jak najbardziej przypominających zwykłe zdjęcia. A gotowe rezultaty oferuje w dużej, a przynajmniej zupełnie użytecznej rozdzielczości. Poniżej kilka przykładów wraz z opisami, które posłużyły do ich stworzenia.

 

"Logo Google Brain nad panoramą Toronto"

"Zdjęcie szopa w hełmie kosmonauty"

Powyższe przykłady to tylko kilka z przykładowych obrazów, które twórcy udostępniają na swojej stronie. Wchodząc na nią znajdziemy także prosty kreator, pozwalający zobaczyć jak zmieniają się rezultaty przy zmianach poszczególnych składowych opisu kreowanego „zdjęcia”.

Systemy tego typu są jeszcze niedoskonałe. Ale już niedługo

Oglądając gotowe grafiki w powiększeniu, jesteśmy oczywiście w stanie zauważyć pewne niedoskonałości i nienaturalne elementy, ale tak czy inaczej jest to jak do tej pory najdoskonalszy system tego typu, jaki widzieliśmy na oczy. Biorąc pod uwagę szybki rozwój technologii, pozostaje pytanie jak szybko znajdzie ona realne zastosowanie.

"Zdjęcie kota w okularach i koszulce, jeżdżącego na deskorolce w ogrodzie"

"Zdjęcie pluszowego misia pływającego motylkiem"

Już teraz śmiało można stwierdzić, że większość ze wspomnianych niedoskonałości prawdopodobnie nie zostałaby wychwycona przez oglądających podczas scrollowania Instagrama. W ciągu kilku lat układy tego typy dojrzeją zapewne na tyle, że będą w stanie oszukać widza także podczas oglądania zdjęć w większym rozmiarze. Jakie będą tego konsekwencje? 

Jednym z najbardziej prawdopodobnych skutków wdrożenia tego typu technologii na szeroką skalę będzie załamanie się rynku banków zdjęć i fotografii stockowej. Bo o ile większość fotografii komercyjnej wymaga (jeszcze) fizycznego pojawienia się fotografa w danym miejscu czy sfotografowania produktów, to w przypadku zdjęć użytkowych i ilustracyjnych zwyczajnie łatwiej będzie użytkownikowi wygenerować dany obraz na podstawie opisu, niż tracić czas na poszukiwanie go w serwisach stockowych. Na dodatek uzyska on w tej sposób obraz unikalny, który nie był używany wcześniej.

Czas przygotować się na diametralną zmianę w postrzeganiu fotografii

Naturalnie pojawiają się też pytania o etykę. Dziś, w erze deepfake’ów i fake newsów tego typu rozwiązania budzą uzasadnione obawy o wykorzystanie ich do niecnych celów. I właśnie dlatego twórcy jak na razie nie udostępniają swojej technologii szerszemu gronu, chcąc ją dopracować i ograniczyć możliwości tworzenia za jej pomocą krzywdzących obrazów. Jak sami piszą, ze względu na szkolenie sieci neuronowych na otwartych bazach zdjęć muszą na przykład uporać się z problemem uprzedzeń społecznych i kulturowych, które system przejawia nawet gdy w zadanych mu żądaniach nie pojawiają się ludzie.

"Modrosójka błękitna stojąca na koszu wypełnionym makaronikami w kolorze tęczy"

"Mózg ujeżdżający rakietę"

"Zdjęcie chromowanej kaczki ze złotym dziobek, która kłóci się ze wściekłym żółwiem"

"Zdjęcie podtopionej galerii sztuki, wystawiającej dzieła Moneta robotom"

Na gotowy, powszechnie dostępny system tego typu poczekamy zapewne jeszcze kilka lat, a jego ostateczna forma może być w pewien sposób ograniczona pod względem możliwości. Tak czy inaczej powinniśmy zacząć zdawać sobie sprawę, że w bardzo niedalekiej przyszłości technologia tego typu diametralnie zmieni nasz sposób postrzegania i używania fotografii, a wraz z kolejnymi usprawnieniami przewartościuje także zapewne segment fotografii reklamowej.

W końcu rozbudowanie danego systemu o możliwość dodania obrazu czy produktu, wokół którego AI budować ma narrację wizualną wydaje się jak najbardziej w zasięgu obecnych już możliwości programistów. Ba, prawdopodobnie problemem nie będzie nawet sprawienie, by rezultaty odpowiadały stylowi danego fotografa.

Czy jesteście na to gotowi?

Więcej informacji na temat układu Imagen znajdziecie na stronie imagen.research.google.

Skopiuj link

Autor: Maciej Luśtyk

Redaktor prowadzący serwisu Fotopolis.pl. Tłumacz i fotograf, codziennie selekcjonuje dla Was porcję najciekawszych newsów ze świata fotografii. Zafascynowany nowymi technologiami, choć woli fotografować analogiem. Prywatnie niespełniony snowboardzista i spełniony tata.

Słowa kluczowe:
Komentarze
Więcej w kategorii: Branża
Instagram testuje pełnoekranowy feed. Czy to jeszcze miejsce dla fotografów?
Instagram testuje pełnoekranowy feed. Czy to jeszcze miejsce dla fotografów?
Instagram nadal zmierza w stronę zorientowanego na wideo TikToka. Mark Zuckenberg zapowiedział na swoim profilu wprowadzenie nowych rozwiązań, które zbliżą jeszcze Instagrama do głównego...
16
L2 Technology - Leica i Panasonic zawiązują strategiczną współpracę
L2 Technology - Leica i Panasonic zawiązują strategiczną współpracę
Leica i Panasonic współpracują ze sobą od lat. Teraz jednak obydwie firmy zawiązały strategiczne partnerstwo pod szyldem L2 Technology. Na czym będzie...
4
Grand Press Photo 2021: poznaliśmy finalistów konkursu na książkę fotograficzną roku
Grand Press Photo 2021: poznaliśmy finalistów konkursu na książkę fotograficzną roku
Organizator Grand Press Photo ogłosił nominacje w ramach Photo Book of the Year 2021. O tytuł książki roku rywalizuje w tym roku pięć tytułów.
10
Powiązane artykuły