Wszyscy wiedzieliśmy, że ten dzień kiedyś nadejdzie, ale prawdę mówiąc nie spodziewałem się, że tak szybko. Ostatnie dokonania w zakresie generatywnej AI coraz szybciej przybliżały nas do sytuacji, w której do edycji zdjęć i grafiki nie będą potrzebne umiejętności techniczne, ale sprawne operowanie promptami. Do teraz problemem pozostawała jedynie dokładność otrzymywanych rezultatów i ich spójność z obrazem bazowym.
Choć obiecująco pod tym względem prezentował się m.in. najnowszy model Chata GPT, to jednak przy każdej edycji widocznie przetwarzał on wszystkie elementy obrazu wsadowego, przez co trudno było wykorzystywać go w bardziej wymagających realizacjach. Sytuację tę zmieniać ma najnowszy model Google, którego robocza nazwa Nano Banana odbiła się w ostatnich tygodniach echem w mediach społecznościowych. Teraz w końcu producent udostępnia jego finalną wersję o nazwie Gemini 2.5 Flash, a my możemy zobaczyć jak będzie wyglądać przyszłość obróbki.
Gemini 2.5 Flash (Nano Banana) - przykładowe edycje
Czy rezultaty są rzeczywiście tak dobre? Możliwości nowego modelu przetestowałem na kilku przykładach, które możecie ocenić poniżej. Przed każdym porównaniem zamieszczam screen z promptem, którego użyłem do edycji.
Dodam tylko, że efekty najlepiej oglądać na smartfonie lub też przeskalować widok przeglądarki na komputerze do około 60-70%, gdyż jak na razie wielkość zdjęć generowanych przez Gemini 2.5 Flash ograniczona jest do ok. 1200 px na długim boku, przez co nie wystarczają one do wypełnienia poniższego modułu slidera i są skalowane przez nas system, co nieco pogarsza rezultaty podczas oglądania na desktopie.
Czy to koniec standardowej edycji zdjęć?
Teraz pora na wnioski. To raptem kilka szybkich przykładów, niemniej już teraz doskonale widać dokąd zmierzamy. Czy generatory AI zastąpią znane nam programy do edycji, jak chociażby Photoshop i Lightroom?
Na chwilę obecną da się jeszcze wyłapać pewne niedoskonałości i niespójności, jak choćby faktura wygenerowanej koszulki czy sierści. System nie zawsze jest też w stanie w pełni wykonać polecenia (jak w przypadku usunięciu wywietrzników ze zdjęcia wnętrza), a w kilku przypadkach, których tu nie pokazałem, w ogóle nie chciał przetworzyć wgranego zdjęcia. Czasem też jeszcze za bardzo ingeruje w drobne detale lub nie jest w stanie ich perfekcyjnie odtworzyć, jak w przypadku przykładu ze zmianą koloru koszuli czy modelu aparatu. W końcu, na chwilę obecną wielkość plików wyjściowych ograniczona jest do wspomnianych 1248 px na dugim boku.
Wszystko to jednak problemy, których pozbycie się przy obecnym tempie rozwoju technologii AI z pewnością nie potrwa dłużej niż rok. Na mnie możliwości Gemini 2.5 Flash zrobiły bardzo duże wrażenie i jestem przekonany, że nawet w obecnej formie można zrobić z nich ogromny użytek - choćby na potrzeby marketingu w mediach społecznościowych czy tworzenia różnego rodzaju wizualizacji. Warto zaznaczyć tu chociażby dowolność edycji, jakie możemy w ten sposób przeprowadzić. Poza usuwaniem czy modyfikacją obiektów możemy tu na przykład także "poszerzyć" zakres dynamiczny obrazu czy też swobodnie zmieniać pory dnia i roku. System pozwala też swobodnie przekładać elementy z jednego zdjęcia na drugie. Czy jednak tak, jak wieszczą tytuły niektórych zagranicznych serwisów informacyjnych, pojawienie się modelu "Nano Banana" wieści koniec Adobe? Bynajmniej. Dla Adobe to kolejna świetna informacja, która jeszcze bardziej napędzi rekordowe zyski z subskrypcji.
Jak informowaliśmy Was wiosną, Adobe zawiązało umowy partnerskie z najważniejszymi graczami na polu generatywnej AI i udostępnia zewnętrzne modele w ramach usługi Firefly. Jak nietrudno się domyślić, nazwa Gemini 2.5 Flash już teraz pojawia się na oficjalnej stronie wsparcia producenta. Z dużym prawdopodobieństwem, prędzej czy poźniej możliwości te zawitają więc także i do Photoshopa (oraz innych aplikacji z pakietu Creative Cloud). To zwyczajnie zbyt duża rewolucja, by Adobe potraktowało to po macoszemu. Jeśli mielibyśmy obstawiać, funkcjonalność ta zapewne zbiegnie się z udostępnieniem zapowiadanego agenta AI w aplikacjach CC.
Co dalej?
Generatory tego typu wraz z integracją z agentami AI zmienią oblicze obróbki. I być może bardzo dobrze, bo po co spędzać godziny na dłubaniu w zdjęciach, gdy wszystko będziemy mogli załatwić prostym promptem? W końcu postprodukcja to jeden z najbardziej żmudnych i nielubianych procesów w pracy fotografów.
Jak jednak wiadomo, każdy kij ma dwa końce i o ile technologia ta jest w stanie usunąć z fotograficznego równania czynności, za którymi nie przepadamy, to niestety zmusza także do przykrego wniosku. O ile do tej pory byłem w stanie dosyć łatwo wskazać obrazy edytowane przy pomocy AI, tak wiem, że od dzisiaj już nigdy nie uwierzę do końca w nic, co widzę w internecie. Czy więc tak umiera fotografia, jaką znamy?
Możliwości nowego edytora możecie przetestować za darmo w ramach Google AI Studio na stronie aistudio.google.com.