Vibe coding zmienia oblicze fotografii. Paweł Fabjański stworzył aparat przy pomocy AI (w przerwie świątecznej)

Czy w przyszłość fotografii należy do aparatów DIY? Dzięki sztucznej inteligencji, dziś własny, wymarzony aparat jest w stanie zbudować niemal każdy. O swojej przygodzie z projektowaniem opowiada nam Paweł Fabjański - znany fotograf reklamowy, który właśnie stworzył swój własny aparat przy pomocy AI.

Skomentuj Kopiuj link
Posłuchaj
00:00

Choć sztuczna inteligencja fotografom raczej nie kojarzy się zbyt dobrze, stała się już stałym elementem kreatywnego workflow. Rozwiązania AI usprawniają proces edycji, pozwalają przeskakiwać ograniczenia budżetu i wspomagają codzienną pracę. Według uznanego fotografa reklamowego Pawła Fabjańskiego, mogą także zadziałać jak trampolina - do odkrywania kreatywności i realizowania projektów, które do tej pory były dla nas poza zasięgiem. Tak było w przypadku aparatu, którego podstawę stworzył będąc kompletnym laikiem w temacie projektowania i programowania.

Paweł Fabjański od zawsze lubił eksperymentować z nowymi technologiami i włączać je w proces twórczy, badając granice pomiędzy sztuka a komercją. Kilka lat temu mieliśmy m.in. okazję towarzyszyć mu podczas realizacji sesji w środowisku produkcji wirtualnej. Teraz fotograf wziął na warsztat nowe możliwości systemów AI, tworząc projekt, który jednocześnie eksploruje sam proces rejestrowania obrazu, jak i granice współpracy człowiek-maszyna.

Stworzyć aparat bez wiedzy o elektronice i kodowaniu - to już możliwe

„Wiele osób kojarzy mnie z fascynacją nowymi technologiami, w tym także ze sztuczną inteligencją. Prawda jest jednak taka, że do generatywnego AI podchodzę z dużą rezerwą i korzystam z niego raczej sporadycznie. Generowanie obrazów i wideo wciąż budzi we mnie lekki opór. Coś mi w tym procesie nie do końca pasuje, brakuje mi poczucia twórczej satysfakcji. Za to moment, w którym zbudowałem własny aparat, napisałem do niego oprogramowanie i zrobiłem nim pierwsze zdjęcia, był właśnie taką satysfakcją” - opowiada fotograf.

Jak mówi twórca, jest to projekt na wpół artystyczny, a na wpół technologiczny, gdzie celem jest przygotowanie narzędzia, które połączy praktykę fotograficzną z zaawansowanym wsparciem ze strony AI. Głównym założeniem było bowiem to, by zarówno budowa, jak i soft zostały stworzone przez narzędzia sztucznej inteligencji.

„Założenie, że jako osoba nie mająca wcześniejszego backgroundu w projektach elektronicznych zdołam przejść przez proces projektowania aparatu cyfrowego, stanowiło wyzwanie, które mogło udać się zrealizować jedynie przy wsparciu najnowszych modeli językowych” - komentuje.

Pierwszym etapem była konstrukcja autorskiej elektroniki - aparatu widzącego w spektrum podczerwieni, który zbudowany został na bazie podzespołów elektronicznych dostępnych w uniwersum Raspberry PI.

„To cyberpunkowe podejście DYI pozwala mi na decydowanie o funkcjach i wyglądzie mojego autorskiego sprzętu, ale jednocześnie daje duże pole do współpracy ze sztuczną inteligencją już na etapie projektowania hardware’u. Drugi etap to programowanie aparatu. Tutaj AI pojawia się jako bardzo mocne wsparcie w procesie Vibe Codignu. Po raz kolejny wchodzę w przestrzeń w której moja wiedza jest znikoma - tworzenie działających aplikacji było poza moim spektrum umiejętności.

Kilka dni - tylko tyle zajęło stworzenie podstawy aparatu

Jak dowiedzieliśmy się od twórcy, złożenie elektroniki i napisanie software’u zajęło kilka dni w przerwie między Wigilią a Nowym Rokiem. Sam proces pisania softu zajął około 3 dni, choć jak mówi fotograf, jest on stale udoskonalany, więc trudno jednoznacznie oszacować ilość włożonego czasu.

Jeżeli chodzi o pisanie softu, Paweł Fabjański korzystał z Cursora i Antigravity - narzędzi, w których w jego ocenie najwygodniej pisze się oprogramowanie. Do projektowania elektroniki użył zaś Perplexity.

„To według mnie najwygodniejsze narzędzie, w którym można korzystać z wielu LLM-ów i które, oprócz odpowiedzi, daje też linki do źródeł. Takie działanie pozwala mi zaufać, że nie halucynuje. Gdy pomagał mi dobrać podzespoły elektroniczne, korzystał z forów internetowych związanych z elektroniką i znajdował odpowiednie elementy sprzętu w sklepach internetowych.”

Jako największą przeszkodę w swoim projekcie, Paweł wymienia fakt „puchnięcia” kodu, który bez wiedzy informatycznej trudno jest przeanalizować, co sprawia, że dojście do zadowalających rezultatów wymaga wielu prób i błędów.

„Zdarzało się, że model, z którym pracowałem brnął w ślepą uliczkę - trzeba było się cofać i robić jakąś funkcjonalność aparatu od nowa.” - komentuje fotograf. „To wszystko chyba jednak bardziej moje ograniczenia, niż samych LLM-ów. W miarę jak projekt się rozrastał, lepiej potrafiłem opisać moje potrzeby, zorganizować repozytorium kodu; zacząłem używać narzędzi takich jak github i to wszystko spowodowało, że teraz kolejne iteracje softwaru powstają bez niepotrzebnego błądzenia.”

Coś więcej niż tylko rejestrowanie obrazu

Interesująco prezentuje się także samo działanie aparatu, które zamiast standardowej rejestracji opiera się o algorytmy ingerujące w strukturę obrazu, które można wymieniać, jak presety czy profile kolorystyczne.

„W założeniu wszystko jest modułowe. Obecnie mam do wyboru trzy presety oparte o różne parametry w algorytmie pixel sort (którego ojcem jest Kim Asendorf) oraz jeden, który jest bliski ditheringowi. Mam też możliwość przetwarzania obrazu za pomocą wybranego LLM-a (łącząc się z API i przetwarzając je na zewnętrznych serwerach). W przyszłości planuję dodanie kolejnych algorytmów przetwarzających fotografie bezpośrednio na urządzeniu, bo ten kierunek mnie dużo bardziej fascynuje” - opisuje Paweł Fabjański.

Zdjęcia przykładowe wykonane przy pomocy aparatu Pawła Fabjańskiego

Co chyba jednak najciekawsze w tym projekcie, całość udało od razu zamknąć się w działającym prototypie. Jak mówi Paweł, od pierwszej próby wszystkie podzespoły zadziałały tak, jak tego chciał. Imponująco prezentuje się także kosztorys - pozyskanie elektroniki, obudowy i stosownej baterii kosztowało mniej niż 1000 zł.

„Chciałbym, aby stało się to inspiracją dla ludzi mających w sobie iskrę kreatywności”

„Dla mnie bardzo ważne w tym projekcie jest to, że nie jestem specem od elektroniki lub kodowania.  Dla ludzi, którzy zajmują się tworzeniem własnych projektów z uniwersum Raspberry lub Arduino, to co zrobiłem nie jest jakimś niewyobrażalnie dużym wyzwaniem. Dopiero jak się zrozumie fakt, że fotograf może wejść na nieznane mu terytorium i stworzyć coś dość zaawansowanego, wtedy dopiero całość nabiera sensu. Chciałbym, aby stało się to inspiracją dla ludzi mających w sobie iskrę kreatywności - dzisiejsze LLMy mogą tą kreatywność wspomagać, nawet jeśli wchodzimy w obszary w których brakuje nam wiedzy, doświadczenia czy wsparcia ze strony osób bardziej doświadczonych.” - podsumowuje fotograf

W przyszłości Paweł Fabjański chciałby udostępnić ten projekt na zasadzie open-source, póki co jednak poświęca czas na dopracowanie software’u i optymalizację. Jak sam twierdzi, w tym celu czeka na model LLM, który będzie w stanie spojrzeć na kod jeszcze raz i wyczyścić ze wszystkich zbędnych i niedopracowanych elementów, co w jego opinii powinno wydarzyć się w ciągu kilku miesięcy.

Trzymamy kciuki!

Paweł Fabjański - sylwetka autora
Fotograf z wieloletnim doświadczeniem w branży reklamowej. Ma na koncie realizacje dla takich marek jak Red Bull, Sony, Samsung, Play, Skoda, T-Mobile, Orange czy Nike. Zdobywca wielu branżowych nagród. Prowadzi pracownię Fotografii Komercyjnej w Łódzkiej Szkole Filmowej.
 
Swoją uwagę skupia głównie na zagadnieniu przenikania się sztuki i komercji. Jego projekty komercyjne i autorskie były wielokrotnie nagradzane prestiżowymi wyróżnieniami, a prace prezentowano na festiwalach fotograficznych i w galeriach w Polsce oraz za granicą.
 
Komentarze
Przeczytaj także
Zobacz więcej z tagiem: Paweł Fabjański
logo logo
Magazyny
Zamów