AI (Artificial Intelligence) czyli komputer, który niczego nie rozumie
Strach przed AI jest powszechny. Moda na AI równie silna. Trwoga przed zabierze nam pracę, miesza się z dobrodziejstwem "nałoży ci puder na twarz".
Niezrozumienie zjawiska podnosi temperaturę influencerów na Tubie, a zwykły widz tych filmików nie ma pojęcia, o czym mowa.
Twórcy tych treści często też nie.
Gdy pada słowo AI, w wyobraźni pojawia się maszyna.
Rodzaj wrednego, bezdusznego czegoś, co zaraz wciśnie guzik z napisem "The End" dla ludzkości.
Albo czegoś, co natychmiast wyleczy katar sienny.
Albo czegoś, co wysłane po flaszkę, wróci z dwiema.
Albo czegoś, co za dodatkową opłatą uszczęśliwi.
Wbrew wszelkim obawom i nadziejom prawda jest prozaiczna. Do bólu trywialna.
AI to po prostu sprawniejszy komputer obrazowo mówiąc.
Nic więcej. Nic bardziej.
Zanim jednak znajdę w tym wszystkim miejsce dla fotografii (bo jest!), spróbuję naświetlić kilka aspektów tego zjawiska. Byśmy wiedzieli, z której strony posmarowana jest ta kanapka.
Obiecuję, że nie będę ględził o gradientach, propagacji, aktywacji i innych sigmoidach. Ta wiedza niczego nam nie daje, chyba że ktoś chce budować swoją sieć neuronową. Nawet na laptopie.
Co zasadniczo jest jak najbardziej możliwe.
Nikt?
No to jedziemy.
Komputer, czyli jeden procesor (może dwa, czasem trzy) - to wiemy:
zrobi tylko to, na co pozwala mu program, będzie czerpał tylko z tego, co ma w bebechach.
Inaczej mówiąc, człowiek napisał program (czyli zestaw instrukcji), wrzucił go do wnętrza i każdym kliknięciem myszki mówi: -Rób!
W AI cała sieć neuronowa (czytaj: sieć skryptów) zapakowana jest na dziesiątkach tysięcy procesorów i akceleratorów GPU.
Każdy skrypt robi tylko jedną rzecz. Też według instrukcji.
Skrótowo i metaforycznie, będzie to wyglądać następująco:
Wyobraźcie sobie knajpę. Jeden super sprawny kucharz (po szkole, czyli z nałożonym programem) robi wszystko od A do Z i podaje danie do stolika.
To obraz zwykłego komputera z jego procesorem.
A teraz knajpę, w której pracuje zespół kucharzy (sieć neuronowa).
Każdy specjalizuje się w czymś innym (każdy ma ściśle określoną instrukcję, czyli skończył kurs - na przykład tylko krojenia szczawiu).
Wykonują wiele czynności jednocześnie i każdy (neuron) robi jedną rzecz. Perfekcyjnie.
Zwykły komputer (z jednym procesorem) może co najwyżej wykonywać jedną operację na raz. Zespół kucharzy wykonuje kilka tysięcy operacji równocześnie.
Widać już różnicę?
Tak obrazowo i w skrócie, żebyśmy zrozumieli, o co biega.
Gdzie jest tu inteligencja lub jakiś mały rozumek? Nie wiem.
W fotografii przedstawia się to następująco: zdjęcie (a może bardziej obraz) można wygenerować. Tak. Potrzebna będzie super szczegółowa instrukcja, czyli plan który wcześniej powstał w umyśle człowieka. To człowiek musi myśleć, wymyśleć, zaprojektować, zaproponować.
Do tego sztuczny "rozumek" potrzebuje bazy danych. Ogromnej.
Te bazy danych również wprowadził człowiek. Instrukcję, jak czerpać i analizować obrazy, także wprowadził człowiek.
Polecenie "wygeneruj obraz kota" zostanie rozłożone na części.
Jeden neuron (skrypt) poszuka definicji "wygeneruj", drugi "kota", trzeci "obraz". Kolejny skrypt, który ma bazę kotów (lub dostęp do niej), poszuka odpowiedniego wzoru i poda dalej.
Ostatni skrypt wyświetli kota. Jakiegokolwiek, przypadkowego, wziętego z bazy danych.
Ten przypadkowy kot to średnia wszystkich kotów z bazy. Średnia wyobrażeń o kocie. Średnia mniemań o kocie.
Jeśli ktoś myśli, że będzie to charakterny kocur z bajki
Tom i Jerry - jest w błędzie.
Wynik - to dziecinny, infantylny kotek z różowej sypialni niemowlęcia.
Tak postrzega kota większość ludzi.
Człowiek jednak bywa złośliwy. W instrukcji dla AI zażąda jeszcze
rudego
Złośliwcy dodadzą
śpiącego. Ci, którzy nie mają empatii dla maszyn, zażądają
w fotelu. A osoby, które powinny spędzać życie na wygnaniu, dopiszą
w pomieszczeniu..
Neurony (czyli skrypty) będą czerpać obrazy ze swoich baz danych i internetu.
Pasujący obrazek podstawią do wzoru, końcowy skrypt dopasuje piksele szczegółów i gotowe.
I cała filozofia.
Gdzie tu rozum?
Nie wiem.
Wszyscy epatują się słowem "inteligencja", odmieniają przez przypadki, zachłystują się tym prawie do wymiotów, ale... przepraszam. Nie widzę tu najmniejszego jej przejawu.
Możliwe, że nie znam definicji inteligencji, ale wydaje mi się, że pierwszy jej aspekt to świadomość tego, co się robi.
Człowiek przy poleceniu "wygeneruj obraz kota" pierwsze, co zrobi, to zapyta:
-Jakiego kota?
Bardziej oświeceni:
-Jakiego kota, do cholery?!
A sprytni:
-Za ile?
AI nie pyta. Maszyny nie pytają. Bo tu nie ma świadomości. Nie ma wyobraźni. Nie ma nic. Są tylko instrukcje.
Zagrożenia? Owszem.
Nie takie jak w Matrixie, ale inne.
Widzę dwa główne:
-Totalne zidiocenie społeczeństwa.
-Uzależnienie od baz danych.
W pierwszym - pokusa, by AI napisało za nas wszystko: piosenkę, muzykę, powieść, artykuł, recenzję, stronę internetową... ogromna.
Za darmo, szybko, poprawnie, bez wysiłku. Dziesięć minut i mamy nawet arię operową.
Komu teraz będzie się chciało myśleć?
Już teraz ludzie bez smartfona nie wiedzą, jaki mamy rok. Co będzie potem?
W drugim - AI bazuje na danych. Jeśli ktoś odetnie dostęp do baz, AI stanie się zwyczajnie bezużyteczne.
I to już się dzieje. The New York Times, The Guardian, CNN, Reuters, Washington Post, zablokowały dostęp botom OpenAI.
W dużym uproszczeniu i obrazowo mówiąc - bot to taki skrypt. Umieszczony na serwerze, wysyła żądania do innych serwerów. Jeśli ma dostęp, przeczyta kod strony i wyśle pasujące frazy z powrotem. Przykład: boty sprawdzające dostępność biletów czy cen w sklepach.
Wróćmy jednak do fotografii.
Wygenerowanie jakiegokolwiek obrazu za pomocą AI jest proste jak budowa cepa, ale stworzenie dokładnie takiego, jaki sobie zaplanowaliśmy - to już wyzwanie.
Niemniej jednak, jakkolwiek by nie było, wszyscy zgodzimy się co do jednego: taki obraz fotografią nie jest.
Ale co w sytuacji, gdy AI tylko poprawi nasze zdjęcie? To już zdumiewająca możliwość, prawda?
Wyobraź sobie, drogi czytelniku, że zrobiłeś genialne foto, ale po "wywołaniu" RAW-a okazuje się, że jest, urwał nać, nieostre! Albo horyzont jest krzywy! Albo coś niepotrzebnie wlazło w kadr! Albo morderczo prześwietliłeś kilka szczegółów!
W normalnych warunkach, na takie dictum pomoże program graficzny.
Co ma jednak zrobić autor zdjęcia, którego nie stać na Photoshopa? Albo który, choćby go było stać, nie ma czasu, wiedzy ani cierpliwości bawić się z krzywymi, gradientami, balansem bieli, warstwami i rozpiętością cieni?
Tyłek zbity, prawda?
Tymczasem z pomocą AI sprawa jest prosta. Wskazujesz zdjęcie na swoim komputerze, wpisujesz tekst w przeznaczone do tego okienko - zwyczajnie, po polsku, pełnymi zdaniami.
Używasz fraz w stylu: usuń tę gałązkę z przedniego planu, rozmyj tło, wyostrz plan przedni, wyprostuj horyzont, popraw rozpiętość barw, wydobądź szczegóły z prześwietlonych miejsc, zmniejsz ogólną jasność promieni słonecznych, wykadruj do najlepszej kompozycji...
Potem tylko "enter" i otrzymujesz poprawione zdjęcie, nawet jeśli pochodzi ono z taniutkiego i prostego aparatu.
Nie wygenerowane!
Poprawione!
Twoje!
Własne!
c.d.n.