Login  Hasło  

Fotografia i... AI

AI (Artificial Intelligence) czyli komputer, który niczego nie rozumie

     Strach przed AI jest powszechny. Moda na AI równie silna. Trwoga przed zabierze nam pracę, miesza się z dobrodziejstwem "nałoży ci puder na twarz".
Niezrozumienie zjawiska podnosi temperaturę influencerów na Tubie, a zwykły widz tych filmików nie ma pojęcia, o czym mowa.
Twórcy tych treści często też nie.
   Gdy pada słowo AI, w wyobraźni pojawia się maszyna.
Rodzaj wrednego, bezdusznego czegoś, co zaraz wciśnie guzik z napisem "The End" dla ludzkości.
Albo czegoś, co natychmiast wyleczy katar sienny.
Albo czegoś, co wysłane po flaszkę, wróci z dwiema.
Albo czegoś, co za dodatkową opłatą uszczęśliwi.
   Wbrew wszelkim obawom i nadziejom prawda jest prozaiczna. Do bólu trywialna.
AI to po prostu sprawniejszy komputer obrazowo mówiąc. Nic więcej. Nic bardziej.
Zanim jednak znajdę w tym wszystkim miejsce dla fotografii (bo jest!), spróbuję naświetlić kilka aspektów tego zjawiska. Byśmy wiedzieli, z której strony posmarowana jest ta kanapka.
Obiecuję, że nie będę ględził o gradientach, propagacji, aktywacji i innych sigmoidach. Ta wiedza niczego nam nie daje, chyba że ktoś chce budować swoją sieć neuronową. Nawet na laptopie.
Co zasadniczo jest jak najbardziej możliwe. Nikt?
No to jedziemy.
Komputer, czyli jeden procesor (może dwa, czasem trzy) - to wiemy: zrobi tylko to, na co pozwala mu program, będzie czerpał tylko z tego, co ma w bebechach.
Inaczej mówiąc, człowiek napisał program (czyli zestaw instrukcji), wrzucił go do wnętrza i każdym kliknięciem myszki mówi: -Rób!
   W AI cała sieć neuronowa (czytaj: sieć skryptów) zapakowana jest na dziesiątkach tysięcy procesorów i akceleratorów GPU.
Każdy skrypt robi tylko jedną rzecz. Też według instrukcji.
Skrótowo i metaforycznie, będzie to wyglądać następująco:
Wyobraźcie sobie knajpę. Jeden super sprawny kucharz (po szkole, czyli z nałożonym programem) robi wszystko od A do Z i podaje danie do stolika.
To obraz zwykłego komputera z jego procesorem.
A teraz knajpę, w której pracuje zespół kucharzy (sieć neuronowa).
Każdy specjalizuje się w czymś innym (każdy ma ściśle określoną instrukcję, czyli skończył kurs - na przykład tylko krojenia szczawiu).
Wykonują wiele czynności jednocześnie i każdy (neuron) robi jedną rzecz. Perfekcyjnie.
Zwykły komputer (z jednym procesorem) może co najwyżej wykonywać jedną operację na raz. Zespół kucharzy wykonuje kilka tysięcy operacji równocześnie. Widać już różnicę?
Tak obrazowo i w skrócie, żebyśmy zrozumieli, o co biega.
Gdzie jest tu inteligencja lub jakiś mały rozumek? Nie wiem.
   W fotografii przedstawia się to następująco: zdjęcie (a może bardziej obraz) można wygenerować. Tak. Potrzebna będzie super szczegółowa instrukcja, czyli plan który wcześniej powstał w umyśle człowieka. To człowiek musi myśleć, wymyśleć, zaprojektować, zaproponować.
Do tego sztuczny "rozumek" potrzebuje bazy danych. Ogromnej.
Te bazy danych również wprowadził człowiek. Instrukcję, jak czerpać i analizować obrazy, także wprowadził człowiek.
Polecenie "wygeneruj obraz kota" zostanie rozłożone na części.
Jeden neuron (skrypt) poszuka definicji "wygeneruj", drugi "kota", trzeci "obraz". Kolejny skrypt, który ma bazę kotów (lub dostęp do niej), poszuka odpowiedniego wzoru i poda dalej.
Ostatni skrypt wyświetli kota. Jakiegokolwiek, przypadkowego, wziętego z bazy danych.
  Ten przypadkowy kot to średnia wszystkich kotów z bazy. Średnia wyobrażeń o kocie. Średnia mniemań o kocie.
Jeśli ktoś myśli, że będzie to charakterny kocur z bajki Tom i Jerry - jest w błędzie.
Wynik - to dziecinny, infantylny kotek z różowej sypialni niemowlęcia.
Tak postrzega kota większość ludzi.
Człowiek jednak bywa złośliwy. W instrukcji dla AI zażąda jeszcze rudego Złośliwcy dodadzą śpiącego. Ci, którzy nie mają empatii dla maszyn, zażądają w fotelu. A osoby, które powinny spędzać życie na wygnaniu, dopiszą w pomieszczeniu..
Neurony (czyli skrypty) będą czerpać obrazy ze swoich baz danych i internetu.
Pasujący obrazek podstawią do wzoru, końcowy skrypt dopasuje piksele szczegółów i gotowe.
I cała filozofia.
Gdzie tu rozum?
Nie wiem.
Wszyscy epatują się słowem "inteligencja", odmieniają przez przypadki, zachłystują się tym prawie do wymiotów, ale... przepraszam. Nie widzę tu najmniejszego jej przejawu.
Możliwe, że nie znam definicji inteligencji, ale wydaje mi się, że pierwszy jej aspekt to świadomość tego, co się robi.
Człowiek przy poleceniu "wygeneruj obraz kota" pierwsze, co zrobi, to zapyta:
-Jakiego kota?
Bardziej oświeceni:
-Jakiego kota, do cholery?!
A sprytni:
-Za ile?
AI nie pyta. Maszyny nie pytają. Bo tu nie ma świadomości. Nie ma wyobraźni. Nie ma nic. Są tylko instrukcje.
Zagrożenia? Owszem.
Nie takie jak w Matrixie, ale inne.
Widzę dwa główne:
-Totalne zidiocenie społeczeństwa.
-Uzależnienie od baz danych.
W pierwszym - pokusa, by AI napisało za nas wszystko: piosenkę, muzykę, powieść, artykuł, recenzję, stronę internetową... ogromna.
Za darmo, szybko, poprawnie, bez wysiłku. Dziesięć minut i mamy nawet arię operową.
Komu teraz będzie się chciało myśleć?
Już teraz ludzie bez smartfona nie wiedzą, jaki mamy rok. Co będzie potem?
W drugim - AI bazuje na danych. Jeśli ktoś odetnie dostęp do baz, AI stanie się zwyczajnie bezużyteczne.
I to już się dzieje. The New York Times, The Guardian, CNN, Reuters, Washington Post, zablokowały dostęp botom OpenAI.

W dużym uproszczeniu i obrazowo mówiąc - bot to taki skrypt. Umieszczony na serwerze, wysyła żądania do innych serwerów. Jeśli ma dostęp, przeczyta kod strony i wyśle pasujące frazy z powrotem. Przykład: boty sprawdzające dostępność biletów czy cen w sklepach.

  Wróćmy jednak do fotografii.
Wygenerowanie jakiegokolwiek obrazu za pomocą AI jest proste jak budowa cepa, ale stworzenie dokładnie takiego, jaki sobie zaplanowaliśmy - to już wyzwanie.
Niemniej jednak, jakkolwiek by nie było, wszyscy zgodzimy się co do jednego: taki obraz fotografią nie jest.

  Ale co w sytuacji, gdy AI tylko poprawi nasze zdjęcie? To już zdumiewająca możliwość, prawda?
Wyobraź sobie, drogi czytelniku, że zrobiłeś genialne foto, ale po "wywołaniu" RAW-a okazuje się, że jest, urwał nać, nieostre! Albo horyzont jest krzywy! Albo coś niepotrzebnie wlazło w kadr! Albo morderczo prześwietliłeś kilka szczegółów!
W normalnych warunkach, na takie dictum pomoże program graficzny.
Co ma jednak zrobić autor zdjęcia, którego nie stać na Photoshopa? Albo który, choćby go było stać, nie ma czasu, wiedzy ani cierpliwości bawić się z krzywymi, gradientami, balansem bieli, warstwami i rozpiętością cieni?
Tyłek zbity, prawda?
Tymczasem z pomocą AI sprawa jest prosta. Wskazujesz zdjęcie na swoim komputerze, wpisujesz tekst w przeznaczone do tego okienko - zwyczajnie, po polsku, pełnymi zdaniami.
Używasz fraz w stylu: usuń tę gałązkę z przedniego planu, rozmyj tło, wyostrz plan przedni, wyprostuj horyzont, popraw rozpiętość barw, wydobądź szczegóły z prześwietlonych miejsc, zmniejsz ogólną jasność promieni słonecznych, wykadruj do najlepszej kompozycji...

Potem tylko "enter" i otrzymujesz poprawione zdjęcie, nawet jeśli pochodzi ono z taniutkiego i prostego aparatu.
Nie wygenerowane!
Poprawione!
Twoje!
Własne!
c.d.n.
 
  
Patt 📷 /  2025.02.10 : 13.03

Zasygnalizuję jeszcze taką sytuację:

Jeśli wygenerowany obraz (foto-realistyczny) - rzucę na ekran
(projektor plus naciągnięte prześcieradło na ramę plus oczywiście staranie by technikalia tego przedsięwzięcia były idealne)
...i zrobię temu zdjęcie -
...to czy pozostaję w sferze generacji czy przechodzę do fotografii?

Albowiem mam wtedy rawa, mam oryginał na matrycy, zachowane są cechy dokumentu (jest taki rodzaj fotografii), nacisnąłem spust migawki, czyli zrobiłem zdjęcie.
Co wtedy? Gdzie wtedy jestem?


  
kmw1960 /  2025.02.09 : 22.56

Niestety postępu nie da się zatrzymać. Kopernik też cały wszechświat "wywrócił do góry nogami".


  
Dorota_Kula 📢 /  2025.02.08 : 22.23

Natomiast co do młodych pokoleń - myślę, że każde pokolenie odnajdzie się w czasach, w których przyszło im żyć. Świat zmienia się nieustannie, każdy czas niesie inne zagrożenia, a przecież ludzkość ciągle idzie do przodu właśnie za sprawą kolejnych pokoleń...


  
Dorota_Kula 📢 /  2025.02.08 : 22.12

Z ciekawością przeczytałam i przyznam, że jestem ciekawa, jak to działa. Tak, generowanie fałszywych obrazów czy zdarzeń, wbrew pozorom nie tak łatwych, lub wręcz niemożliwych do odróżnienia, wydaje mi się potencjalnym zagrożeniem ze strony AI.


  
Patt 📷 /  2025.02.08 : 13.23

Wykorzystywanie rzeczy spraw i zjawisk do niecnych celów było zawsze w historii ludzkości Maryś. Każdy wynalazek - z natury niewinny - miał swoją destrukcyjną stronę. Kwiatem na przykład można wyrazić piękno ale można i otruć.
Tu nie ma rady. Tacy - my ludzie- jesteśmy.
Jeśli wynajdziemy pigułkę szczęścia, empatii i miłości - z pewnością znajdziemy sposób by nią zabijać.
Model Ai o nazwie OmniHuman-1 - to narzędzie, za pomocą którego - możemy dowolny głos, wstawić w dowolne zdjęcie i wygenerować... nie wiem... hiper -realistyczny filmik.
I może się okazać w nim , że Rambo opowiada po polsku, że mieszka w Koluszkach i uprawia kapustę. A jego największym osiągnięciem życiowym był ożenek z Mariolą.
Wystarczy zdjęcie i plik głosowy.
Nie ma na to rady. Taki deepfake można wygenerować i puścić w Tubie.
Jak się przed tym bronić?
Można użyć Deepware Scanner ( to łatwe), ale tak naprawdę wystarczy pewnie zwykła doza nieufności i rozsądku.


  
Maria_Krystyna /  2025.02.07 : 20.05

Dziękuję, Marku za ten artykuł. Wiele mi wyjaśniłeś, naświetliłeś, pomogłeś zrozumieć. Lekki niepokój jednak pozostaje. Chodzi o wykorzystywanie AI do niecnych celów, przekłamywania rzeczywistości, tworzenie scen nie mających miejsca z udziałem osób. No i oczywiście pójście na łatwiznę. Martwię się o młode pokolenie tak podatne na tego rodzaju "ułatwienia".


  
alaadam /  2025.02.07 : 17.31

Bardzo ciekawy temat i dyskusja. Z przyjemnością przeczytałem


  
fru-fru 🦋 /  2025.02.06 : 11.22

Panowie, zręcznie przerzucając się tonami, skutecznie wyłączyli mnie z dalszej dyskusji, o co żalu nie mam:) Idę podlać kwiatki:)))


  
Patt 📷 /  2025.02.06 : 10.27

To samo z tak zwanymi samochodami elektrycznymi. Gdyby w myśl najnowszych trendów, wyznaczonych kierunków i dążeń - każdy teraz przesiadł się do samochodu elektrycznego, średniego - każde większe osiedle, albo małe miasto - musiałoby mieć swoją elektrownię. Zakładając 5 tysięcy takich samochodów - trzeba spalić średnio na dobę 120 ton węgla czyli wyemitować prawie 300 ton szkodliwych związków (samego znienawidzonego CO2 280 ton). Wszystko w ciągu doby.
Dla porównania - 5 tysięcy samochodów spalinowych - emituje w ciągu doby 50 ton szkodliwych związków i to przy założeniu, że wszystkie są w ruchu.
Tam 300 ton w ciągu doby i to jest ekologiczne
Tutaj 50 ton w ciągu doby i to jest be.


  
fru-fru 🦋 /  2025.02.06 : 04.34

Johan, to co napisałeś zrobiło na mnie spore wrażenie. Od zaplecza nie wygląda to ciekawie. Czy źródło energii może mieć wpływ na zmianę tego zjawiska. Czy są jakieś ruchy wskazujące na to, że używane chłodzenie da się zastąpić bardziej ekologicznym. Jeśli nie jest to możliwe, cała zabawa z Al staje pod znakiem zapytania, bowiem konsekwencje tego i podobnych działań mogą być w niedalekiej przyszłości dramatyczne. Nie ogarniam, jakie. To takie tylko myśli, które zaczynają krążyć w mojej głowie. Mądre, niemądre - nie wiem.


  
Johan /  2025.02.05 : 23.47

Tak na marginesie: superkomputer do AI może pobierać nawet 30 MW energii podczas pracy. To tyle, ile zużywa niewielkie miasto.Jedna megawatogodzina zostanie wyprodukowane jeżeli w kotle spalimy 144kilogramów węgla (a to tylko w przypadku kiedy kocioł wykazuje sprawność 100%) o kaloryczności około 25 MJ/kg. Im mniejsza kaloryczność np. 18-19 MJ/kg i gorsza sprawność kotła, tym więcej węgla należy spalić w kotle zwykle ponad 180 - 200kg. Czyli z prostego rachunku wynika, że godzina pracy takiego potwora to nawet 6 ton spalonego węgla. Każdy komputer podczas pracy wydziela ciepło, nawet ten domowy PeCet. Superkomputer Frontier, na przykład, chłodzony jest systemem wodnym, zawierającym ponad 7500 litrów cieczy, która jest poruszana 350-konnymi pompami, które też trzeba zasilić z elektrowni. Tak oto walczy się z ociepleniem klimatu przy pomocy AI.


  
fru-fru 🦋 /  2025.02.05 : 21.32

Jeszcze biliony pomyłek sztucznej inteligencji i tyleż samo poprawek człowieka a nabierze ona cech sługi doskonałego. Inaczej być nie może. Zawsze będzie usłużna, bo nie myśli, nie czuje, niczego sobie nie wyobrazi. Natomiast, wprowadzona w błąd przez człowieka, z uporem będzie dążyć szlakiem, jaki jej wyznaczy, jeśli nawet będzie to droga do unicestwienia ludzkości. Odcięta od bazy danych, przestanie działać. Al będzie użyteczna (w wielu dziedzinach potrafi już sprawnie funkcjonować), wyręczy nas w różnych czynnościach, jeśli to, co my sami podamy do baz danych będzie prawidłowo zweryfikowane i pozbawione błędów. Spotykamy się z nią na co dzień. Kiedy dzwonimy do banku lub na inną centralę, wita nas jakaś Kinga. Mądrzy się, bardzo chce nam pomóc, podpowiada, co mamy robić, ale też często nie rozumie naszych pytań. Pracuje w interesie firmy, którą reprezentuje a ta z kolei dzięki niej może zatrudniać mniej pracowników. Znamy to. Póki co, AL ciągle jest w powijakach, nieudolna, marudna, nieustannie przepraszająca, że nie rozumie, albo wciskająca nam bezwstydnie swoją póki co, marną wiedzę czerpaną z ciągle niedoskonałych baz danych.
Ostatecznie, jednak wszystko jest w rękach człowieka i nie tak zostanie, byle był to człowiek rozumny, w najlepszym tego słowa znaczeniu.
To, co napisałeś o Al jest przejrzystym prostym przekazem. Mnie osobiście zmusiłeś do wysiłku, do uporządkowania myśli na jej temat, które dotychczas traktowałam z dużej dozy nonszalancją.
Perspektywiczne związki Al z fotografią bardzo mnie ucieszyły. Dla foto-mnie-poradnych zaświeci jasne słoneczko:)))


  
Patt 📷 /  2025.02.05 : 10.07

Zamiar, idea, cel tej pisaniny miałem jeden. Może dwa. A jak się nabzdyczę - może trzy.
Pierwszy: sprowadzić to zjawisko do parteru. Żeby nie było jak z wynalazkiem druku. (XV wiek). Sądzono wówczas, że łatwy dostęp do ksiąg wprowadzi chaos i herezję a w konsekwencji koniec ludzkości.
Z drugiej strony wleje w umysły tyle wiedzy, że każdy będzie mógł zostać profesorem i uniwersytety trzeba zburzyć.
Bo zawsze są dwa oczekiwania od nowych zjawisk. Jedni wieszczą koniec, drudzy początek.
Drugi: zrozumieć czym jest AI. To potężne narzędzie - prawda - ale w porównaniu do młotka - bardziej młot pneumatyczny niż lot w kosmos.
Trzeci - spowodować zaciekawienie. Skoro mamy już to bezrozumne Ai - wykorzystać tego brandzla do własnych celów. Z premedytacją.
Skoro jesteśmy w jeziorze fotografii - niech smaży nasze złowione rybki :)


  
Nieblondynka /  2025.02.04 : 19.34

Łał. Zaczynam rozumieć...moja inteligencja jednak to ogarnia na swoje możliwości:) Tak,AI do poprawiania mogłaby być moim nieosiągalnym aspektem chęci jej posiadania(w komputerku),tak. Przeraża mnie tylko wykorzystywanie tych możliwości ku "zidioceniu tłumu" właśnie -choćby durnymi obrazkami kotecków w najróżniejszych formach i odsłonach(nie koniecznie w różowej sypialence niemowlaczka) i podszywaniu się pod informacje,które coraz więcej ludzi bierze za jak najbardziej prawdziwe...Jest to(to AI) rozwiązaniem bardzo pomocnym,ale dąży się za jego pomocą faktycznie do robienia wszystkiego "zamiast" . Fotografia musi się obronić,chociaż ...chyba nie ma przed czym.Jak napisałeś-AI nie tworzy fotografii a obrazki-zlepki.Nie pójdzie za nikogo w teren i całe szczęście:)
Bardzo dobrze napisany tekst,bardzo.Z taką łatwością tłumaczenia chwilami niewytłumaczalnego trzeba się urodzić:)) ,no można to też wyćwiczyć,ale umieć to TRZEBA...AI chyba nie uniesie sarkazmu,ironii,poczucia humoru sytuacyjnego,czy interpretacji za jego pomocą świata i nowych sytuacji.Dzięki,czekam na cdn:)



   Copyright 2020 Patt i s-ka. All rights reserved. Wszelkie prawa zastrzeżone