Samochody już niedługo mają być autonomiczne. Chociaż niektórzy mówią, że jednak długo, długo, długo. Kilkadziesiąt sztuk już jeździ w każdym razie, a czy będzie ich więcej, to czas i inżynierowie pokażą. Rzecz cała na razie się rozbija o cenę – bardzo, niezwykle wręcz autonomiczny pan Henio z prawem jazdy kategorii E jest w porównaniu z nimi stosunkowo tani. A zwłaszcza jego kolega, pan Ho w Azji. Aparaty autonomicznie robiące zdjęcia być może też będą (prawie są, choć „prawie” robi pewną różnicę). Zapowiadają je od piętnastu lat co najmniej i choć są, na oko oceniając, sto razy łatwiejsze w produkcji niż samochody – nadal w tej kwestii niewiele się dzieje.
Sam pamiętam wywiad z edytorem „Przeglądu Sportowego”, publikowany niegdyś w „Foto”, w którym prorokowano o automatycznych aparatach kręcących filmy z meczy i edytorach, którzy w redakcjach będą wybierać z tych filmów klatki do publikacji. Fotografowie będą zupełnie zbędni. Minęło piętnaście lat, gazety powoli odchodzą w przeszłość, ale zdjęcia nadal strzelają ludzie z krwi i kości. To właściwie dziwne. Przy dzisiejszych możliwościach obróbki dużej ilości danych, przy dzisiejszym zaawansowaniu oprogramowania zdawałoby się to najzupełniej wykonalne – zlikwidować fotografów, zostawić same aparaty.
Część roboty i tak wykonywana jest dzisiaj zdalnie, dzięki możliwości radiowego wyzwalania migawki. Widać na przekazach telewizyjnych stojące na pajęczych nogach samotne statywy ze sprzętem w różnych newralgicznych miejscach, które ktoś obsługuje z oddalenia. Kamerzyści (filmowcy) ślubni i i imprezowi stosują od lat dodatkowy sprzęt, stojący samotnie w kącie i robiący za zbieracz materiału. Ba, każdy, kto ma trochę gotówki, może sobie kupić gotowego drona śledzącego w celu wykonania selfie-filmiku. Podąża ci taki dron nad delikwentem, filmując jego wyczyny sportowe albo wyczyny innego dowolnego autoramentu, można sobie sfilmować na przykład eksplorację ulicy Włókienniczej w Łodzi albo warszawskiej Pragi i zarejestrować z powietrza, jak się dostaje w mordę za posiadanie portfela albo kosę pod żebro za iPhone’a. Co za atrakcje wizualne! Notabene na niedawnej wyprawie narciarskiej znajomych studentów okazało się, że w posiadaniu siedmiu osób jest dziewięć kamer GoPro i trzy drony śledzące. Katastrofa lotnicza murowana.
Wracając jednak do tematu autonomii – w filmowaniu jest już powszechnie stosowana. W pewnej części filmowej roboty. Wielu pracujących w korporacjach styka się z nią na co dzień. Też się z nią zetknąłem ze dwa lata temu, i choć nie zachwycała, to jednak dwa lata stanowią epokę w postępie elektroniki, zatem zapewne rzecz jest dopracowywana. Otóż chodzi mi o systemy do telekonferencji. Kamery rozstawione w pomieszczeniu potrafią same wykryć, skąd przemawia prelegent, zoomować na jego twarz, śledzić ruch i oddalać kadr, gdy podchodzi do tablicy rysunkowej. To, co oglądałem dwa lata temu, nie powalało na kolana artyzmem, zoomowanie było tak szybkie, jakby robił to kamerzysta z ADHD, czasem zoom szalał do przodu i do tyłu. Zapewne zaprogramowano ten system pod jakieś burzliwe dyskusje. Niemniej, choć poziom artystyczny był niski, to już ogólna funkcjonalność – dobra. Sprzęt przekazywał, co trzeba i kogo trzeba. Czy tego samego nie dałoby się zrobić z aparatami fotograficznymi fotoreporterów sportowych?
Półautomatyczne aparaty są używane w dokumentacyjnej fotografii lotniczej od stulecia (1909 rok!), a w pełni automatyczne gdzieś tak od lat czterdziestych XX wieku. Zestrzelony w 1960 roku nad ZSRR samolot U2, o który rozpętała się wojna dyplomatyczna za czasów Chruszczowa i Kennedyego, też miał na pokładzie to rozwiązanie. Z wysokości 21 kilometrów był w stanie fotografować przedmioty wielkości 75 cm i nie dość, że robił to automatycznie, to jeszcze miał automatyczną przesłonę i autofokus. W 1960 roku! Dzisiaj prace fotogrametryczne czy geodezyjne wykonują autonomiczne drony, skanujące teren pod mapy. Zatem można? Można, ale nie wszystko.
O ile się dobrze zorientowałem, kilka czynników działa nadal na rzecz żywego człowieka przeciw autonomii bezdusznej maszyny. Przede wszystkim nieprzewidywalność zdarzeń. Dotychczasowe użycie fotograficznej autonomii ogranicza się do przypadków, gdy automat zostaje na coś WYCELOWANY. Wszystkie te sytuacje to zdarzenia powtarzalne i bez specjalnego ryzyka zmian. Czy spora część wydarzeń sportowych nie spełnia przypadkiem powyższego kryterium? Taki mecz piłkarski odbywa się na zamkniętej przestrzeni, z dość ograniczoną liczbą scenariuszy zachowań uczestników. A to Ronaldo bez powodu przewróci się na murawę i z jękiem złapie za nogę, a to Dudek zamacha łapami podczas karnych, a to ktoś inny strzeli bramkę boską ręką. Ogólnie standard. Dałoby radę to automatem opędzlować. Prawie.
Bo czasem też Zidane strzeli z bańki rywala, tuż po tym, jak tamten powiedział mu „grasz jak Rasiak”. I to jest sytuacja, która odbiega od standardu, dzieje się na marginesie akcji, ale jest zdolna rozpalać tłumy. Prawdopodobieństwo, że sztuczna inteligencja przegapi takie wydarzenie jest dosyć poważne. Nie wiem, czy fotoagencje i gazety byłyby chętne do ryzyka utraty takiego kadru. Nie wiem też, czy sztuczna inteligencja zdołałaby rozpoznać istotność pogawędki, jaką Serena Williams prowadziła z sędzią podczas ostatniego US Open, a która skończyła się skandalem, odebraniem gema i przegraniem meczu przez Amerykankę. A potem płaczem tenisistki. A potem płaczem jej przeciwniczki Naomi Osaki. Wydarzenie miało mało wspólnego ze sportem na korcie jako takim, ale zaważyło na całym turnieju i rozpaliło głowy fanów.
Druga sprawa i pewnie najważniejsza – ludzkie uczucia. Google już stworzyło aparat autonomiczny dla każdego. On istnieje. Nazywa się Google Clips. Co? Nie słyszeliście o nim nigdy? Ja też do tej pory nie słyszałem. Wiecie dlaczego? Bo marnie działa. Google zdążyło ogłosić już niejaką klęskę tego produktu. Jest to minikompakcik z przyzwoitym obiektywem, służący do przypięcia na ścianie, oknie albo gdzie tam chcecie, który analizuje akcję przed sobą i w odpowiednim momencie nagrywa filmiki z waszego życia. Z tych filmików można też kadrować sobie zdjęcia.
Klęski Google Clipsa są trojakiego rodzaju. Po pierwsze, ewentualni konsumenci zaczęli oskarżać Googla, że chce ich szpiegować non stop. Google zaprzeczał, tłumacząc, że aparacik nie musi wcale być podłączony do sieci, żeby nagrywać filmiki. Po drugie, Google Clips owszem, nagrywał, ale nie to, co trzeba. Twórcy przyznali, że urządzenie nie rozpoznaje emocji, a jedynie reaguje na znane sobie twarze w kadrze oraz na ruch, zatem robi filmiki, ale nie takie, jakie by się chciało. Tylko jakieś inne.
Po trzecie, nierozwiązana kwestia zdjęć – trzeba je sobie „wykadrować” z filmów. Samemu. Tutaj widzę także przyczynę braku realizacji scenariusza, który prorokował edytor „Przeglądu Sportowego” piętnaście lat temu. Otóż ktoś musi te filmy przeglądać, żeby z nich zdjęcia sobie wyłuskać. Nawet jeżeli zrobi to automatyczny algorytm, nadal należy mieć nad tym ścisły nadzór, kontrolę i trzymać rękę na pulsie. Jakie bowiem zdjęcia sportowe jesteśmy w stanie otrzymać od dzisiejszych automatycznych algorytmów oceny zdjęć? Otóż dość przeciętne i mało zhumanizowane. Owszem, są ostre, a nawet dobrze skadrowane, ale żeby łapały jakieś ulotne chwile i emocjonalne kluczowe momenty, to nie za bardzo. Póki sztuczna inteligencja znacznie gorzej niż ta naturalna jest w stanie oceniać intencje i mimikę ludzi, póty żywi fotografowie mogą spać spokojnie – będą mieli robotę. Ale czy tak będzie długo, to nie wiadomo.
Pocieszmy się, że sporo ludzi używa mimiki i gestów także w celach ironiczno-przewrotno- prześmiewczych, których nie są w stanie odebrać prawidłowo nawet inne osobniki homo sapiens, a co dopiero jakaś wyimaginowana sztuczna inteligencja. Zatem to raczej daleka droga.
Last but not least: osobista bytność fotografa na arenach sportu ma poważną zaletę. To naturalne wyczucie klimatu i nastroju imprezy, którego trudno będzie, obawiam się, wyuczyć automatyczne algorytmy. Reakcja kibiców, nerwy sportowców, mowa ciała, wpływ pogody na sport, odpowiednie światło. Wszystko to jest mało przewidywalne i trudne do zdefiniowania, ale ludzkie mózgi, dzięki empatii i wrażliwości estetycznej, jakoś sobie z tym radzą i w odpowiednim momencie naciskają spust migawki.
Prekursorką idei, że profesjonalni fotografowie są zupełnie zbędni, była w Polsce nie tak dawno aktorka Sonia Bohosiewicz. Stwierdziła ona dobitnie, że dobre zdjęcia może robić każdy. Najlepsze swoje zdjęcia i tak robi sobie sama i publikuje na własnym Instagramie, a paparazzi to gatunek na wymarciu. Miesiąc później na premierze filmu „Narzeczony na niby”, kiedy aktorka wdzięczyła się na tle ścianki sponsorskiej, wszyscy obecni tam fotoreporterzy jak jeden mąż demonstracyjnie odłożyli na jej widok swoje aparaty i mimo zachęt nie zrobili jej ani jednej fotki. Nie wiadomo, czy sztuczna inteligencja dałaby się przekonać w ten sam sposób.
https://www.spidersweb.pl/2018/01/google-clips-sztuczna-inteligencja.html
Historia szpiegowskich samolotów U2: