Umelá inteligencia na zlepšenie životov – dnes a zajtra

Jednou z tém, ktorá rezonuje spoločnosťou je strata zamestnania. Niekedy v spojení s faktom, že mnohé úlohy preberajú za nás stroje, roboty, či umelá inteligencia. Vo Veľkom reštarte píšem o tom, že to nemusí byť zlá vec. Teda ak nepredávate svoj čas, ale to, čo vyprodukujete. To sa však dá zariadiť zmenou prístupu k práci – nechoďme do práce na plný úväzok, ale predávajme to, čo vyprodukujeme. A potom čokoľvek, čo nám pomôže produkovať efektívnejšie je užitočné, pretože za menej času vyprodukujeme viac kvalitnejšieho výstupu.

Je to však sci-fi alebo je to niečo, čo môžeme využiť dnes? Poďme sa pozrieť na pár príkladov.

Strojové preklady

Pri tvorbe svojej appky, či písaní blogov alebo mojej novej knihy som využil služby automatických prekladačov. Väčšina z vás pozná Google Translate alebo Microsoft Translator. Existuje však rádovo lepší prekladač a tým je DeepL.com. Dokáže prekladať texty aj dlhšie dokumenty či powerpoint prezentácie. Je lepší pri dlhších textoch – napríklad pri preklade aplikácie trochu tápa, ale ak má kontext a dostatočné množstvo textu, dokáže preložiť celé články alebo aj knihy. Keď sme ho s Pavlom Luptákom skúšali na blogy, skoro nám spadla sánka, keď sme čítali výsledok. Osobne nemám problém písať anglické texty, ale preklad zo slovenčiny do angličtiny bol skoro perfektný. Moja nová kniha bude teda v slovenčine, angličtine a španielčine. Samozrejme, nie je to také jednoduché, že by som napísal slovenskú knihu, klikol “prelož” a hneď vydávam knihu v inom jazyku. Stále je potrebné nájsť človeka, ktorý si knihu prečíta a niečo opraví alebo preformuluje. Ale keď pri iných prekladačoch je potrebné upraviť každú druhú alebo tretiu vetu, pri DeepL treba urobiť možno jednu drobnú úpravu na pár strán.

Prekladatelia nebudú mať čo jesť? Alebo sa na to pozrime opačne – ak sa živíte prekladmi, knihu preložíte za pár minút a potom ju len skontrolujete – či naozaj znamená to, čo prekladaný text. Nemusíte vymýšľať štruktúru viet, dokonca väčšinou ani písať. Ja som anglickú knihu vyprodukoval doslova za pár dní – a to som ju celú prešiel a jemne upravil. Takýto prekladateľ je superproduktívny a navyše nemusí robiť tie nudné práce, ktoré asi nikoho nebavia – ťukať do klávesnice a prepisovať texty.

Skenovanie, fotenie, rozpoznávanie textu

Preklady fungujú aj zo zvuku a z fotografie. Pomocou Microsoft Translatora sa nám podarilo v Panama City porozprávať sa s Číňanom, ktorý nevedel žiadny iný jazyk ako čínštinu. Bol z toho veľmi vytešený…

Podobne si môžeme cez Google Translate pozrieť menu reštaurácie, zistiť podmienky zmluvy alebo pozrieť zloženie exotického jedla pomocou fotoaparátu mobilu.

Rozpoznávanie textu mimochodom funguje tiež veľmi dobre. Nedávno som sedel v kancelárii, kde sme potrebovali prepísať jednu A4 textu. Pani oproti už žhavila prsty, ale ja som povedal, že ručne texty z papiera prepisujú iba amatéri, spustil som TextGrabber a za pár sekúnd som jej poslal celý prepísaný text e-mailom.

Dokonca aj skener sa premenil na appku alebo appky. Ja používam Genius Scan.

Spevákom bez hudobnej výchovy

Na začiatok musím povedať, že kedykoľvek počujem skladbu, v ktorej je evidentne počuť použitie nástroja AutoTune, tak si zapchávam uši alebo púšťam niečo iné. Teda až na jednu výnimku. AutoTune sa používa tak často, že je použitie často priznané a speváci sa niekedy ani len nesnažia spievať, iba rozprávajú a o melódiu sa postará AutoTune. To ale neznamená, že AutoTune nepoužívajú množstvá spevákov tak, aby im len občas opravili malé nepresnosti – a to nepočujeme. Ak máte depresie z toho, že akokoľvek sa snažíte spievať v sprche alebo ráno pred zrkadlom, znie to katastrofálne, poobzerajte sa, či máte pri sebe v racku zapojený blikajúci server s logom firmy Antares Tech. Nemáte? Tak potom je to v poriadku, váš obľúbený spevák alebo speváčka sa bez neho k mikrofónu pravdepodobne ani nepriblíži.

Otázkou je, čo si ceníme na hudbe – talent, remeselnú dokonalosť, tisícky hodín venovaných tréningu alebo výsledok?

Strojová intuícia

Tu by som mimochodom rád podotkol jedno z veľkých nepochopení umelej inteligencie a tým je chladná logika verzus ľudská kreativita a intuícia. V skutočnosti to, čo väčšina súčasných neurónových sietí robí má bližšie k strojovej intuícii ako ku chladnému logickému kalkulu.

V Hackni sa to vysvetľujem takto: “Ľudia často vnímajú počítače ako logické stroje, ktoré vyvodzujú závery z faktov, počítajú prostredníctvom známych postupov a podobne. A keď porovnávame počítače a nás, robíme často rovnakú chybu, porovnávame rozdielne vrstvy. Napríklad ak niekto povie, že “ľudský mozog je výkonnejší ako počítač”, správna odpoveď znie – “ako v čom”. Skúste do sto milisekúnd v hlave vypočítať diferenciálnu rovnicu. Do sto milisekúnd ju ani nedostanete do vedomia. Počítač to hravo zvládne. Na druhej strane neuróny v mozgu robia obrovské množstvo “výpočtov”, ale tie sú na úplne inej úrovni, nemáme k nim priamy vedomý prístup.

Umelá inteligencia (konekcionistická, čo je teraz tá “kúl” časť, ktorá je v exponenciálnom rozvoji) funguje v mnohom podobne ako náš mozog. Dokáže rozpoznávať vzory. Napríklad machine learning modely sú lepšie v rozpoznávaní rádiologických nálezov, prípadne identifikácií glaukómu ako ľudia. Dokážu oveľa lepšie šoférovať ako človek. Oveľa lepšie. Keď sa však spýtate samoriadiaceho auta, prečo niečo urobil, odpovedať nedokáže. Správna odpoveď je “riadil sa intuíciou”. Intuícia machine learning algoritmu môže byť takmer dokonalá, aj keď vieme, že sa takmer vždy dá oklamať, keď chceme.

Takže: človek síce vie “logicky” uvažovať na nejakej úrovni rýchlejšie, ale machine learning je viac doménou “strojovej intuície” ako logického uvažovania.

Ak si položíme otázku “Čo je pre mňa láska”, odpoveď nie je napísaná v algoritme a explicitných znalostiach v našom mozgu, ktoré by hovorili “ukáž mentálny obraz partnera, detí a domácich zvierat”. Je to neurónová sieť, ktorá funguje skôr ako keď sme v stave polospánku a napadne nás koncept lásky – a nám sa spontánne začnú vybavovať obrázky.

Ak umelú neurónovú sieť natrénujeme tak, aby nám ukazovala niečo, čo má skôr bližšie k našej intuícii ako k explicitným algoritmickým pravidlám, prichádza otázka – ak je to moja strojová intuícia, ktorú som postupne naučil na moje preferencie, dokonca na základe mojej intuície, nie explicitných pravidiel, nie je to tak trochu moja intuícia?

Vo vzťahu k umeniu je potom otázka, či sme naozaj lepší ako počítač. Ak umenie prichádza na základe inšpirácie (vstupu) cez naše podvedomie a vedomie až do remeselnej realizácie (pesničky, obrazu, videa, textu, sochy, programu), nie je umelá neurónová sieť rovnakým umelcom? Po remeselnej stránke určite, kľúčovým problémom je stále kreativita.

Písanie textov (blogy, …)

Môj predchádzajúci blog Ako ľavičiar s pravičiarom prevarili polievku bol prevažne napísaný umelou inteligenciou Jarvis. Vo väčšine prípadov vygeneroval dobrý obsah, ktorý súvisel s predchádzajúcim textom a bol dokonca v slovenčine a gramaticky správny. Ak si blog prečítate, zistíte, že je to trochu nuda. Ideálne k téme, pretože si myslím, že naozaj zažívame spoločenskú prevarenú nudu, spojenú so škodlivými vplyvmi centrálneho plánovania.

Ak je však váš umelecký zámer iný ako nuda, pravdepodobne budete chcieť niečo iné. To však neznamená, že nástroj ako Jarvis vám nemôže pomôcť – vyextrahovať z textu hlavnú pointu, opísať nejaké encyklopedické znalosti, napísať nejaký príbeh, preformulovať, vytvoriť, rozšíriť.

Remeselne dobré písanie zvláda aj stroj, čo je ľudské je kreativita a obsah.

Deep fake, obrázky, videá

Rozpoznávanie obrázkov, nájdenie objektov vo videu, rozpoznávanie tvárí a podobne spôsobilo revolúciu v umelej inteligencii – azda najdôležitejším míľnikom boli Generatívne siete (GANN) spolu s novými výpočtovými možnosťami. Deep fake videá vedia vytvoriť video s tvárou kohokoľvek iného.

Podobné triky sa dajú robiť aj so zmenou hlasu, či dokonca generovaním filmov. Snívať, maľovať, meniť štýl vedia iba ľudia? Ani nie:

Známe sú aj nástroje na zmenu pohlavia, veku, rasy, čohokoľvek. Hľadajte a pohrajte sa, ale dávajte si pozor kam nahrávate svoje fotografie.

Tieto nástroje v dnešnej dobe využívajú ľudia na sociálnych sieťach na vytvorenie hyperreality. Môj instagram som dlhú dobu používal na uploadovanie hyperrealistických, ale neskutočných fotografií zo sveta. Na tejto “fotografii” je toho dosť zmeneného oproti realite:

#Nofilter ale veľa AI

Keď som prednášal o tom ako založiť paralelnú spoločnosť po celom svete, chcel som, aby si to ľudia predstavili:

Používal som nástroje ako TouchRetouch a Photoleap. Napríklad odstrániť vizuálny spam na fotke z dovolenky

Na prezentácie poslúžia aj automatické nástroje v Powerpointe, ktoré navrhnú správnu šablónu pre každý slide.

Iné grafické úlohy

Potrebovali ste niekedy nadizajnovať svoje prvé logo pre nový projekt? Služby ako DesignMatic, MarkMaker, Tailor Brands, Looka, či BrandMark (môj najobľúbenejší) vám za pár dolárov vygenerujú logo, často vrátane logo manuálu a rôznych jeho použití (hlavičkový papier, vizitka, …).

Ak potrebujete zväčšiť obrázok, viete, že je potom pravdepodobne v horšej kvalite. Ak nepoužijete umelú inteligenciu, ktorá rozlíšenie “dopočíta” pomocou neurónovej siete. Napríklad Letsenhance alebo Smart upscaler. Alebo ak potrebujete urobiť drobné úpravy, napríklad aj loga.

Hlas

Na hlas máme rozpoznávače aj generátory. Rozpoznávače majú všetky veľké firmy a implementujú ich do svojich hlasových asistentov ako napríklad Siri, Alexa alebo Google Assistant. Existujú aj nástroje do prehliadačov ako napríklad DictaNote.

Na čítanie textu máme napríklad nástroje ako Speechelo. Mimochodom, úvod môjho anglického podcastu je tiež generovaný takýmto generátorom hlasu. Je dobré mať nejakého moderátora na úvod podcastu, ale ja som sám.

Znalosti

Asistenti toho vedia pomerne dosť o svete. Viete sa ich opýtať na kurz Bitcoinu, prípadne iné informácie, vrátane použitia kontextu. Siri napríklad používa aj systém Wolfram Alpha, ktorému môžete dávať aj trochu komplexnejšie otázky. Napríklad sa môžete opýtať koľko ľudí v USA zarába menej ako je priemerná mzda? Wolfram Research spojil pôvodný typ umelej inteligencie s konekcionistickými modelmi a vytvoril tak celkom zaujímavý nástroj na skúmanie štruktúrovaných znalostí o svete.

Záver

Umelá inteligencia nám prinesie predovšetkým benefity. Nahradí nudné úlohy, zlepší naše schopnosti, vylepší produktivitu. A teraz ide preložiť tento blog do angličtiny.

Kľúčom pre to, aby sme z nej vyťažiť maximum je nepredávať svoj čas, ale svoje výsledky. Ako na to sa dozviete napríklad vo Veľkom reštarte.

Umelá inteligencia nepovedala svoje posledné slovo. Bude hľadať chyby, ponúkať druhý názor na naše rozhodnutia či nám pomáhať v programovaní, tvorbe, vyhodnocovaní a skúmaní sveta.