29.7.2025 14:41

Proč nejsem nadšený z umělé inteligence v hudbě

Czech Republic OSA David Solař
AI summary

Umělá inteligence je s námi intenzivně více než dva roky a za tu dobu se stala tématem mnoha komentářů nejen v tomto časopise. Většinou je líčena jako něco, co nám, skladatelům, pomůže k větší efektivitě, kreativitě, co nám bude partnerem a pomocníkem, který za nás bude dělat rutinní a nezáživné úkony. To zní samo o sobě lákavě, navíc z toho čiší odhodlání ukázat, že nejsme žádní zkostnatělí dinosauři, ale jdeme s dobou a vítáme novinky, které dřív než konkurence využijeme ve svůj prospěch. Já se proto pokusím kontrariánsky popsat, co na umělé inteligenci považuji za negativní a co podle mě v extrémním případě může dovést profesi hudebního skladatele až k zániku.

Nahrávky generované během pár vteřin dnešními nejznámějšími programy Suno a Udio jsou v současnosti už téměř nerozeznatelné od většinové hudební produkce. Jediné, co je odlišuje, je špatná zvuková kvalita (způsobená zřejmě tím, že se AI snaží napodobit komprimovaný formát MP3, na kterém je z velké části trénovaná), a navíc se jí zatím nedaří dokonale imitovat lidský zpěv, který má v jejím podání trochu „robotické“ artefakty. Jak dlouho ovšem bude trvat, než se naučí „vyčistit“ nahrávku od digitálního šumu a zlepší vokální projev? Vše je teprve na začátku.

Přesto si dovolím tvrdit, že velká většina posluchačů nerozezná už dnes nahrávku vygenerovanou AI od běžné hudební produkce vytvořené člověkem. A pozná průměrný profesionální hudebník při slepém testu zvukový a hudební rozdíl při poslechu jiného než „svého“ žánru? Pozná rocker, že nahrávka po promptu „big band“ není skutečná archivní nahrávka big bandu? Pozná jazzman, že kapela po promptu „punk rock“ není skutečná? A nechte si pro zajímavost vygenerovat čtyřhlasou fugu a pak si ji nechte jiným programem (kupř. Klangio) z nahrávky zapsat do not. Kdyby výsledek zařadil varhaník na koncertě mezi skladby J. D. Zelenky či F. X. Brixiho, poznali byste, že je to skladba stvořená umělou inteligencí? Nebo klasicistní smyčcový kvartet. Zkuste si to – zkuste si nechat vytvořit jazzové či rockové instrumentální nahrávky. Je to v omezeném množství zdarma, po zaplacení 10 dolarů v množství téměř neomezeném: https://suno.com, https://www.udio.com.

A i kdybyste ještě teď rozdíl poznali, poznáte ho za rok? Za dva? AI se totiž bude s každým dalším updatem stále zlepšovat.

A co pak chudák běžný posluchač? Ten nemá vůbec šanci. Pokud se na něj bude hrnout nekonečné množství takto vytvořených nahrávek, za které streamovací giganty typu Spotify nebudou muset platit, a tudíž je budou ve svých playlistech a nabídkách upřednostňovat, nedělejme si iluze, že se posluchač kriticky odvrátí, tento brak zavrhne a začne vyhledávat kvalitu. Obávám se, že bude konzumovat, co se mu naservíruje, a laťka půjde níž a níž.

I když se mnohým z vás jistě zdá, že laťka už níž klesnout nemůže, současní tvůrci jsou pořád ještě lidé, kteří se snaží ze všech sil a na hranici svých možností mít výsledek co nejlepší – i ty nejkomerčnější nahrávky jsou stále výtvorem živých muzikantů, byť různě disponovaných. Teprve teď, s uměle generovanou hudbou, to začne být ten pravý kalkul a masivní útok na posluchačovu první signální. Zkušenosti vývojářů těchto nových mainstreamových softwarů, kteří téměř všichni prošli coby zaměstnanci Facebookem či Instagramem, jistě přijdou velmi vhod.

To je tedy problém číslo jedna – umělá inteligence sice možná bude mít problém dokonale vystihnout lidské emoce, ale při masivní nadprodukci, která nás čeká, se bude snižovat nejen hudební kvalita, ale současně i posluchačská gramotnost. Navíc hudba nebude už ani trochu vzácná, k jejímu vytvoření postačí zadat tři slova a dvakrát kliknout na displej. A může ji tvořit opravdu každý s mobilním telefonem. Stane se stejným artiklem jako textil z Číny. Sice dramaticky méně kvalitní než poctivá věc od krejčího (existuje vůbec ještě profese krejčího?), ale vlastně docela ucházející a hlavně cenově tak dostupný, že si skoro každý místo jednoho kvalitního kusu raději pořídí dvacet méně kvalitních, protože pět z nich mu bude docela obstojně sloužit. A to oděvy z Číny stále něco stojí. Hudba všech žánrů personalizovaná pro konkrétní posluchače bude úplně zdarma. A upřímně – kdo z vás si v posledních letech koupil nějaké kvalitní triko vyrobené jinde než v Asii? Protože jiná už se skoro ani nevyrábějí – a to se může stát i skladatelům. Nebudou potřeba a hlavně – nikdo jim za jejich práci nezaplatí.

To je tedy problém s posluchači.

Další problém však vidím u samotných skladatelů.

Jak bude skladatel pracovat? Panuje, myslím, všeobecná shoda na tom, že AI bude skladateli pomocníkem a partnerem, bude mu nabízet motivy, harmonie, rytmické struktury, inspirační podněty, zatímco skladatel je bude propojovat a dodávat jim emocionální hloubku. Zrychlí se tím proces tvorby, jelikož AI pomůže s rutinními technickými problémy a markantně tím zefektivní skladatelovu práci.

Já se bohužel obávám, že přesně tohle všechno skladatelům v konečném důsledku uškodí. Trochu mi to připomíná sportovce, za kterého bude někdo jiný trénovat a on jen protne cílovou pásku. Bude sice vybírat tréninkové metody, bude schvalovat (nikoliv vymýšlet) tréninkový plán, bude u tréninku možná přítomen (ale pouze jako pozorovatel v pohodlném křesle) a reálně nacvičí jen převzetí medaile. Takový sportovec časem ochabne, nebude vědět, jak tělo reaguje v jaké zátěži, plavec se odnaučí splynout s vodou, jachtař přestane instinktivně reagovat na vítr, útočník ztratí „čuch na góly“. A noví sportovci už nebudou řešit ani ten tréninkový proces – nebudou mu rozumět, protože umělá inteligence ho sestaví mnohem lépe, než by to zvládli oni, jelikož bude mít mnohem detailnější informace o procesech v těle a dokáže si je dát do souvislosti s náročností tratě na základě dokonalé analýzy všech výkonů všech závodníků na světě.

Tak jako sportovci potřebují trénovat, my, skladatelé, potřebujeme prakticky skládat a namáhat tím hlavu nejvíc, jak jen to jde. Žádná učebnice, tutorial, workshop, dokonce ani samotná docházka do hudební školy nám nedají to, co sezení nad prázdným notovým papírem, popř. před prázdným DAW projektem. K tomu, abyste dokázali profesionálně napsat či zaranžovat smyčcový kvartet, si nestačí pouze přečíst skripta z Berklee College nebo si jen přehrát streamovanou analýzu Malé noční hudby s partiturou. Je potřeba si sednout a mnohokrát to zkoušet – na začátku nemít nic, dělat chyby, gumovat či mazat, vědět o každé notě, proč tam je, aplikovat poznatky z učebnic, zjistit, jak moc záleží na kontextu, slyšet poznámky hráčů (chybu, kterou vám vytkne houslista před orchestrem nebo respektovaný bubeník před celou kapelou, nikdy nezapomenete a už nikdy neuděláte), chápat připomínky instrumentalistů, protože se vyjadřují k detailům, nad nimiž jste dlouho přemýšleli, anebo naopak nepřemýšleli, ale příště už přemýšlet budete, atd. – to jsou jedny z mnoha věcí, které z vás teprve velmi pozvolna udělají profesionála. Tisíce hodin rutinní intenzivní práce, vždycky ale trochu jiné, práce s detaily. Nikoliv pouhé pasivní „vybírání“ toho, co se vám pocitově líbí.

Jaká ale teď bude motivace kohokoliv, aby se namáhal s psaním smyčcového kvartetu, přemýšlením o každé notě, když AI totéž skvěle udělá během pár vteřin? A udělá to mnoha způsoby – pokaždé správně – a dost často lépe, než je schopná většina z nás – a my si jen vybereme verzi, která se nám líbí.

Na základě vlastních zkušeností bych řekl, že lepší skladatele z nás dělá právě důkladné poznání toho, co tvoříme. Pinožení s každou notou. Přepisování, usínání s myšlenkou, že to ještě není dobré, že to tentokrát asi nezvládnu udělat tak dobře jako minule. Vstávání s možným řešením, hledání toho, co jsme toužili zachytit, zápolení s tím – to je ten proces, kterým se pomalu, rok od roku, zlepšujeme.

A tohle zmizí. Jen si vybereme, co nám počítač nabídne, a když to nebude ono, necháme ho to předělat a budeme klikat tak dlouho, dokud nebudeme spokojení – nebo dokud nám náš uondaný mozek neřekne, že takhle to stačí. Což je mimochodem to, co nás připraví o práci v audiovizi – když producenti řeknou „to stačí“, hlavně že je to rychle a zdarma.

Pro své vlastní potěšení si samozřejmě můžeme „postaru“ skládat dál, nikdo nás k používání AI nenutí. Konkurovat jí však opravdu asi nedokážeme – v rychlosti, kvantitě a možná často ani v kvalitě. Bude update od updatu lepší a lepší, pojme veškerý odkaz klasické i populární hudby, zanalyzuje partitury, jejich nahrávky, během vteřiny si projde každý interval v každém partu každé skladby na světě, porovná zvuk jednotlivých nástrojů, orchestrů, sólistů, kapel a bude tohle všechno lépe a lépe zasazovat do kontextu, bude si osvojovat emoce z každé hudby v každém filmu, reklamě, počítačové hře, zjistí, co si lidé nejraději pouštějí, k čemu se vracejí, která místa opakují. A bude mít k dispozici vzorek celého lidstva, které hudbu konzumuje převážně digitálně a on-line.

Budoucí nezvratnou integrací AI do DAW a notačních programů ji my, skladatelé, dokonce sami naučíme, jak pracujeme, co a jak používáme, dáme jí pod záminkou spolupráce veškeré své know-how, ukážeme jí vše, co sami umíme, jak přesně pracujeme – analýza nás, skladatelů, bude stoprocentní.

A znovu se vrátím k tomu, že si přece můžeme skládat jen pro radost a z vnitřního puzení. Nebude to však hodně demotivující pocit, že ať vytvoříme cokoliv, skoro nikoho to nebude zajímat? Naše skladby nebudou mít pro většinu lidí téměř žádnou hodnotu a nikdo je od nás nebude potřebovat, každý si sám vytvoří takovou hudbu, jakou bude chtít, posluchači, střihači do filmů, vývojáři do her, kreativci do reklamních spotů – vše během pár vteřin; všude jí bude nekonečná záplava. A co si budeme nalhávat, žádná nostalgie posluchačů po autorech už není ani dnes – zkuste najít na internetu autory hudby jinde než na Wikipedii, Supraphonline či OSA Search. Zkuste si sami najít deset největších hitů posledních deseti let, které znáte a u kterých není autorem sám interpret – a doplňte k nim autory. U kolika písniček se vám to podaří? A zkuste to samé zadat někomu, kdo není skladatel.

Trochu záměrně jsem možná zašel do extrémů, ale myslím, že bychom měli o AI přemýšlet i tímhle způsobem. Nemám samozřejmě tušení, co z mých pochmurných scénářů se naplní, nebo zda se fatálně mýlím a za deset let se tomu od srdce zasmějeme.

Nemůžu se však zbavit pocitu, že AI změní náš svět mnohem víc, než se stále ještě i teď zdá. Naštěstí s tím nemůžeme nic dělat, takže se tím nemusíme trápit, alespoň tedy zažijeme veliké dobrodružství coby přímí účastníci největší změny v dějinách hudby a možná i moderní lidské civilizace.

Ale třeba jsem úplně mimo, v což upřímně doufám, a všechno, co jsem napsal, je jen taková hříčka patřící do mého oblíbeného žánru science fiction.

http://www.osa.cz/blog/proc-nejsem-nadseny-z-umele-inteligence-v-hudbe