Intentem esbrinar com funcionen les eines que generen música amb IA, i quines potencials utilitats o perills poden suposar

La intel·ligència artificial en la música és una eina o una amenaça?

En l’últim any, les eines en línia, gratuïtes i obertes al públic que utilitzen intel·ligència artificial han proliferat i s’han estès. N’hi ha de tota mena i per a tot, i això inclou, evidentment, també per fer música. 
Text: Èlia Gea. Fotos: Juan Miguel Morales.
SonuUdioLoudly o, fins i tot, Canva, són algunes de les plataformes que utilitzen l’IA generativa per crear música. Algunes, podrien estar —per ara, almenys, i potser per limitacions pròpies— més enfocades a ser una eina per a altres creadors; d’altres, sembla que pretenen ser competència dels artistes. Intentem esbrinar com funcionen, i quines potencials utilitats o perills poden suposar parlant-ne també amb el director de l’Observatori d’Ètica en Intel·ligència Artificial de Catalunya (OEIAC), Albert Sabater.
 

LA INTEL·LIGÈNCIA ARTIFICAL COM A EINA

Canva, coneguda especialment com una eina de disseny en línia fàcil per a principiants, ha habilitat una manera de poder generar ‘bandes sonores’ per als vídeos que s’hi creïn. És una de les més limitades, però permet crear fons instrumentals de fins a 300 segons, escollint-ne el mood o atmosfera, gènere i temàtica.
 
Loudly, tot i que permet escollir més paràmetres —potser els més complexes i específics— no genera cançons ‘pop’ amb lletra. Aparentment més enfocada com a eina per a músics, permet escollir el gènere musical del tema, la tonalitat, i fins a 7 instruments —bateria, percussió, teclat, sintetitzador, veu, guitarra, etc.—, així com l’energia, l’estructura i el tempo.
 
La intel·ligència artificial, assegura el director de l’OEIAC de la Universitat de Girona, Albert Sabater, “pot ser molt útil a nivell d’abstracció, per portar-nos a llocs on no hauríem pensat d’arribar, donar-nos idees o ampliar-nos-les, o afegir elements al procés creatiu”. Tot i així el professor insisteix en què “mai hem de confondre què li deleguem a aquestes tecnologies, perquè l'IA no crea res, no té agència creativa”. Tot i així, eines com Udio o Suno sí que sembla que pretenguin simular tenir agència creativa i competir amb altres creadors. 


Cançó creada amb l'IA generativa Udio amb els paràmetres: "pop" i "indie", i una lletra introduïda manualment.
 
Udio, en la seva versió gratuïta permet crear talls instrumentals o cançons de trenta segons i escaig. Els camps que permet establir per generar la peça passen pel gènere o diverses ‘etiquetes’ o paràmetres, la lletra (que pots introduir manualment o que l’autogeneri l’IA), i altres aspectes com 'Prompt strength', 'Lyrics strenght' o la qualitat. En general, si no se li especifica quin tipus de veu i en quin idioma, per defecte, serà masculina i en anglès.

Suno, pel seu costat, et permet donar directrius no estipulades, sense regir-se per tant per uns paràmetres concrets i donant, d’aquesta manera, més llibertat creativa. Alhora, però, per fer-ne un bon ús cal aprendre’n el llenguatge, i és que la manera en com s’hi expressa el que un demana canvia el resultat. Les cançons que genera en la seva versió gratuïta són al voltant de minut i escaig.


Cançó creada amb l'IA generativa Suno amb els paràmetres: "A pop melody wiwith an autotune voice and urban beats, and with a lyric sung in Catalan about love and roses”.
 
La qualitat dels resultats en la versió gratuïta dependrà, especialment amb Suno, de l’expertesa de qui n’escrigui els paràmetres, però és evident que la millora ha estat abismal comparada amb altres eines d’intel·ligència artificial que anteriorment ja havien permès la generació de música. De fet, el fenomen no és nou, i a Europa des del 2020 se celebra l’AI Song Contest, una mena d’Eurovisió amb cançons generades per Intel·ligència Artificial. El 2021, s’hi va presentar un equip català, AIMCAT, format per diversos músics -entre els quals Halldor MarJuRicard PuigdomenechXabi Strubell, Laia BoschBerta Bahr i Pere Pèries- escriptors i desenvolupadors de software. Però segons explicava Pèries en el seu moment, el procés de creació de la cançó que hi van presentar va ser molt més complex i llarg comparat amb el que ara ofereixen eines com Suno o Udio. De fet, fa 3 anys assegurava que l’Intel·ligència Artificial no era capaç de crear una cançó sola. I malgrat que ara li calen els paràmetres que indica una persona física, i accés a un repositori de cançons fetes per a altres artistes, és innegable que l’avenç tecnològic ha estat meteòric.
 

LA CAPACITAT CREATIVA DE L'IA

Al tipus de sistema d’intel·ligència artificial que utilitzen aquestes plataformes se’l coneix com a “IA generativa”. El nom descriu en gran part el seu funcionament: és el tipus d’IA que pot generar text, imatges, o en aquest cas cançons, entre altres, a partir de comandaments i l’”aprenentatge” que ha dut a terme a través dels patrons que ha reconegut amb dades d’entrenament que, després, reprodueix.
 
El control sobre el que generarà, per tant, escapa una mica de les nostres mans i, segons Albert Sabater això és el que ens fascina com a societat, perquè “té una part d’imprevisibilitat que associem a la originalitat”. Però l'IA, realment no crea res, vol deixar clar Sabater, sinó que refregeix allò que té a l’abast i ha ‘après’. Tot i que admet que no dista molt a l’aprenentatge o a certs processos de creació humans, assegura que “nosaltres no ho fem de la mateixa manera: no funcionem com una màquina que pot fer una predicció estadística de quina serà la propera lletra o la pròxima nota. El procés de creació humà és bastant més complicat que això. La creació és una qüestió que té molt a veure amb el procés, no amb el resultat. I a les empreses que estan al darrere de moltes de les IA generatives només els interessa el resultat.”


Cançó creada amb l'IA generativa Udio amb els paràmetres: "pop”, "indie", "female vocalist", "catalan language". 

“No podem atribuir a l'IA capacitats que les màquines mai tindran, perquè no tenen consciència, i com no tenen consciència no poden establir una relació amb altres persones i, per tant, no poden tenir empatia. I això en la creació és fonamental”, resumeix Sabater. “Totes les músiques tenen un context i parteixen d'una experiència. L'IA no té res de tot això: no té una relació amb l’entorn i relacions socials que pugui fer que aquesta impremta humana es pugui traslladar a través de les ones cap als oients”. Això, per al director de l’OEIAC és el més important a recordar. “Si a la gent li dius que l'IA té consciència, experiència i empatia, al final la gent ho creurà, però mentida. Això és el que se'n diu AI hype “.
 
Tot plegat, a priori, podria restar qualitat i originalitat a la música generada amb IA. I aquest és el dilema que Sabater considera que tenim per davant: “Volem molta música i de poca qualitat? Això és el que ens hem de plantejar. Si una persona que té prou poder com per crear una demanada de mala música a través de l'IA generativa la vol crear, la crea. I l’única manera de defensar-nos contra això és a nivell de consciència col·lectiva."
 

SI NO VOLEM CANÇONS GENERADES PER IA, QUÈ HEM DE FER?

Segons apunta el director de l’Observatori d’Ètica en Intel·ligència Artificial de Catalunya, si els artistes volen defensar els seus drets davant l’adveniment de les cançons generades per IA s’ha de crear una cobertura legal. “Totes aquestes persones que han fet creacions musicals han de demanar que existeixi un consentiment per utilitzar les seves obres”. D’aquesta manera, i amb un marc legal que ho empari i demani un compliment de transparència a les empreses que treballen amb aquesta IA generativa, es podria saber i decidir si es vol o no que les pròpies creacions puguin formar part del corpus d’aprenentatge de l’eina d’intel·ligència artificial. “S’han d'establir els mecanismes de compensació, també. Hi ha creadors que diran que la seva música no la volen posar en el corpus de l’IA, i tindran el seu dret, i altres que diran que no hi ha cap problema, però com a mínim tot això cal ordenar-ho. I actualment és una selva”, admet Sabater.
 

 

Cançó creada amb l'IA generativa Suno amb els següent paràmetres: "a song in Catalan language about the dangers of artificial intelligence, in a pop urban style".
 

De fet, des del parlament europeu ja fa temps que s’està treballant per regular-ne l’ús i recentment ha entrat en vigor la Llei d’Intel·ligència Artificial de la Unió Europea. Tot i que la legislació no contempla l'IA generativa —com és ChatGPT o les IAs per generar música— com a 'alt risc', sí que la sotmet a uns requisits de transparència i a complir amb la legislació europea sobre els drets d’autor. D’aquesta manera, les empreses responsables d’aquesta mena d’eines hauran de revelar que el contingut que generin està fet amb IA, s’haurà d’evitar que pugui generar continguts il·legals, i haurà de publicar “resums de les dades protegides per drets d’autor utilitzats per l’entrenament”. D’aquesta manera, per una banda, es busca evitar enganys i contingut fake, però també oferir una potencial protecció dels artistes i els seus drets d’autor.
 
En el camp de la imatge i el vídeo, explica Sabater, són ja diversos els artistes a nivell internacional que s’estan organitzant per demandar empreses d’IA generativa per tal que no puguin utilitzar les seves creacions. Paral·lelament, molts artistes estan també corrompent les obres que tenen penjades a internet, o traient-les directament, per tal que l'IA no en pugui fer ús. “És una actitud bastant provocadora”, valora Sabater, “però a la vegada efectiva”.
 
A principis d’abril, de fet, l’organització sense ànims de lucre Artist Rights Alliance —que defensa músics, compositors i intèrprets en el panorama digital— va emetre un comunicat en què reclamaven “a tots els desenvolupadors d'IA, empreses tecnològiques, plataformes i serveis de música digital que es comprometin a no desenvolupar ni desplegar tecnologia, contingut o eines de generació de música d'IA que devaluïn o substitueixin l'art humà dels compositors i artistes o ens neguin una compensació justa per la nostra feina.” El comunicat el signaven més de 200 artistes, entre ells, Billie Eilish, Camila Cabello, Diana Krall, Imagine Dragons, J Balvin, Jon Bon Jovi, Jonas Brothers, Juanes, Katy Perri, Norah Jones, Sam Smith, Mumford & Sons, Nicki Minaj, Luis Fonsi i artistes de l’estat com Lola Índigo, o Manuel Carrasco.
 


Però què passa si l'IA deixa d’utilitzar la música de tots aquests artistes? Ara per ara, ja està ‘entrenada’ amb la música existent, però arribaria un moment en què hauria de seguir aprenent amb cançons generades amb IA. Això es coneix com a col·lapse del model. “A les empreses que creen aquestes IAs generatives no els interessa gens. Això fa pensar que volen arribar a un acord amb els artistes i buscar manera de compensar-los”, explica Sabater. “Però mentre no s’arriba a aquest acord, se segueixen enriquint”.
 
Per al director de l’OEIAC, la pregunta és clara: “Els músics d'aquest país, i de tot el món, volen simplement ser creadors per a la intel·ligència artificial o volen ser creadors per si sols? “. De fet, opina que, com a societat, “hem de ser capaços de dir que utilitzem l'IA per millorar la nostra creació, la nostra activitat o les nostres capacitats, però no per substituir-les i ser més dependents d'una altra entitat, d'una altra empresa. Si fem això, és un mal negoci per a la humanitat.”