Depuis plusieurs années, on trouve sur le net des services de génération de musique basés sur l’intelligence artificielle (IA) qui permettent de réaliser des chansons complètes avec texte et musique.
L’un de ces services est Suno.com, qui propose désormais une version 4 de son outil dont les résultats sont assez surprenants. Nous vous les montrerons plus bas dans cet article.
Existe-t-il des différences à l’écoute entre musiciens humains et IA ?
Pour des spécialistes de la radio in-store comme Music Admix, il reste toujours facile de déceler le côté IA dans la chanson, de la même manière qu’il est très facile de faire la différence entre un batteur qui tape réellement sur sa grosse caisse ou ses cymbales, et une boite à rythme qui délivre électroniquement une rythmique.
La différence la plus évidente, c’est celle de la perfection : un musicien humain tel qu’un batteur ou un percussionniste ne sera jamais exactement parfait à la micro-seconde, contrairement à une boite à rythmes ou un logiciel de génération de boucles musicales qui tombe toujours exactement parfaitement sur le tempo. La différence à l’oreille est extrêmement minime, en tout cas lorsque l’on parle d’un musicien professionnel par définition très entraîné.
Mais cette différence suffit pour distinguer le rythme généré automatiquement, parfaitement régulier comme celui d’une machine, et le rythme humain qui est très légèrement irrégulier : c’est cette irrégularité qui donne un côté vivant, une sorte de signature humaine que même l’auditeur non chevronné sera capable de reconnaître.
Bien sûr, il est facile pour les algorithmes de simuler cette variation en ajoutant un petit je-ne-sais quoi aléatoire qui rendra la chanson créée automatiquement aussi « irrégulière » que celle du groupe de musiciens humains. Tout est imaginable. On peut même imaginer un outil d’IA qui ajoute des fausses notes, des glissés un peu ratés sur un accord de guitare, une touche enfoncée d’une façon un peu moins décidée que les autres sur un clavier. Tout peut s’imaginer.
Dans un test récent publié par la BBC, on a joué deux voix lisant un extrait de texte identique à des auditeurs. Les deux voix comprenaient des respirations et des hésitations. Celle qui était le plus irrégulière était l’IA, trompant ainsi une bonne quantité des auditeurs : 50 % des personnes étaient incapables de décider quelle voix est la voix synthétique.
Test de la qualité du résultat : les chansons de Suno
Revenons à Suno. Nous avons testé l’outil qui demande, comme la plupart des modèles basés sur des données massives, d’écrire un texte.
Dans notre premier essai le test s’est fait en anglais sans aucune mention de style musical. Le résultat ? Un texte complet avec des rimes un peu mièvres mais qui fonctionnent quand même quand on les chante. « Bright lights city nights, Shoppers groove in the store. Tunes flow you feel alright, Oh you’re coming back for more ».
Le texte utilisé pour générer cette chanson ? « Crée une chanson à propos de Music Admix, une solution de radio in-store dédiée aux commerçants. Place l’accent sur l’expérience client et comment la musique l’améliore ».
Temps de travail environ 15 secondes.
Temps de génération de la musique complète avec le texte et la voix ? Moins d’une minute.
Le résultat? Vraiment pas mal du tout. Vous pouvez écouter la chanson intitulée « Earpiece Delight » (un titre créé par la plateforme )sur le profil Suno de Music Admix. Suno fournit en plus une image pour illustrer la chanson, qui est loin d’être ridicule.
Notre second essai a repris le même schéma, mais en demandant au système de créer un texte en français avec une musique de type chill-out lounge un peu jazzy.
Côté texte, ce n’est pas du Baudelaire. « Dans la boutique claire et chic / Une ambiance bien spécifique / Les mélodies flottent délicates / C’est Music Admix qui s’éclate / Quand la radio diffuse ses sons / Les clients restent, c’est démonstration / Un sourire, un achat de plus / Le secret, c’est la musique en plus / [Chorus]Music Admix, c’est bien plus qu’un son / C’est la magie de l’accord parfait / Ça rend chaque moment si bon/ Et les ventes s’envolent, enchantées / Dans les rayons, douce langueur / Les consommateurs trouvent leur bonheur / Les notes glissent, l’air se fait léger /Music Admix sait tout envouter » etc.
Une chose est certaine, l’IA a parfaitement compris la demande mais pour le prix Nobel de poésie il faut attendre encore un peu. Côté musique, quelques notes de synthé façon orgue sixties et une voix féminine plutôt agréable qui chante relativement correctement. Ecoutez la chanson intitulée « La mélodie des boutiques » sur notre profil Suno pour découvrir le résultat.
Troisième et dernier essai avec un texte (ou prompt) toujours aussi simple, demandant cette fois-ci une voix masculine de type crooner. Côté texte on reste concentré sur le sujet mais le pouvoir évocateur est minime. Jugez plutôt :
[Verse]
Dans la boutique claire et chic,
Une ambiance bien spécifique,
Les mélodies flottent délicates,
C’est Music Admix qui s’éclate.
[Verse 2]
Quand la radio diffuse ses sons,
Les clients restent, c’est démonstration,
Un sourire, un achat de plus,
Le secret, c’est la musique en plus.
[Chorus]
Music Admix, c’est bien plus qu’un son,
C’est la magie de l’accord parfait,
Ça rend chaque moment si bon,
Et les ventes s’envolent, enchantées.
[Verse 3]
Dans les rayons, douce langueur,
Les consommateurs trouvent leur bonheur,
Les notes glissent, l’air se fait léger,
Music Admix sait tout envouter.
[Bridge]
Quand la radio fait son ballet,
Il n’est plus question de s’en aller,
Chaque refrain chante et séduit,
Provoquant l’envie et l’appétit.
[Chorus]
Music Admix, c’est bien plus qu’un son,
C’est la magie de l’accord parfait,
Ça rend chaque moment si bon,
Et les ventes s’envolent, enchantées.
Côté voix et musique, pas grand-chose à redire. On pensait à une voix un peu plus crooner mais celle-ci n’est pas mal du tout. La partie musicale fonctionne finalement assez bien, même si ce n’est pas de la plus grande inventivité.
Certes, pour notre directeur artistique, ancien musicien professionnel qui a fait partie de plusieurs tournées internationales avec des grandes vedettes de la chanson, ce niveau musical est abominable, mais nous n’avons pas tous son oreille experte. Au département marketing, par exemple, nous avons trouvé que c’était franchement pas mal du tout. Vous pouvez là encore vous faire vous-même une idée du résultat en écoutant la chanson « La magie de Music Admix « sur notre profil Suno.
Quel avenir pour les musiciens professionnels ?
L’une des caractéristiques de l’offre Music Admix, c’est de fonctionner avec des titres musicaux qui appartiennent au catalogue général, depuis les Beatles et Sheryl Crow jusqu’à ZZ Top en passant par Justin Bieber, Beyoncé, Taylor Swift, bref tous les artistes connus et appréciés du public. Nous recommandons la plupart du temps à nos clients d’éviter la musique libre de droits, car cette dernière ne déclenche pas chez les clients la même reconnaissance immédiate et la même association à la marque. En matière de marketing musical, il ne suffit pas que la musique soit simplement plaisante : elle doit aussi provoquer des connexions positives dans l’esprit du client.
Le même raisonnement s’applique à la musique générée par Suno : bien qu’elles soient très « propres » (malgré la niaiserie des textes); les chansons générées ne présentent rien de particulier, aucune aspérité ou spécificité qui les rend reconnaissable. Diffuser de telles chansons dans un commerce n’est pas forcément autorisé, car la licence Suno de base interdit l’exploitation commerciale directe ou indirecte des chansons produites. Cet obstacle est contourné si on utilise une licence de plus haut niveau.
Dans ce cas, ce type de musique vaudrait-il le coup d’être diffusé dans un magasin ? La réponse est un non franc et massif. Même si l’on utilisait Suno pour réaliser simplement une chanson de marque qui soit passée à intervalles réguliers pour initier une reconnaissance marque / audio, le décalage entre une production commerciale d’un artiste connu et le résultat issu de l’IA reste trop grand.
Un outil puissant pour créateurs audio
Au final, nous estimons que les titres musicaux générés directement par la plateforme ne sont pas d’un niveau suffisant pour être utilisés dans un cadre professionnel, passé l’effet de surprise. Mais si une personne se sert de ces outils avec précision pour générer exactement ce qu’elle a en tête, en ajoutant un solo de saxophone ici ou un riff de guitare là, peut-être en utilisant des paroles qu’elle aura inventées, alors on peut imaginer que le résultat pourrait être à la hauteur d’un titre issu des grands catalogues.
Dans ce cas, l’intelligence artificielle remplit son rôle en venant simplement accélérer et augmenter les capacités humaines, sans exiger par exemple une connaissance des lois de la composition harmonique.
Bien entendu; comme pour les autres outils le risque est de parvenir à une uniformisation de la production. Si les outils d’IA créent à partir de ce qui existe, et que leur création est elle-même ajoutée à ce qui existe pour prédire les générations suivantes; on finira par assister à un écroulement du système.
Pour l’instant on n’en est pas encore là. Contentons-nous de suivre avec étonnement les évolutions des systèmes de création musicale par l’IA. Et si vous avez besoin d’une solution de radio instore pour vos magasins, n’hésitez pas à nour contacter, nous aurons le plaisir de vous présenter notre solution.