Il est vrai que ce logiciel pour smartphone est étonnant, capable, après avoir enregistré dix secondes de musique, de retrouver le nom d’une chanson parmi une gigantesque base de données de plus de 8 millions de titres, de tous styles et pays d’origine. Le secret de Shazam ? Un système d’analyse automatique des morceaux de musique, résumée dans un brevet de 2003 signé par Daniel Culbert et Avery Wang (ce dernier était en 2012 directeur scientifique de l’entreprise Shazam).
Chaque titre de la base de données est analysé et transformé en “spectrogramme”, c’est-à-dire un diagramme en 3D défini par le temps, la fréquence et l’amplitude.
Un choix par pics d’amplitude
Shazam ne s’intéresse qu’aux pics d’amplitude qui apparaissent dans le spectrogramme, et les considère comme des points, dont les coordonnées sont le temps et la fréquence : ce sont les “empreintes” de chaque titre.
Lors de l’identification du morceau, l’extrait est transformé de la même manière, avant d’être comparé à la bibliothèque du logiciel. Si Shazam est si performant, c’est grâce à ces empreintes qui permettent de transformer une chanson de quatre minutes (environ 4 Mo en format MP3) en texte de quelques kilo-octets. Résultat : la base de données est considérablement restreinte, et les comparaisons avec les 8 millions de titres, ultrarapides.
Shazam est efficace même dans le brouhaha
Le système est tellement fiable qu’il fonctionne même dans l’ambiance bruyante d’un bar ou d’une fête, accusant alors seulement quelques secondes de retard. Cependant, Shazam ne peut reconnaître que les titres qu’il a analysés très en détail et ne peut donc être utilisé en concert, car le morceau joué sur scène correspond bien peu souvent au morceau enregistré en studio.
P.O.
D’après S&V n°1116
> Lire également :
- Un smartphone suffit pour fabriquer son clone numérique (avatar) en 3D
- Smartphones : ils sont capables de donner l’alerte en cas de séisme
- Ce système met en sourdine le smartphone si le cerveau est trop occupé
- Les smartphones réduisent le temps de sommeil des enfants
> Lire également dans le site des Grandes Archives de Science & Vie :
- Moteurs de recherche : voici qu’ils légendent les images – S&V n°1169 – 2015. Grâce à la fusion de plusieurs technologies IA, les chercheurs de chez Google ont conçu un système qui reconnait et légende les images.
- Reconnaissance faciale : le triomphe de l’intelligence artificielle – S&V n°1162 – 2014 – Le domaine de l’Intelligence artificielle progresse à très grande vitesse grâce aux ressources fournies par les réseaux numériques. L’exemple avec la reconnaissance automatique des visages.
- Google, le nouvel Einstein – S&V n°1138 – 2012 – Depuis une dizaine d’années, la plupart des données qui circulent dans la Toile sont conservées dans les serveurs des grandes firmes d’internet. Grâce à cela, nous possédons une mémoire détaillée des activités humaines et des évènements passés et présents… que les scientifiques exploitent pour pister des épidémies, découvrir de nouvelles lois, soigner des maladies. La science des Big Data est en route.