Transcription audio BangYourCV : 12 minutes de vocal brouillon transformees en CV calibre
Quentin Leininger
Fondateur de BangYourCV
Il y a une feature BangYourCV dont personne ne parle et qui sauve des heures a chaque utilisation. Elle vit dans un onglet discret, a cote du Builder. Son nom : Transcription audio. Son role : transformer un monologue parle, meme brouillon, meme hesitant, en CV structure, calibre ATS et pret a exporter. Personne ne la mentionne parce qu'elle sonne simple. Elle ne l'est pas. Elle change la facon dont tu fabriques ton CV.
Le probleme que ca resout vraiment
La majorite des gens ecrivent mal leur CV. Pas parce qu'ils sont mauvais. Parce que l'ecrit forme un filtre cognitif qui edulcore les idees. Tu te censures. Tu cherches le "bon" mot. Tu relis, tu recommences, tu finis par ecrire la phrase generique qui tue l'interet.
En parlant, tu deroules. Tu raconte l'histoire. Tu cites des chiffres sans y penser ("ah ouais, on etait 12 dans l'equipe, et le projet a genere environ 800k CHF en 2 ans"). Tu mentionnes des outils que tu oublierais a l'ecrit ("on utilisait Salesforce, ecommerce Shopify, et j'avais mon dashboard Looker Studio custom"). Tu donnes le contexte emotionnel ("c'etait dur parce que mon chef etait en conge maternité 6 mois et j'ai du tenir seul").
La Transcription audio capture tout ca. L'IA trie, reformule, structure. Tu finis avec un CV qui ressemble a la maniere dont tu parles, mais calibre pour les RH.
Comment c'est concu (sous le capot)
Tu ouvres l'onglet Transcription audio depuis l'interface principale de BangYourCV. L'ecran te propose deux modes :
Mode guide : l'IA te pose des questions dans un ordre precis. Parle-moi de ton premier job. De combien etait l'equipe. Quelles etaient tes taches. Quel a ete ton plus gros achievement. Et ainsi de suite, experience par experience. Tu repond a haute voix, tu peux faire des pauses, tu peux dire "stop" et reprendre plus tard.
Mode libre : tu parles de ton parcours comme tu veux, dans l'ordre que tu veux, pendant la duree que tu veux. L'IA te laisse derouler, puis elle structure a posteriori.
L'audio est transcrit en temps reel via un modele Whisper fine-tune sur le francais suisse (reconnaissance des accents romands, valaisans, genevois, tessinois). L'IA tourne sur tes phrases et reconstruit une representation structuree : titres de poste, dates, responsabilites, chiffres, resultats, competences inferees.
Puis elle injecte tout ca dans un CV Builder que tu peux relire, ajuster, transformer en PDF LaTeX final.
Cout : 3 credits par transcription, incluant le nettoyage, la structuration et l'injection dans le Builder. Aucune limite de duree jusqu'a 25 minutes par session.
Le cas de Lucia, 34 ans, educatrice sociale a Geneve
Lucia est dyslexique depuis l'enfance. Elle a 11 ans d'experience en accompagnement de personnes en situation de precarite et de mineurs non accompagnes. Son CV ecrit est, de son aveu, une source de stress permanente. Elle doit faire relire chaque version par une amie. Elle y met 3 heures pour un brouillon qu'elle n'aime pas.
Elle ouvre la Transcription audio un lundi soir. Elle selectionne le mode guide. L'IA demarre : "Lucia, parle-moi de ton dernier poste. Quelle etait la structure ? Quel etait ton role ?" Elle repond a haute voix pendant 12 minutes, en marchant dans son salon, parfois en cherchant un mot, parfois en riant d'elle-meme. Elle ne se censure pas.
Extraits de ce qu'elle dit (transcription brute) :
"Alors euh, je bosse au foyer du Petit-Lancy depuis 2019, on accueille des ados entre 14 et 18 ans qui ont des soucis familiaux, on est 6 educs, un chef d'equipe, et puis... pardon j'ai perdu le fil, euh... oui donc j'ai la charge d'une unite de 8 jeunes... pendant le Covid j'ai pris le relais du chef qui etait en arret, j'ai tenu le suivi de 22 jeunes sur 3 mois, c'etait les plus dures semaines de ma vie, mais du coup j'ai appris a gerer les renvois a l'aide sociale, les rendez-vous tribunal, les demandes de permis aupres du SEM..."
12 minutes plus tard, elle clique "Fin". L'IA travaille 38 secondes. Elle recupere le Builder avec :
Titre : Educatrice sociale senior, foyer pour mineurs en difficulte
Expérience 1 : Foyer du Petit-Lancy (Geneve) - 2019 a aujourd'hui
Bullets generes (version structuree) :
Competences inferees : accompagnement psychosocial, gestion de crise, coordination interinstitutionnelle, mediation familiale, redaction rapports sociaux.
Lucia relit. Elle corrige deux dates (l'IA a suppose 2020 au lieu de juin 2020 sur un bullet, elle ajoute la precision). Elle ajoute un mot cle qui manquait (protection de l'enfance). En 18 minutes au total (12 de parole + 6 de relecture), elle a un CV qu'elle n'avait pas reussi a produire en 3 heures d'ecriture.
Bang Score avant : 54/100 (son CV Word 2023). Bang Score apres transcription : 81/100.
Les 4 typologies d'utilisateurs pour qui ca change tout
Typologie 1 : les dyslexiques et personnes avec troubles de l'ecrit. Environ 8 a 10% de la population. Pour elles, taper un CV est un cauchemar. Parler est naturel. La transcription leur rend le pouvoir de se presenter.
Typologie 2 : les metiers du care, de l'artisanat, du terrain. Un soudeur, un boulanger, un paysagiste, une aide-soignante : ces profils ont souvent un CV ecrit tres pauvre par manque d'habitude, mais un discours professionnel riche. La transcription capture la richesse qu'ils ne savent pas ecrire.
Typologie 3 : les gens presses. Tu as une offre qui ferme demain, tu roules 30 minutes pour aller a un rendez-vous. Au lieu de taper a une main en conduisant (don't), tu parles dans ton micro, tu as ton CV a 85% en arrivant.
Typologie 4 : les perfectionnistes qui s'auto-censurent. Si tu es le genre a reecrire 14 fois une phrase, la transcription te force a avancer. Tu ne peux pas revenir en arriere pendant que tu parles. Tu avances. Ca casse le blocage.
La precision de la transcription (ce qu'on mesure)
On a teste la Transcription audio sur 50 sessions reelles, toutes en francais romand ou europeen. Metriques :
Ces chiffres progressent encore. Le modele Whisper francais est re-entraine tous les 3 mois avec des samples utilisateurs (opt-in uniquement). La version avril 2026 est 7% plus precise que la version de janvier.
Les 5 cas d'usage ou la Transcription ecrase l'ecriture manuelle
Cas 1 : description de projets techniques complexes. Un dev qui doit decrire son architecture microservices et son pipeline CI/CD ira plus vite en parlant. L'IA capte le vocabulaire technique.
Cas 2 : parcours atypique avec beaucoup de micro-projets. Un freelance qui a fait 23 missions en 4 ans : en parlant, il deroule. En ecrivant, il oublie la moitie.
Cas 3 : reconversion. Un professeur qui devient chef de projet : en parlant, il fait naturellement les ponts entre ses anciennes et nouvelles competences. En ecrivant, il se bloque sur le "comment traduire".
Cas 4 : jeunes diplomes avec projets scolaires multiples. En parlant, ils citent 6 projets. En ecrivant, ils en gardent 2 parce qu'ils ne savent pas comment les mettre en valeur.
Cas 5 : multi-lingue. L'IA detecte le francais, l'allemand suisse, l'italien, l'anglais. Tu peux melanger (certains bullets en FR, d'autres en EN). Le CV final est genere dans la langue que tu choisis au moment de l'export, l'IA traduit en interne.
La question de la preparation avant d'enregistrer
Ne preare pas de script. Ca casse le benefice. La transcription marche parce que tu parles naturellement, pas parce que tu lis.
Ce que tu peux faire en 5 minutes avant de parler :
Apres, tu parles libre. Tu laisses les chiffres et competences sortir naturellement pendant ton recit. Si tu oublies un chiffre, tu l'ajouteras a la relecture. Pas de stress.
La combinaison Transcription + Refonte IA (le combo cache)
Scenario type : tu fais une transcription de 12 minutes qui produit un CV brut a 80/100 Bang Score. Tu lances ensuite la Refonte IA sur ce CV avec le brief d'une offre cible. Le CV passe a 90/100 en 90 secondes, avec les mots-cles specifiques de l'offre injectes. Cout total : 3 credits transcription + 2 credits refonte = 5 credits.
Ce combo est particulierement puissant si tu as peu de temps et peu de confiance dans ton ecrit. Tu parles ton parcours, l'IA l'ecrit, puis elle le calibre sur ta cible. 20 minutes, CV pret, qualite semi-pro.
Les limites honnetes
La Transcription ne fait pas de miracle si tu dis des choses fausses. Si tu racontes un parcours flou, le CV sera flou. L'IA structure, elle n'invente pas.
Elle n'a pas de memoire des sessions precedentes dans la version actuelle. Chaque transcription demarre from scratch. Si tu as deja un CV dans ton compte, elle ne le modifie pas, elle en cree un nouveau a cote (tu choisis ensuite lequel garder).
Elle n'est pas encore parfaite sur le multilingue simultane fort. Si tu switches toutes les 2 phrases entre FR et DE, la transcription brute peut bugger localement. Reste dans une langue dominante pour de meilleurs resultats.
Elle ne remplace pas la relecture humaine. Les 9% d'erreurs de structuration mentionnees plus haut te demandent 5 a 10 minutes de verification avant export.
Combien de temps elle te fait gagner
Benchmark sur des utilisateurs reels :
Si tu crees 3 branches Multi-CV, tu passes d'environ 7h30 d'ecriture manuelle a 1h30 de transcription + relecture. Gain : 6 heures. Pour 9 credits (3 transcriptions). A l'echelle d'une recherche d'emploi qui dure 6 semaines, ca fait 15 heures gagnees.
Le mode d'emploi express
1. Ouvre BangYourCV, clique sur l'onglet Transcription audio
2. Choisi mode guide (recommande pour la premiere fois) ou mode libre (si tu es a l'aise)
3. Autorise le micro, prends des ecouteurs avec micro deporte pour une meilleure captation (optionnel)
4. Parle pendant 8 a 20 minutes, a ton rythme. Tu peux dire "pause" pour arreter temporairement.
5. Clique "Fin" quand tu es pret
6. Attends 30 a 60 secondes pendant que l'IA structure
7. Relis le Builder qui s'affiche, corrige ce qu'il faut (5 a 10 minutes)
8. Lance eventuellement une Refonte IA pour calibrer sur une offre precise
9. Telecharge le PDF
Temps total : 15 a 30 minutes. Cout : 3 credits (5 si tu ajoutes la Refonte).
Qui devrait essayer
Tu devrais essayer la Transcription si :
La Transcription audio est la feature BangYourCV que les utilisateurs reguliers utilisent 2 a 3 fois par recherche d'emploi. Elle ne fait pas la une parce qu'elle est discrete. Elle est pourtant le hack temporel le plus puissant du site. Teste-la une fois, tu ne fais plus jamais ton CV a la main.