- IDOCIA
Kymatio : construire un ‘content factory’ pour la formation en cybersécurité.
- By felipe san juan
Dans un contexte où la cybersécurité évolue à un rythme sans précédent, la formation ne peut plus reposer sur des modèles statiques ou excessivement académiques. Kymatio faisait face à un défi clair : éduquer, acquérir et fidéliser des abonnés grâce à des contenus pertinents, scalables et adaptés à différents publics.
Chez Oysters AI, nous avons relevé ce défi en concevant un écosystème de contenus audiovisuels dédié à l’éducation, à l’acquisition et à la fidélisation des abonnés, ainsi qu’à la communication interne et externe avec les clients et les utilisateurs finaux. Le travail s’articule autour de deux grandes lignes de contenu:
- Des sessions éducatives courtes en format vidéo (1 minute), conçues pour expliquer les concepts clés de la cybersécurité de manière claire, directe et actionnable
- Des formations académiques destinées aux dirigeants, avec des formats de 4 à 6 minutes, axés sur la prise de décision, le contexte réglementaire et l’impact stratégique de la cybersécurité
Chacune de ces lignes génère des contenus spécifiques à la fois pour l’acquisition de nouveaux abonnés et l’amélioration de la fidélisation, ainsi que des assets clés pour la communication corporate, commerciale et éducative. La vidéo agit comme un outil didactique intégré dans une architecture d’apprentissage plus large, capable de s’adapter à différents niveaux de connaissance, formats de consommation et contextes d’usage.
Un modèle de production aligné sur les objectives pédagogiques.
Le projet a été construit sur une prémisse fondamentale: le contenu n’est pas le point de départ, c’est l’apprentissage. Pour chaque ligne de travail, nous avons défini:
- Des objectifs pédagogiques clairs
- Un niveau de profondeur du contenu adapté à l’audience
- Un type de consommation : « light », stratégique ou expérientiel
Cette approche a permis de concevoir un système dans lequel chaque format répond à une intention d’apprentissage spécifique, optimisant non seulement la clarté du message, mais aussi sa capacité à générer de l’engagement et de la rétention.
IA appliquée à l’optimisation créative et pédagogique.
L’intelligence artificielle a été intégrée tout au long du processus, non seulement dans la production, mais aussi dans la phase de conception. Le travail s’est concentré sur:
- L’optimisation des scripts, en adaptant les contenus à des structures claires et compatibles avec la génération automatisée
- L’ajustement du ton et de la narration, en fonction des différents profils d’audience
- Le renforcement créatif, afin de garantir que chaque contenu soit engageant, compréhensible et mémorable
Le résultat est un équilibre entre rigueur académique et capacité d’engagement, un facteur clé dans les environnements de formation digitale.
Production audiovisuelle: un système conçu pour se déployer de manière extensive.
Le pipeline de production développé combine plusieurs technologies d’IA:
- Avatars digitaux
- Animation générative
- Intégration de ressources visuelles
- Génération de voix off et d’effets sonores
- Amélioration et nettoyage automatisés de l’audio
Ce système permet de produire des contenus de manière efficace, cohérente et extensible, tout en maintenant un haut niveau de qualité sur l’ensemble des assets.
Scalabilité…, jusqu’au 12 langues générées par automatisation.
L’un des piliers clés du projet a été l’internationalisation. Un système de génération multilingue semi-automatisé a été développé, incluant:
- Traduction et adaptation des contenus
- Génération de voix dans la langue cible
- Synchronisation labiale – lip sync –
- Localisation des textes à l’écran
- Export des versions finales
Ce dispositif permet à Kymatio de déployer son offre de formation en 12 langues, en optimisant les délais et les coûts sans compromettre la qualité.
Formations Académiques: une narration experte et une structure pédagogique portées par des avatars avancés.
Les formations académiques s’articulent autour d’une approche narrative duale qui combine une figure transversale avec un système d’experts spécialisés, permettant de construire un discours solide, dynamique et hautement crédible.
Au centre du dispositif se trouve la directrice du programme académique, qui agit à la fois comme présentatrice et figure conductrice. Son rôle est essentiel pour garantir la cohérence d’ensemble : elle introduit le contexte, relie les différents blocs de contenu et conclut chaque session par une synthèse alignée avec les objectifs pédagogiques. Sa présence constante apporte continuité narrative, clarté et une expérience reconnaissable pour le spectateur.
À ses côtés, un écosystème d’experts active les contenus en fonction de chaque module:
- Expert en cyberattaques, apportant une vision tactique et une compréhension des menaces réelles
- Experte en protection des données, centrée sur la conformité, la confidentialité et la gestion de l’information
- Responsable de la sensibilisation, axé sur la culture organisationnelle et le changement de comportement
- Experte en simulation de crise, introduisant des scénarios pratiques et la prise de décision en environnements critiques
- Analyste des risques, contextualisant l’impact et la probabilité dans une perspective stratégique
- Ethical Hacker, traduisant la pensée offensive en apprentissage défensif
Chacun de ces profils ne se contente pas de délivrer un contenu technique, mais apporte également une voix narrative propre, en adaptant le ton, la profondeur et l’angle selon la thématique abordée. L’expert, qui varie d’un module à l’autre, permet de structurer le discours et d’éviter une narration linéaire, tout en renforçant la crédibilité académique et en s’adaptant aux différentes sensibilités de l’audience.
L’objectif n’est pas de reproduire une salle de classe traditionnelle, mais de créer une sensation de proximité, d’autorité et de continuité narrative. L’utilisation d’avatars garantit une cohérence visuelle, une capacité de déploiement étendue et une grande flexibilité de production, sans renoncer à une mise en scène dynamique. La réalisation s’appuie sur des variations d’angles de caméra, des changements de décor et un rythme de montage fluide. Cela dynamise le récit sans recourir à des artifices visuels superflus.
Par ailleurs, le contenu est systématiquement enrichi par des éléments visuels de soutien – graphiques, cartels, overlays – qui ne se contentent pas d’accompagner le discours, mais en structurent la compréhension. Ces éléments permettent de segmenter l’information, de réduire la charge cognitive et de faciliter l’assimilation, en particulier dans des formats plus longs.
Workflow de production basé sur les avatars.
Le système de production s’articule autour d’un workflow clair et structuré:
- Conceptualisation et prompting
ChatGPT / permet d’affiner et de finaliser les prompts utilisés dans les modèles de diffusion - Création visuelle statique
Nano Banana Pro / création d’assets visuels et de séquences de base – conceptuelles ou illustratives – alignées avec le territoire créatif - Animation et mise en mouvement
Google Veo 3.1 / Topaz – animation, upscaling, lip sync – - Montage master
Adobe Premiere - Audio
Suno – ElevenLabs / voix synthétique, doublage, musique - Textes à l’écran
Adobe Premiere / sous-titres et overlays
Enfin, l’ensemble des éléments est intégré, édité et ajusté dans Adobe Premiere, où sont finalisés le montage, le rythme, l’intégration des sous-titres et des éléments graphiques, ainsi que l’étalonnage colorimétrique. Cela garantit un résultat parfaitement aligné avec l’identité de marque et prêt à être diffusé.
Sessions éducatives:
variation, narration visuelle et attention soutenue.
Dans cette ligne de travail, le point de départ était clair: la formation n’a pas besoin d’être monotone pour être rigoureuse. Chaque session éducative est conçue comme une unité autonome, avec sa propre identité, transformant le contenu en une expérience épisodique qui encourage un engagement continu au sein de l’écosystème.
Oui, nous abordons la variation comme un levier d’attention.
Chaque thématique s’articule autour d’un style visuel distinct. Ce changement n’est pas décoratif mais stratégique: il agit comme un ‘reset cognitif’ qui réactive l’attention du spectateur et réduit la fatigue.
Pour cela, nous avons conçu un système basé sur jusqu’à sept styles visuels différenciés, soigneusement développés et harmonisés afin de créer un canvas visuel cohérent et structuré.
Parmi eux : Rubber House, Pixel 3D, Arcade, Toy 3D, Anime, Spanish tebeo, Origami et Muppet 3D.
Chaque style apporte sa propre identité, tout en partageant une logique commune en matière de design, de couleur, de composition et de rythme, ce qui permet de maintenir une cohérence sans renoncer à la diversité. Le style ne se limite pas au design des personnages ; il s’étend à l’ensemble du système audiovisuel, transformant chaque session en une unité cohérente, reconnaissable et mémorable.
Chaque élément du design est conçu pour remplir une fonction spécifique dans le processus d’apprentissage, en évitant les décisions purement esthétiques et en privilégiant systématiquement la clarté, le rythme et la rétention:
Fonds
Les fonds des sessions sont construits à partir de dégradés de couleurs, en versions monochromes ou en combinaisons de deux teintes. Les couleurs choisies sont douces et peu contrastées, afin de créer un environnement visuel apaisé qui facilite la lisibilité des textes sans entrer en concurrence avec les personnages ou les informations. Ce système permet d’attribuer à chaque thématique un fond distinctif, introduisant variété et rythme visuel entre les sessions, sans compromettre la cohérence ni la lisibilité. Les dégradés constituent ainsi une base flexible et accessible qui structure le contenu et renforce la clarté du message.
Transitions
Les transitions sont intégrées de manière organique dans l’identité visuelle de chaque session. Les transitions lourdes et rigides, typiques des présentations animées, souvent disruptives et trop centrées sur le format, sont volontairement évitées. À la place, des transitions plus fluides et organiques sont introduites, en cohérence avec le langage visuel de chaque style.
Par exemple, dans un style inspiré de l’arcade, les transitions s’appuient sur une esthétique 8-bit; dans un style origami, elles simulent des mouvements de pliage. Ces transitions n’interrompent pas la narration: elles la prolongent, renforçant la sensation de continuité et de cohérence au sein de chaque pièce audiovisuelle.
Musique
L’habillage sonore est adapté au ton et au style de chaque pièce, renforçant l’atmosphère spécifique de chaque thématique. La musique est utilisée comme une couche émotionnelle subtile, conçue pour accompagner le discours sans le dominer. Son rôle est de soutenir l’attention, de rythmer la narration et de créer de la continuité, sans interférer avec la compréhension du message ni avec la clarté de la voix.
Rythme et montage
Le montage joue un rôle clé dans l’efficacité du système. L’alternance des plans, la durée des scènes et la synchronisation avec l’audio et les éléments graphiques sont soigneusement calibrées afin d’éviter la monotonie et de maintenir l’engagement. Le rythme n’est pas uniforme: il s’adapte au contenu, s’accélérant lors des phases explicatives et ralentissant lorsque cela est nécessaire pour renforcer les concepts clés.
Couches d’information
Le système intègre plusieurs couches visuelles – graphiques, cartels et overlays – qui ne se contentent pas d’accompagner le contenu, mais le structurent activement. Ces éléments permettent de segmenter l’information, de mettre en évidence les idées clés et de réduire la charge cognitive, facilitant ainsi une compréhension plus progressive et plus efficace.
Pris dans son ensemble, cette approche construit un langage audiovisuel complet dans lequel tous les éléments fonctionnent de manière coordonnée. Le résultat est un équilibre entre cohérence structurelle et diversité esthétique, garantissant rigueur académique, dynamisme visuel et une expérience d’apprentissage plus immersive, durable et efficace dans le temps.
Au-delà du contenu: un écosystème d’apprentissage.
La vidéo n’est plus un élément isolé; elle devient un composant stratégique au sein d’un écosystème d’apprentissage interconnecté, conçu pour accompagner les utilisateurs tout au long de leur parcours, de la découverte à l’approfondissement et à la fidélisation. Dans ce contexte, le contenu audiovisuel remplit plusieurs fonctions simultanément:
- Outil d’acquisition, agissant comme un point d’entrée accessible, engageant et facilement consommable, capable de susciter l’intérêt et de traduire des concepts complexes en messages clairs et pertinents
- Ressource de formation, structurée pédagogiquement pour faciliter la compréhension, la rétention et l’application pratique des connaissances à différents niveaux de profondeur
- Levier de fidélisation, qui crée de la continuité, des habitudes de consommation et un lien renforcé avec la plateforme, générant une expérience durable dans le temps
Cependant, sa valeur ne réside pas uniquement dans ces fonctions, mais dans la manière dont elles s’intègrent au sein d’un système plus large. Chaque contenu fait partie d’une architecture conçue pour optimiser l’expérience d’apprentissage, adapter les contenus à différents publics et maximiser leur impact dans divers contextes d’usage.
Le résultat est un modèle qui combine efficacité opérationnelle, cohérence créative et capacité de déploiement, où la production de contenu n’est pas une fin en soi, mais un moyen de construire des relations durables avec les utilisateurs et de valoriser la connaissance.
Scalabilité, maîtrise budgétaire et efficacité opérationnelle.
Le modèle offre un cadre économique transparent et prévisible, basé sur des unités de coût claires et facilement combinables. Cette structure facilite la maîtrise budgétaire, la comparaison entre différentes options de production et la prise de décisions éclairées en fonction des priorités, des délais et des objectifs.
La modularité du modèle favorise également la scalabilité des contenus, permettant d’augmenter les volumes, les formats et les langues sans une croissance proportionnelle des coûts.
Conclusion: du contenu aux systèmes d’apprentissage.
Le travail réalisé pour Kymatio représente un changement de paradigme: passer de la production de contenus isolés à la construction d’une factorie de contenus intelligente. Oysters AI a développé:
- Une évolution profonde de ses lignes créatives
- Un système de production aligné sur les objectifs pédagogiques
- Une architecture basée sur l’IA capable de déployer les contenus en 12 langues
L’ensemble est au service d’un objectif stratégique: acquérir, éduquer et fidéliser des abonnés sur des marchés internationaux, tout en répondant aux besoins de communication interne, externe et auprès des clients finaux.
Chez Oysters AI, nous croyons en une IA bien dirigée, sensible et humaine.
C’est ce que nous appelons le Crafting AI, une manière de créer des visuels de façon artisanale, avec une âme.
Souhaitez-vous explorer comment appliquer cette technologie à votre marque? Écrivez-moi à:
felipe@oysters-studio.com
Je serai ravi d’échanger avec vous!