- Lieu : Paris 19eme - Métro Ourcq
- Avantages : Forte volumétrie de données, participation à un projet d'engagement citoyen (lutter contre le décrochage numérique), Full remote, Culture du partage, de la transmission et de l'entraide.
- Télétravail ? Oui
- Stack technique :
#Spark #Python #SQLServer
- Type : cdi

J’ai discuté récemment avec Nicolas Savois, CTO de Pix.fr, Startup d’Etat. Pix a grandement misé sur des méthodes de recrutement qualitatives pour s’entourer des bonnes personnes (80 personnes aujourd’hui au sein de l’entreprise) ce qui a permis de poser un cadre de développement agréable et efficace (culture craftsmanship) et orienté utilisateur (product team).
La raison d’être de Pix.fr est de permettre à tout un chacun de cultiver ses compétences numériques et avoir une activité numérique (pro ou perso) épanouie 🚀. Pix répond à un enjeu de société fort : lutter contre le décrochage numérique en donnant les moyens à chaque citoyen d’en améliorer sa maîtrise et de valoriser ses compétences numériques tout au long de la vie.
Après 5 ans d’activité, Pix.fr impacte la vie de près d’8M d’usagers et poursuit son déploiement dans l’enseignement scolaire, supérieur, dans les entreprises ou organisations professionnelles et est en passe de se déployer à l’international 🌍
Ils ont dépassé les 10 millions d’utilisateurs !
Le contexte en recrutement
A l’heure actuelle, Pix me sollicite sur la partie recrutement pour faire grandir les Products Team avec des profils dits Artisans.nes Logiciel (plutôt fullstack JS #EmberJS #NodeJS), en interne.
Le besoin s’oriente vers le recrutement d’un profil Lead Data (H/F).
L’organisation des équipes
L’entreprise compte aujourd’hui 122 collaborateurs dont 40 personnes au sein de l’équipe techniques.
C’est plus de 10 millions comptes utilisateurs créés (atteints en Janvier) et plus de 650 000 visiteurs uniques par jour.
Les équipes sont organisées en produits ou plutôt en services rendus (produit + conseils donnés associés au produit).
Chaque équipe est composée de :
- 6 à 7 personnes environ, avec un PO (cela est le cas pour les Features Teams, mais pas pour les équipes SRE et Data, qui n’ont actuellement pas de PO).
- un Lead Dev.
- et 4 à 5 développeurs.
Chaque Product Team est :
- responsable,
- multi-compétences,
- et agile,
Les équipes sont composées essentiellement de personnes seniors (6 personnes ont plus de 10 ans d’expérience, 8 personnes ont plus de 5 ans d’expérience. Il y a un alternant).
Focus Data
La personne qui rejoindra Pix en tant que Lead Data sera rattachée à l’équipe Engineering de Pix, s’occupant de toute la partie technique des différents produits et applications Pix.
L’équipe Data est actuellement constituée de 4 personnes, réparties au sein d’un triangle formé par la Data Ingénierie, la Data Analyse et la Science des données.
C’est avec cette équipe et son pôle que le.la Lead Data travaillera au quotidien, mais sera aussi en étroite collaboration avec les équipes Produits et les différentes équipes Métiers (créateurs de contenus, déploiement, etc.).
Les 5 principales équipes
- Team Accès : Permettre aux utilisateurs d’accéder aux applis Pix, via authentification interne ou externe, en conservant son compte tout au long de sa vie, en conformité avec la réglementation (CGUs, données perso…)
- Team Certification : Permettre à toute personne souhaitant valoriser ses compétences numériques d’apporter une preuve fiable de son niveau sur ces compétences grâce à l’obtention d’un certificat.
- Team Expérience d’évaluation : Permettre de passer un bon moment, d’identifier ce qu’on sait et ce qu’on ne sait pas et d’avoir envie d’apprendre et s’en sentir capable.
- Team Prescription : Permettre aux prescripteurs de donner des formations adaptées aux besoins des prescrits de son organisation, de mesurer l’efficacité des formations (avant/après), et d’identifier/valoriser les compétences des prescrits.
- Team Contenu : permettre d’évaluer ses compétences numériques au sein d’un référentiel de compétences, via des simulateurs ou encore des questions interactives.
Le produit
Voici un vidéo permettant une démonstration complète de leur solution :
Le besoin en recrutement
Les missions de l’équipe Data sont multiples
Construire (ou poursuivre la construction) du socle de données alimenté par les différentes applications de PIX tout en répondant aux besoins de :
L’interne : aussi bien des équipes métier, produit qu’engineering pour :
- Permettre d’améliorer la gestion de leur feature : par exemple, pour la construction des épreuves, surveiller le nombre de signalements
- Résoudre des problèmes en s’appuyant sur l’exploitation des données avec éventuellement l’utilisation ou le développement d’algorithmes
Les partenaires : pour aider les métiers concernés ou directement les partenaires à fournir des indicateurs de suivi
Accompagner l’utilisation de ce socle, par :
- des outils de datavisualisation
- des API
- des intégrations aux produits
Construire des données utilisables et ouvertes pour tous, pour permettre à d’autres partenaires ou services de les valoriser
Pix souhaite s’ouvrir à de l’open-data et développer ses partenariat avec la recherche académique.
Être en contact avec des chercheurs et des statisticiens pour valoriser les données Pix, via de la recherche ou des analyses statistiques.
Accompagner les autres équipes Engineering :
- Aider dans les choix bonnes pratiques data des équipes de développement
- Contribuer à optimiser notre architecture et nos bases de données
- Participer aux ateliers de partage et de réflexion sur des problématiques techniques de la plateforme Data
- Aider les développements liés aux algorithmes de Pix
Accompagner les équipes Pix, métiers, produits, engeneering à s’acculturer sur les enjeux data : comment utiliser la donnée pour la prise de décision, comment valoriser nos données …
Les missions du rôle de Lead Data seront :
Faire partie intégrante de l’équipe Data :
- Comprendre l’intégralité de la chaîne data, de la conception au livrable avec les différents aspects, infrastructure et produit, tout cela pour pouvoir, avec les connaissances de son équipe, répondre aux différentes missions de l’équipe data.
Faire grandir son équipe, autant sur les compétences que sur le fonctionnement
- L’équipe data est pluridisciplinaire, et ce partage des tâches et des connaissances fait partie de l’ADN des équipes Engineering. Le/la Lead Data aidera ses équipes à acquérir de nouvelles compétences et à continuer de partager les connaissances.
- Vérifier que personne dans l’équipe est le/la seul.e sachant.e sur un sujet
Travailler avec les différentes équipes afin de prioriser les besoins en termes de Data.
Arbitrer dans l’équipe les différentes priorités des besoins extérieurs en cohérence avec la poursuite de la construction des socles de données.
Veiller à l’animation et au bon déroulé des cérémonies agiles de l’équipe.
Organiser les évènements de communications auprès des autres équipes.
Aider Pix à développer sa culture Data.
Le profil recherché
Chez Pix, ils veillent à l’équilibre de l’équipe et le bien-être des personnes qui la composent.
Diplôme et expérience
Bac + 5 Master, ou diplôme d’ingénieur ou diplôme équivalent, peu importe, vous avez de l’expérience dans
- Des missions Data.
- La création d’une équipe Data
- Ou le lead d’une équipe existante dans vos précédentes missions est un pré-requis sur ce poste.
Connaissances et Compétences
Ils recherchent des personnes possédant plusieurs compétences dans cette liste exhaustive :
- La maîtrise d’un framework: Spark, Hadoop, Pandas …
- La maîtrise de constructions et de maintenance de pipelines de données.
- Au moins une expérience dans un contexte Big Data.
- Une bonne connaissance de la RGPD.
- La maîtrise du SQL.
- La maîtrise de base de type PGSQL, et la connaissance dans des bases de type NoSQL et RDBMS comme Redis.
- Maîtrise des langages de programmation, si possible Scala, Python. Le JS serait un plus.
- Une bonne connaissance de Git et des outils d’intégration et de déploiement continue : création de CI/CD, docker, etc..
- Une bonne connaissance des outils et concept d’ETL, comme DBT.
- Avoir une expérience dans la conception, l’implémentation et l’automatisation de pipelines de données, dans la gestion de flux de données avec des solutions comme AirFlow.
- Savoir consolider les données, produire des KPI et avoir des notions de conception de tableaux de bord à l’aide d’outils de data visualisation tels que Metabase, Excel Power BI, Tableau Software, ou encore QlikView.
- Avoir des connaissances basiques sur le Machine Learning, et la Data science afin de pouvoir travailler en collaboration avec l’équipe Data et l’équipe de devs.
- Connaissance des API serait un plus.
Soft-Skills
Ils sont ouverts à tous types de profil dans la mesure où il y a un vrai match possible, et qu’ils perçoivent une vraie motivation pour le projet / ce qu’ils font ainsi qu’une vraie plus-value réciproque.
Une personne, par exemple, qui est focus uniquement sur la partie technique (dernière version de telle technologie, ou, plus péjorativement, sur le « Hype Driven Development ») risque de ne pas matcher avec la culture produit de Pix.fr, et les attentes techniques plus macro « la technique est un moyen au service des utilisateurs, et non une fin en soi ».
Savoir-faire et savoir-être
- Capacités à travailler en équipe et à mener des activités de façon collaborative.
- Capacités d’écoute, bon relationnel (savoir s’adapter à son interlocuteur) et qualités de communication et d’écoute dans un cadre où l’agilité n’est pas un buzzword mais vraiment incrémenté dans l’architecture, l’organisation d’entreprise et au niveau du delivery.
- Aimer travailler avec des outils/solutions plus libres (pas d’AWS, etc.)
- Etre en phase avec la culture Pix (cf. les valeurs de l’entreprise).
L’environnement technique
La stack technique
Frontend avec EmberJS
Backend en NodeJS/ Hapi.JS
Ils ont du PostgreSQL, du Redis (pour la partie cache et performance) et du Airtable (pour la partie référentielle) ~ https://github.com/1024pix/pix/blob/dev/docs/adr/0002-style-d-architecture.md.
Une plateforme Data a été construite afin de pouvoir faire face à la volumétrie croissante :
- des traitements python/pandas pour la transformation de données
- des jobs Spark/Scala afin de pouvoir traiter les très gros volumes
- les pipelines de données sont orchestrés par Airflow
- les traitements Big Data sont soigneusement hébergés par OVH
Après un début d’hébergement au format IaaS et une tentative mitigée d’infra haute-résilience, ils ont migré la quasi-totalité de leur infra chez @ScalingoHQ, un éditeur PaaS français. #BestOpsDecisionEver
Thread détaillé de Jérémy Buget, ancien CTO de Pix, racontant l’évolution des sujets infra chez Pix
Voici un résumé en images


La qualité de code
Les bonnes pratiques de développement ont été poussées vraiment loin :
- Des tests vraiment partout dans le code : plus de 90 % de couverture de tests
- Une pratique du TDD
- Des sessions en Mob et Pair Programming
- Découpage en commit
- Design DDD et ADR (Architecture Decision Record)
“En plus de concevoir et de réaliser des solutions adaptées à des problèmes utilisateurs au plus près du réel, chaque dev est aussi responsable de la production. Pour ça, nous avons mis en place un dispositif particulier appelé Team Captains“
http://engineering.pix.fr/organisation/2020/04/14/les-capitaines-de-la-production.html
Les valeurs de l’entreprise
- Engagement citoyen :
L’entreprise compte une cinquantaine de professionnels de tous bords et issus de tous domaines, animés par le même engagement citoyen, dont la moitié s’occupe du développement de la plateforme Web et des services numériques 👫#Diversité.
En tant que développeuse ou développeur, vous rejoindrez l’une des équipes produits, afin de concevoir et délivrer des solutions susceptibles d’aider les gens à évaluer, développer et valoriser leurs compétences numériques ~ http://engineering.pix.fr/organisation/product/teams/2020/04/13/product-teams.html.
Cet engagement citoyen est également un point qui a son importance lors de l’évaluation des futures recrues en entretien (autant que les compétences techniques).
- Transparence et partage :
l’OSS, la transparence et le partage sont au cœur de leur culture et de leurs valeurs, et ce depuis la première ligne de code ~ https://github.com/betagouv/pix/commit/39cd1f7db03c9f40836e87976b2d6fb082a8450f.
- La qualité sous toutes ses formes :
Qualité logiciel attendue : « La qualité de ce que nous produisons (les features, le code, nos outils), avec qui et comment nous le produisons (nos interactions entre nous et les relations avec nos usagers ou partenaires) est extrêmement importante pour nous. #DDD #XP #SoftwareCraftsmanship »
Expérience utilisateur : « Ce sont nos PO qui MEP via 1 commande Slack dès qu’on a quelque chose de valeur à proposer à nos utilisateurs / usagers. Nous automatisons un max de trucs ~ https://github.com/1024pix/pix-bot »
- Esprit d’équipe :
L’équipe tech EST le produit : elle n’est pas à la marge du business, du métier et des utilisateurs. Elle fait partie du produit et fait donc corps avec les autres équipes. La communication est clairement un enjeu quotidien, travaillé, amélioré, respecté, tant au sein de l’équipe technique qu’avec les autres équipes. Les interactions sont permanentes. Il n’y pas la culture du développeur.se qui code tout seul dans son coin.
- Une exigence personnelle forte :
La qualité logiciel passe par la rigueur et la discipline dans l’usage de tests et dans la volonté de progresser, de s’améliorer et de sortir de sa zone de confort.
Vous avez en totale transparence leurs enjeux RH, organisationnels, et leur culture d’entreprise dans leur Github ici
Les conditions de travail
Locaux basés à Paris 19eme vers le métro Ourcq avec terrasse et open space totalement rénové pour un accueil au top !
Un travail en full remote est tout a fait envisageable avec quelques moment de partage au sein des locaux dans le mois (3 jours de présence par mois) ou de façon plus espacée.
Le processus de recrutement
- Un premier échange de contact de 30 minutes avec Clarisse/CTO.
- Un entretien avec l’équipe Data d’une heure et demi environ (deux à trois personnes de l’équipe Data).
- Un entretien avec le CTO pendant une heure.
- Echange et proposition de l’offre avec Clarisse.
Pour avoir une vue complète du processus de recrutement, il y tout qui est décrit sur leur Github ici.
Les éléments contractuels
La rémunération
Target rémunération : +/- 70 K€
Prime de fin d’année pouvant atteindre 10% du brut annuel
Les aspects contractuels
Il peuvent, depuis juillet 2021, proposer des contrats en CDI
20 jours de RTT
Les noms des personnes que j’ai recrutées qui pourront vous parler de Pix de l’intérieur
Les feedbacks des personnes recrutées



