ouvert

Développeur.ses fullstack web (X4)
Hugging Face

Dans chaque démarche de projet en recrutement, BUILD RH intervient de façon journalistique pour faire le brief de poste le plus complet et réaliste ouvert à tous les candidats susceptibles d’être intéressés par ce poste.

Ainsi, voici le projet en recrutement sous toutes ses coutures :

Pourquoi ce recrutement ?

Historique

Hugging face est née dans le cœur des co-fondateurs passionnés depuis des années par le Machine Learning (ML) et le Natural Language Processing (NLP). Clément Delangue, CEO, Julien Chaumond, CTO, et Thomas Wolf, CSO ont des backgrounds techniques dans cet univers sur des projets business avec des millions d’utilisateurs, comme, notamment une application iOS de montage vidéo, Replay, qui a fait un carton à l’époque. Ils ont bâti les premières briques de l’entreprise entre NYC et Paris.

En 2016, ils ont rapidement pensé le business de l’entreprise qui serait un mix entre leur passion du machine learning, et l’usage d’une solution par des milliers d’utilisateurs. Ils réalisent leur première levée de fonds de 5 millions de dollars, auprès d’investisseurs, plutôt réputés, dans la Silicon Valley, (Ronny Conway, ACapital, SV Angel, Betaworks).

En 2018, il y a un recentrage de l’entreprise, sur l’objectif de développer de la technique de façon plus générale dans le domaine du NLP avec la volonté d’open sourcer le tout auprès de la communauté machine learning. Ainsi, les utilisateurs peuvent utiliser des briques NLP sur l’ensemble des problèmes de machine learning appliqués aux textes.

Une première librairie open source voit le jour : transformers

A l’heure actuelle, c’est l’une des 5 librairies les plus actives et visibles sur GitHub en Python sur 2020 : 40 000 stars et une pléthore de contributeurs.

Tout cela a fortement contribué à une croissance du staff d’entreprise :

Contexte actuel d’entreprise et de recrutement

A l’heure actuelle, la progression de l’entreprise est vraiment toujours aussi importante avec une levée de fonds importante réalisée fin 2019 (20 millions de dollars), tout en étant dans un contexte business de monétisation : revenu annualisé de 3 à 4 millions de dollars.

Ils se font accompagner par un fond d’investissement qui contribue grandement dans l’univers de la Deep Tech : Lux.

Ils ont également de multiples investisseurs venus du monde entier et de tous les horizons : Kevin Durant (meilleur joueur de la NBA qui vit à Brooklyn), côté science Richard Socher, très connu dans le domaine du ML, et en France, Thibault Elzière (eFounders). Ce sont des VC friendly qui n’ont pas peur de prendre des risques.

Ils ont l’ambition de devenir le Github du machine learning en recrutant 30 personnes dans le monde sur le début de l’année 2021, dont 15 personnes en France sur de multiples compétences et ce, dans cet ordre de priorité de recrutement :

Pour cela, ils ont les moyens. Ils vont lancer leur série B dans les premiers mois de l’année. On parle de plusieurs dizaines de millions de dollars pour accélérer leur développement. Ils visent 7 millions de revenus en 2021.

TL;DR

Voici donc ce que tu vas lire en continuant la lecture :

Quelle entreprise vas-tu rejoindre ?

Date existence

Août 2016

Nombre de personnes au sein de l’entreprise

30 Personnes au sein de l’entreprise avec 28 personnes côté tech

Volonté de passer à 60 personnes dans le monde

Localisation

Paris 9eme – Rue Richer – super locaux de 150 mètres carrés

Culture du full remote avec une équipe distribuée dans le monde entier

Quelle organisation d’entreprise vas-tu rejoindre ?

La configuration des équipes et la stack technique
 Équipe ScienceÉquipe Open SourceÉquipe Product
Domaine d’intervention  Recherche scientifique Ils lisent des papiers de science  Ils travaillent sur le cœur de la librairie Open Source   
Cette équipe est coupée en deux :
API Backend : ils mettent en production des modèles ML  

App Hugging Face* : ils travaillent sur le web site principal  

Profils et compétences  Scientifiques  ML Engineer 
Sur la partie API Backend, profils SRE (performance, scalabilité, fort trafic)  

Sur la partie App, profils Dev fullstack web avec compétences fullstack et aussi juste frontend
 
  Cursus  École d’Ingénieur PhD en ML (MVA École Normale Cachan)    Assez similaires à ceux de l’équipe Science 
École d’ingénieur (EFREI, Supinfo, …)

  Taille  6 à 7 personnes – essentiellement basées à New York    8 personnes 
4 personnes côté API Backend

4 personnes côté dev web

  Stack  Python  Python, Rust Framework de ML: Tensorflow (utilisé chez Google) – et Pytorch https://pytorch.org/ (utilisé chez Facebook)  
  API Backend Python, Kubernetes, ELK, Grafana, déploiement sur AWS, Github action + Circle CI pour la CI/CD  

Web site: Frontend: Tailwind, Svelte, Typescript, VueJS

Backend: NodeJS, Python, MongoDB  

* là où se situe le recrutement des 4 profils de développeurs.ses fullstack web

La moyenne d’âge est de 28/ 30 ans

Les personnes de l’équipe technique ont globalement entre 5 et 10 ans d’expérience, soit des personnes essentiellement séniors.

Sur 28 personnes au sein de l’équipe technique, il y a 3 femmes.

Les managers :

La qualité de code

Étant donné que la partie open source de la codebase est totalement ouverte avec l’implication d’une multitude de contributeurs, ils sont exigeants concernant la qualité de code et les bonnes pratiques en développement. Il y a, aussi bien des enjeux de visibilité et d’ouverture du code mais aussi des enjeux de maintenabilité de la plateforme.

Les différentes librairies ouvertes :

https://github.com/huggingface/tokenizers en Rust

https://github.com/huggingface/datasets en Python

Les bonnes pratiques au quotidien :

Les profils attendus ?

Les compétences techniques attendues

Des compétences techniques sur la stack NodeJS et Typescript.

Une bonne maîtrise de Git car leur hub expose un serveur Git.

Des compétences infra orientées problématiques webapp avec l’usage de NodeJS. Les problèmes de scaling sont moins prédominants sur ce périmètre.

Les personnes devront naturellement avoir un intérêt pour le ML qui est le cœur du produit.

Les personnes devront naturellement avoir un intérêt pour le ML qui est le cœur du produit.

Savoir comprendre et rédiger en anglais. Beaucoup de communications écrites se font en anglais notamment dans le slack d’entreprise. 

Les Soft Skills

Une personne qui a un certain sens du partage : le principe de contribution est dans l’ADN produit et cela se traduit également dans le quotidien de l’équipe. Il y a pratiquement aucun turnover. Le noyau dur est toujours là. La force de l’équipe repose sur ces piliers : entraide, partage, écoute.

Un sens de la rigueur aussi bien dans les réponses données aux utilisateurs/ clients mais aussi en interne dans les échanges et la qualité de code. Le code est ouvert, consultable. Le code doit être lisible, reprenable. Être rigoureux chez Hugging Face c’est fortement contribuer à la qualité des app et des librairies proposées.

Enfin, une certaine capacité à prendre du feedback venant de nombreux canaux : internes, utilisateurs, contributeurs. L’amélioration passe par les feedbacks aussi bien ceux qui valorisent le travail mais aussi ceux qui grattent, qui exigent des améliorations. Cela pousse à sortir du dogmatisme technique, à toujours se remettre en question, à revoir ses acquis et sa base de connaissance.

Le processus de recrutement

La rémunération, les classiques et les avantages

Rémunération

La rémunération se base sur 3 critères :

Ainsi leur grille de rémunération est approximativement celle-ci :

Les classiques

Mutuelle (avec Wemind)

Les avantages

Congés illimités

Stock options: la valo de l’entreprise est élevée et des stock options sont prévus

Ce qui n’est pas mis en place

Tickets restaurants

RTT

Intéressement

L’environnement de travail au global

Les moyens, les outils de travail
MachinesMatérielIDEOutils collaboratifs
  Les gens choisissent leur machine avec un budget open  Chaise

Écran

Clavier

pour bien travailler chez soi ou dans les locaux.

Ils ont un compte spendesk Ils ne sont pas regardant pour le confort des salariés.  
  Au choix  Slack

Zoom

Google Doc
La politique remote
Avant CovidPendant CovidAprès ?
  Il y a un an ils n’étaient pas vraiment partants pour du remote  Cela marche bien et ils souhaitent continuer ainsi avec une équipe distribuée (Inde, Europe, USA, Chine) et le recrutement de personnes dans le monde
  Après ces contraintes covid, ils souhaitent donner du choix au gens, celui de venir ou non dans les locaux (ils ont investi dans 150 mètres carrés sur Paris) avec une logique flex remote/ full remote, + prise en charge des déplacements pour venir sur place  

L’espace veille et formation

Il y a beaucoup d’encouragements managériaux à participer à de nombreuses conférences sur ML, ou autres sujets techniques, aussi bien en tant que participant que speaker.

Le management

Julien est encore fortement contributeur avec les mains dans le code tout en gérant les aspects humains. Il fait partie de l’équipe technique.

Cependant, il a conscience que dans un contexte de scaling, il devra avoir à ses côtés un profil VP Engineering qui sera totalement dédié au management des équipes.

Organisation flat, sans beaucoup de niveaux de hiérarchie.

La culture d’entreprise

Être à la pointe de la tech : tout le monde a des compétences techniques pointues dans son domaine au sein de l’équipe.

Culture de l’open source : partage, transparence, contribution.

Culture américaine : culture de la prise de risque, du remote, de l’ouverture au dialogue (pas de politique, de sous-entendu. Les choses sont dites ouvertement).

Importante autonomie des équipes avec un management participatif, une organisation flat. Cela facilite la sécurité psychologique.

Les projets d’évolution à moyen/long terme

La structure rentre dans une phase importante de croissance et de monétisation avec un modèle business propre au monde de l’open source.

En effet, les grosses entreprises demandent un support premium pour les aider à mettre en place des projets ML.

Quelques exemples d’entreprises clientes :

Qui dit de plus en plus de clients/ projets, dit plus d’entreprises qui payent leur API de ML. Cela va venir sur leurs serveurs avec plus d’utilisateurs donc, inévitablement, cela implique de gros projets de scaling (x10 ou x100 sur le volume de requêtes) avec la technologie Kubernetes.

Sur la partie Website, ils veulent aller plus loin avec la création d’une plateforme de collaboration afin de devenir le Github du ML. Ils ouvrent donc leur modèle hub avec toutes les contraintes front/ backend que cela engendre.

Les plus et les moins du projet d’entreprise

Les plusLes moins
 
Ambition d’être un outil utilisé par tous les gens qui font du machine learning  

Stock option  

Congés illimités  

Rémunération attractive, au-dessus du marché  

Bonne culture d’entreprise avec un noyau dur qui pérennise/ transmet la connaissance  

Équipe distribuée dans le monde entier  

Top 5 des librairies Open Source  

Qualité de code  

Entreprise qui a l’ambition d’être une licorne avec les multiples levées de fonds importantes + un schéma rassurant de monétisation  

Des investisseurs sérieux et reconnus dans le milieu des licornes et dans l’univers du machine learning  

Stack technique moderne  

  Pas encore une culture RH poussée  

Contexte en croissance rapide qui peut susciter des doutes et des
interrogations sur la pérennisation de la culture d’entreprise  

Faiblesse du nombre de juniors et de femmes    

Postuler