de Systèmes Linux Hpc - Montréal, Canada - Mila - Institut québécois d'intelligence artificielle

Sophia Lee

Posted by:

Sophia Lee

beBee Recruiter


Description
**À propos de Mila**

Fondé par le professeur Yoshua Bengio de l'Université de Montréal, Mila rassemble des chercheurs spécialisés en intelligence artificielle et plus précisément en apprentissage automatique, apprentissage profond et apprentissage par renforcement. Reconnu mondialement pour ses importantes contributions au domaine de l'apprentissage profond, Mila s'est particulièrement distingué dans la modélisation du langage, la traduction automatique, la reconnaissance d'objets et les modèles génératifs. Depuis 2017, Mila est le fruit d'une collaboration entre l'Université de Montréal et l'Université McGill, en lien étroit avec Polytechnique Montréal et HEC Montréal.

Mila s'est donné pour mission d'être un pôle mondial d'avancées scientifiques qui inspire l'innovation et l'essor de l'intelligence artificielle (IA) au bénéfice de tous.

** Description du mandat**

En tant qu'administrateur de systèmes, vous aidez à réaliser la mission d'équipe visant à offrir aux chercheurs en IA les meilleurs outils pour exceller dans leur recherche de pointe.

Dans le contexte de l'exploitation d'une grappe de calcul en IA basée sur des nœuds de calcul GPU et CPU, l'administrateur de Système Calcul Haute Performance applique ses compétences au déploiement et au maintien en condition opérationnelle des serveurs de calcul, de stockage et à la réseautique de cette grappe.

**Requirements**:
**Vos principales fonctions**
- Supporter le maintien en condition opérationnelle de la grappe de calcul
- Détecter, prévenir et analyser les problèmes matériels et logiciels
- Déployer de nouveaux noeuds dans la grappe de calcul par des interventions matérielles et par des contributions au provisionnement logiciel
- Déterminer et régler les problèmes de performance et de fonctionnement d'éléments matériels et logiciels.
- Rédiger et mettre à jour les documentations techniques
- Agir à titre de référence dans l'équipe pour les enjeux de réseautique
- Supporter les utilisateurs de la grappe de calcul

En tant qu'administrateur système dans l'équipe TI vous contribuez également à ces chantiers;
- Développement de la stratégie Infrastructure en tant que Code pour le déploiement des logiciels et des configurations
- Évolution de la stratégie de sauvegarde et du plan de reprise d'activité
- Surveillance active de tous les éléments d'infrastructure TI
- Évolution des politiques de gestion des données
- Évolution des politiques de sécurité

**Profil recherché**
- Capacité démontrée de s'adapter aux changements rapides
- Volonté d'apprentissage en continu
- Engagement et compréhension de la mission
- Polyvalence et bonne attitude de résolution de problèmes
- Bonnes capacités de communication orale et verbale, bilingue (français et anglais)
- Aisance dans le travail d'équipe
- Haut niveau d'autonomie

**Qualifications recherchées**
- Expérience en support de serveurs Linux dans un environnement de calcul haute performance
- Expérience avec les outils d'ordonnancement de tâches (Slurm, OpenPBS, LSF)
- Expérience avec les systèmes de stockage distribués (BeeGFS, Lustre, Isilon)
- Expérience dans la gestion de réseaux informatiques rapides (InfiniBand) rapides (InfiniBand)
- Expérience avec le réseau TCP/IP, des configurations de type VLAN, bonding, etc.
- Expérience en scripting Shell et en automatisation de systèmes utilisant Bash, Python et Perl.
- Posséder une connaissance des solutions de type OpenLDAP, SSSD, Radius sous l'environnement Linux.

**Qualifications souhaitables**
- Expérience dans les procédures de mise à jour de sauvegarde et de reprise
- Expérience des environnements virtuels, idéalement les produits KVM, proxmox
- Expérience avec les produits de type _container_, tel singularity et docker

**Benefits**

**De bonnes raisons pour travailler à Mila**
- Un horaire flexible de 35 heures par semaine (horaire d'été de 32 heures);
- Un milieu de travail au cœur de la Petite Italie, dans le quartier branché Mile-Ex, à proximité des transports en commun ;
- Une possibilité de télétravail ;
- Une politique de congés annuels offrant 22 jours de vacances dès l'embauche ;
- Un programme d'assurance collective complet (maladie, dentaire, invalidité, vie, compte de soin de santé, assurance voyage et garanties complémentaires) ;
- Un programme d'aide aux employés ;
- Un accès à un service de télémédecine ;
- Un régime d'épargne retraite avec contribution de l'employeur pouvant atteindre jusqu'à 10% du salaire ;
- Une équipe d'experts de leur domaine, des gens passionnés et passionnants;
- Une ambiance de travail collaborative et inclusive.

**Nous voulons vous connaître**

Veuillez noter que seules les personnes sélectionnées seront contactées.

More jobs from Mila - Institut québécois d'intelligence artificielle