cover image
STATION F

DATA ENGINEERING TECH LEAD H/F

Hybrid

Paris, France

Full Time

03-04-2025

Job Specifications

À propos

Ad Scientiam est une MedTech, basée dans le 13ème arrondissement à Paris. Au cœur du projet d’Ad Scientiam se trouve une conviction : mesurer et suivre l’évolution des maladies graves et invalidantes, en continu et en vie réelle, est indispensable à une meilleure prise en charge des personnes malades.

Ad Scientiam prend ce pari scientifique et technologique, pour qu’aujourd’hui chaque malade puisse être acteur de sa santé et pour accélérer le développement de nouveaux traitements.

Nous nous engageons pour que demain la médecine soit plus prédictive, préventive et individualisée. Nous en faisons le fondement de notre métier !

Nous concevons, validons et mettons en œuvre des biomarqueurs digitaux qui mesurent en continu et en vie réelle l’évolution de maladies chroniques.

Descriptif du poste

Le Pôle Data Science d’Ad Scientiam est constitué de 3 Data Scientists Seniors, 1 data Scientist Junior et 1 Lead Data Scientist. Le Data Engineering Tech Lead est un poste hybride, il est lead de la partie data ingénierie et contribue aux missions de Data Science en collaboration avec les autres data scientists pour le développement de biomarkers.

Le Data Engineering Tech Lead est un expert hybride qui combine les compétences de Data Engineering et de Data Science. Il/elle est responsable de la conception, du développement et de la mise en place des infrastructures de données, et participe également à leur analyse et modélisation pour répondre au besoin métier.

Il/elle assure également un rôle de leadership technique pour garantir la qualité, la performance et la sécurité des solutions déployées.

Activités liées aux aspects Data Engineering Tech Lead
Assurer la synchronisation et la mise à disposition des librairies de transformations des biomarqueurs et QCCs pour une intégration optimale dans la plateforme.
Contribuer à la documentation et spécification technique des librairies de transformation des biomarqueurs (Data Science) en vue de leur utilisation au sein de la plateforme.
Faciliter l’accès aux données produit/plateforme au sein du département scientifique via la mise en place d’APIs (ou autres).
Contribuer à la spécification et l’implémentation des tests de contrôle de la qualité de la donnée en accord avec les besoins métiers (data management, data science, produit).
Assurer le design, le développement, l’optimisation et la maintenance des librairies internes data (packages Python) et assurer la mise en production des PoCs (Proof of Concepts).
Assurer le déploiement et le monitoring continue des librairies internes data science.
Garantir la cohérence architecturale et être à l’initiative des choix techniques dans le développement des modules (existants et futures) pour les assets data science (librairies et pipeline) tout en s’assurant qu’ils répondent aux exigences de sécurité, de qualité, de performance et d'architecture générale de la plateforme.
Être garant de l’utilisation des packages et des bonnes pratiques de développement des membres de l’équipe data science pour garantir la qualité générale de la base de code (PR review) et participer à la formation continue à travers la présentation de concepts, pratiques et outils de programmation.
Assurer la veille technologique constante (Python, nouvelles features, …) au sein du pôle data science sur les différents enjeux techniques et métiers, communiquer et proposer des axes d’amélioration;
Optimiser la communication et les synergies entre les équipes data engineering et backend et sensibiliser aux besoins data engineering dans les autres services (acculturation)
Être le point de contact privilégié avec le SysAdmin pour toutes les demandes techniques (Azure, Azure DevOps) des équipes Data Science et Data Management.
Participer à la structuration de l’infrastructure technique avec les équipes (data science, data management, backend, produit, etc.,) et savoir effectuer des analyses d’impact mutuel.
Activités liées aux aspects Data scientist
Assurer et supporter la mise en place de collectes de données (internes ou externes) afin de créer un jeu de données pour vérifier et garantir la performance des algorithmes dans un usage attendu.
Participer à la conception, au développement, à l’évaluation et à la documentation des algorithmes (de transformation de la donnée, de traitement du signal, de machine learning, etc.) adaptés aux problématiques et contraintes posées par les équipes technique et médicale.
Assurer la communication avec le produit pour que les données collectées correspondent aux besoins data sciences et permettent le bon fonctionnement des algorithmes.

Profil recherché

Expérience requise en milieu professionnel (CDI/CDD) 2 ans minimum. Titulaire d’un niveau équivalent à un bac + 5 ou plus (exemple: informatique)
Excellente maîtrise de Python (dataclasses, typing, asyncio, threading, numpy, pandas).
Forte capacité d’analyse & data driven
Maîtrise des outils de développement (Git, Docker)
Bon niveau d’anglais indispensable (oral et écrit).
Bonus : Connaissance de Azure

Process de recrutement

Entretien téléphonique avec la RRH;
Un premier entretien en visioconférence avec la Lead data scientist et le Directeur scientifique;
Un test technique;
Un second entretien en présentiel et un live testing.

Informations complémentaires

Type de contrat : CDI
Date de début : 01 avril 2025
Lieu : Paris
Télétravail partiel possible

About the Company

STATION F is the world's biggest startup campus based in Paris, gathering a whole entrepreneurial ecosystem under one roof. Know more

Related Jobs

Company background Company brand
Company Name
SOFIP
Job Title
Data Analyst
Job Description
Vous êtes passionné(e) par la Data et souhaitez participer à une transformation concrète de l’usage de la donnée dans une entreprise en pleine évolution ? Rejoignez l’équipe SOFIP ! SOFIP est un acteur majeur de l’externalisation de force de vente pharmaceutique. Depuis 40 ans, nous accompagnons les plus grands laboratoires dans leur développement commercial en officine, parapharmacie et visite médicale. Grâce à notre expertise et à notre engagement, nous aidons nos clients à optimiser leur présence sur le terrain et à maximiser leur impact commercial. Dans un monde où la donnée devient un levier de performance clé, SOFIP structure son approche data pour accompagner sa transformation digitale. Notre objectif : construire une stack moderne et durable (datalake, outils de visualisation, automatisation) pour permettre aux équipes métier et partenaires de piloter efficacement leurs actions grâce à des données fiables, accessibles et lisibles. Vous rejoindrez une entreprise où l’IA est déjà utilisée au quotidien et où il reste encore beaucoup à construire : l’environnement est stimulant, les projets sont concrets, et l’impact est réel. La clé de notre succès ? Un engagement quotidien au service des marques que nous représentons. Notre plus grande force ? Nos équipes ! Nous investissons continuellement dans la formation et le développement de nos talents pour leur permettre de progresser et de contribuer activement à la réussite de SOFIP. Pour accompagner cette dynamique et renforcer notre expertise data, nous recherchons un(e) : Data Analyst h/f Vos missions Rattaché(e) au Lead Data, vous jouerez un rôle clé dans la structuration de notre chaîne de valeur data. Vous accompagnerez les équipes internes dans l’analyse, la visualisation et la valorisation des données issues du terrain. Vos principales responsabilités : 1. Collecte & préparation des données Collecter les données issues de différentes sources (internes comme externes). Nettoyer, structurer et fiabiliser les données pour les rendre exploitables. Contribuer à la mise en place et à l’évolution de notre modèle de données et des flux (ETL) dans le datalake. 2. Analyse & qualité Identifier les tendances, corrélations, anomalies, axes de performance. Élaborer et suivre les KPI métier pour mesurer l’efficacité des actions. Contribuer à l’amélioration continue de la qualité des données utilisées. 3. Restitution & visualisation Concevoir des dashboards dynamiques pour les équipes internes et les clients. Utiliser des outils comme Power BI pour rendre les données accessibles et actionnables. Maintenir les reportings à jour et pertinents, en fonction des évolutions du business. 4. Collaboration & accompagnement métier Travailler en lien étroit avec les équipes commerciales, marketing et direction. Comprendre les besoins, proposer des analyses adaptées, accompagner à la lecture des résultats. Participer à la construction d’une culture data partagée dans l’entreprise. Profil recherché Bac+5 (école d’ingénieurs, université) avec spécialisation en Data / BI / Statistiques / Informatique. 2 à 3 ans d’expérience minimum en tant que Data Analyst, idéalement dans un environnement multi-source / terrain. Maîtrise des outils de gestion et d’analyse de données : SQL, Python (ou R), Power BI, etc. Connaissance des processus ETL, des bonnes pratiques de structuration des données. Capacité à modéliser des KPIs pertinents et à raconter une histoire avec les données. Autonomie, rigueur, capacité de synthèse, bon relationnel et esprit d’initiative. Organisé(e), autonome, avec un excellent sens de la gestion du temps. Capable de communiquer clairement et de manière fluide vos analyses et recommandations à des interlocuteurs non techniques. Une sensibilité aux sujets IA, machine learning ou prédiction est un vrai plus. Ce que nous offrons En intégrant SOFIP, vous rejoignez une entreprise solide et performante, engagée dans la réussite individuelle et collective de chaque collaborateur/trice, avec : • Un système de rémunération attractif • Un management de proximité, alliant autonomie et accompagnement : vous ne serez jamais seul(e) ! • Des avantages divers : RTT, Carte Bimpli, CSE, mutuelle avantageuse, participation, travail au forfait jour, ordinateur fourni, et bien plus encore… Poste en CDI, à pourvoir dès que possible basé à Neuilly sur Seine. Intéressé(e)s ? Rencontrons-nous ! Un entretien de découverte avec le service Talent Acquisition Un questionnaire de personnalité à réaliser chez vous Un entretien final avec le Directeur Commercial Si tout cela résonne en vous, alors rejoignez-nous pour vivre cette expérience dans laquelle les mots engagement, esprit d’équipe, exigence et adaptabilité ne sont pas que des concepts ! On a hâte de vous rencontrer !
Neuilly-Sur-Seine, France
Hybrid
Full Time
11-04-2025
Company background Company brand
Company Name
Syntetica
Job Title
R&D Data Lead
Job Description
Who are we? Syntetica is an early-stage chemical startup on a mission to decarbonize the textile industry through textile-to-textile recycling — starting with nylon. Today, most synthetic textiles are made from crude oil, and less than 1% are recycled back into new fibers. We're here to change that. At Syntetica, we’ve developed a patented depolymerization process that breaks down nylon-rich textile waste into virgin-equivalent nylon monomers — while separating materials like elastane, polyester, and cotton for further recycling. Backed by Entrepreneur First, we’ve raised €4.2M from leading investors including EQT Ventures, the family offices of Peugeot and Etam, as well as high-profile athletes like Paul-Henri Mathieu and Jean-Éric Vergne. We’ve already forged key partnerships with major textile players like Victoria’s Secret and ETAM — as well as leading fast fashion and sportswear brands — and have assembled a core team of 12 experts. If you want to help bring truly circular materials to global scale — and solve one of the textile industry’s biggest sustainability challenges — come build with us. Your role at Syntetica As the R&D Data Lead, you will design and implement our data strategy related to our R&D product & process development — from lab-level measurement protocols to driving correlation and prediction insights. You will be the go-to person for how we capture, structure, and leverage data in the lab to support both process development and product development objectives, and play a critical role in accelerating R&D through data-informed decision-making. Key Responsibilities Data Collection & Measurement Design and implement data collection protocols across lab experiments Ensure the right instrumentation and measurement tools (e.g., XRF, HPLC, GPC) are in place to capture the right data at the right moment Collaborate with technical and production teams to define critical experimental variables and outputs Lead characterization efforts with external labs and select technical partners for advanced analysis Data Organisation & Infrastructure Build and maintain data tracking systems using Google Sheets, Notion, Airtable or equivalent tools Create structured data templates per protocol and experiment type Organise, clean, and standardise datasets for cross-experiment comparison and reproducibility Develop protocols for data hygiene and quality control Data Analysis & Insight Generation Drive exploratory data analysis, trend identification, and correlation mapping on tools such as JMP, Minitab and/or directly with Python Support experimental planning by identifying predictive patterns and variables Build tools or frameworks to assist chemists and engineers in hypothesis generation and validation Data Leadership Champion a data-first culture within the R&D team Provide internal training and documentation on data best practices and guide the long-term evolution of our lab and scale-up data architecture What we're looking for Background Master’s degree or plus in Engineering, Chemistry, Materials Science, or a related field from a top-tier university 3-5 years of experience in data-related roles within technical scientific environments (e.g. Product Performance, Data & Characterisation, Quality Control) in startups or fast-paced environments. Skills: Data-driven & Analytical mindset: Data obsessed, including around collecting, analysing and connecting data with product performance Highly skilled in tools such as JMP, Minitab or in using Python and/or other relevant tools/languages Excellent & fluent communication skills in English & French A strong bias for action with high autonomy and the ability to drive others around you. Highly structured and process-driven Why join Syntetica? Mission-driven company: Play a pivotal role in decarbonising one of the most polluting industries globally. World-class team: Collaborate with a group of 10 passionate and brilliant experts growing to 25 by the end of the year Cutting-edge technology: Syntetica is revolutionising nylon recycling with a unique chemical depolymerisation process, enabling the recycling of mixed textiles in a €35 billion global market. Hypergrowth startup: Following our €4.2M funding round, we plan to more than double our team within a year, including tripling our technical team. Recruitment Process Screening call with People Lead – 15 minutes. "Who" interview with Marco, CEO – 45 mins Business Case with Albert & Florian, COO - 1 hour Culture fit interview with Louis, Co-Founder & CTO– 45 mins Reference calls
Paris, France
On site
Full Time
10-04-2025
Company background Company brand
Company Name
ALPHA10X
Job Title
VP, Data Engineering
Job Description
About This Role ALPHA10X is the AI leader in private markets investments. Our Nostradamus platform analyzes data at scale to shape the knowledge and foresight that generate alpha and impact. The company is a well-funded growth stage startup and aspiring unicorn, rapidly expanding our revenue, customer base, and market presence, while scaling operations, enhancing products, and securing additional funding to further accelerate development. Our team includes prominent business leaders, investors, scholars, and data scientists. ALPHA10X is looking for a skilled VP, Data Engineering. Reporting to the CTO, responsibilities include leading and scaling the data engineering team to deliver a robust, reliable, and scalable data platform. You will drive excellence in infrastructure, CI/CD, observability, and data quality to support AI/ML, semantic search, and enterprise-grade delivery. Key Responsibilities Collaboration: Work cross-functionally with Software, AI, Product, and Data teams. Translate business needs into scalable technical solutions. Architecture & Delivery: Own and evolve the data platform (Azure, Databricks, Spark, Neo4j, Elasticsearch). Drive best practices in data ingestion, transformation, and access layers. CI/CD & Testing: Establish robust pipelines, test suites, and reproducibility for all data processes. Platform Reliability: Implement observability, data monitoring, alerting, and error handling. Team Building: Grow and mentor a team of 2+ data engineers. Set the technical bar and foster a strong engineering culture. What We Value Initiative and curiosity. Low ego because the outcome matters more than who gets the credit. Adaptive and introspective; willing to learn, guide, lead, and follow. Unrelenting drive to push the boundaries of AI and data science. What We Are Looking For Hard Skills 8+ years in data engineering, including hands-on Spark and ElasticSearch. Proficient in Python and SQL. Strong experience with CI/CD, testing frameworks (e.g., DBT tests, Pytest, Great Expectations). Familiarity with Neo4j, Databricks, and cloud platforms (Azure a strong plus). Familiarity with real-time pipelines or streaming (e.g., Kafka). Exposure to ML pipelines or AI/LLM infrastructure. Soft skills Proven experience leading small technical teams and mentoring engineers. Strong communication and problem-solving skills. Experience in startups or fast-paced environments. Why Join Us? Innovation: Play a key role in advancing the capabilities of AI in fintech, working with some of the brightest minds in the industry. Leadership: As part of the future shaping team, you will have a direct impact on the company's growth and strategic direction. Growth Opportunities: Join a fast-paced, high-growth startup with significant equity participation and potential for personal and professional advancement. Global Impact: Be part of a team that connects people, capital, and ideas to solve some of the world’s greatest challenges through AI-driven financial solutions. To apply, please email: hr@alpha10x.com
Aix-En-Provence, France
On site
Full Time
11-04-2025
Company background Company brand
Company Name
CEVA SANTE ANIMALE
Job Title
Spécialiste en données - Data Science
Job Description
The success of a company depends on the passionate people we partner with. Together, let's share our talents. As a global leader in animal health, Ceva Animal Health believes our success is linked to our passionate people researching, developing , producing and supplying innovative health solutions for all animals, which contributes to the future of our diverse planet. We are committed to ensuring the highest possible level of care and well-being for farm animals (poultry, pigs, ruminants), companion animals (dogs and cats) and wildlife. Indeed, Our “Together, Beyond Animal Health” vision emphasizes that the health and wellbeing of people, animals and our planet are totally interlinked. More than ever, Ceva is committed to a "One Health" approach. As part of our “Diversity, Equity and Inclusion” policy, Ceva Animal Heath is committed to the employment of people with disabilities and will make reasonable accommodations throughout the interview process to ensure an inclusive and accessible experience for all applicants. To request an accommodation, please contact a member of the Ceva Talent Acquisition team. Your Missions L’unité SSIU (Scientific Studies Investigations Units) de Ceva Biogenovac recherche un(e) spécialiste en données pour un poste en CDD de avril à décembre 2025 basé sur le Campus de Beaucouzé, à 5 minutes d’Angers (49). Rattaché(e) à la plateforme mondiale de laboratoires SSIU, vous contribuerez à la valorisation des données de laboratoires et la digitalisation de certaines opérations. Vous serez également responsable de la gouvernance des données de terrain à des fins épidémiologiques, assurant la qualité, la traçabilité, la sécurité et l'intégrité des données collectées. Vous participerez à l'analyse des données pour fournir des insights précieux sur les évolutions de différents pathogènes chez les animaux de rente. Vos Responsabilités L’intégration et la gouvernance des données de laboratoires (internes et externes) dans le Système d’Information (LIMS) de la plateforme de laboratoires de Ceva. La validation et l’intégration de séquences génomiques de laboratoires partenaires à Ceva dans des bases de données de séquences et les pipelines d’analyse et de visualisation de données (e.g., NextStrain). L’automatisation de rapports de laboratoires intégrant les données terrain, les résultats du LIMS et de séquençage, et les représentations phylogéniques et épidémiologiques. La conception de dashboards avec des analyses d’indicateurs intégrant des résultats de laboratoire et des données issues d’autres sources. L’accompagnement du déploiement en Europe de l’Ouest de l’outil de collecte de données de terrain, en lien avec le LIMS. La gouvernance des données épidémiologiques, incluant la gestion de la traçabilité, la qualité, la sécurité et l'intégrité des données, ainsi que leur analyse. Vous travaillerez en collaboration avec les autres équipes SSIU dans le monde, avec l’équipe de la plateforme de bioinformatique, également basée à Ceva Biogenovac, et avec l’IT principalement basée en France. Your Profile Niveau d’étude / formation : Diplômé(e) d’un Master en data science/analyse, bio-informatique, ou domaines connexes. Compétences Techniques / Savoir-faire Maîtrise de l’anglais (oral et écrit) Maîtrise des outils d’analyse de données (Excel, Python, API, Bases de données) Connaissances basiques des données génomiques Curiosité pour les données de laboratoire biologiques (types d’analyse, métadonnées associées) et la santé animale / santé publique Une compétence en Power BI est préférable Notions de base en bureautique Compétences Comportementales / Savoir Être Vous êtes organisé(e), rigoureux(se) et autonome. Vous êtes engagé(e) dans votre travail, vous avez l’esprit d’équipe et l'envie d’apprendre de nouvelles technologies. Vous êtes ouvert à un environnement de travail multiculturel.
Maine-Et-Loire, France
On site
Full Time
11-04-2025