Menu

Sara MADANI (MADANI)

  • kontiki
  • Data Engineer

Paris

En résumé

Data Engineer depuis plus de 2 ans, j'ai réalisé de nombreuses pipelines data pour alimenter des datalakes en développant des processus ETL, et travaillé pour des grands groupes. Mon champs de compétences comprend : orchestration des workflows des pipelines, développement des APIs, configuration CI/CD..

Entreprises

  • kontiki - Data Engineer

    Informatique | Paris (75000) 2022 - 2022 Au sein du Kontiki Media (Société de marketing digital), j’ai travaillé sur un projet d’alimentation d’un Data Lake ayant pour objectif le développement des pipelines data, et la gestion des tables métiers client.
    • Développement d’un moteur de génération de segments via des pipelines data permettant
    de créer, modifier et supprimer des segments.
    • Transformation etstockage des données métiers deBigQuery vers Google Storage (processus
    ETL).
    • Traitement des données sous Pyspark en utilisant Dataproc.
    • Développement des pipelines data sur Airflow avec Python.
    • Création d’images Docker sur Container Registry en utilisant des Dockerfiles.
    • Configuration des pipelines CI/CD (Continuous Integration, Continuous Delivery) en utilisant
    Github et CloudBuild.
    • Création des Web services (API Rest) pour lier les pipelines data avec l’interface utilisateur
    (Traffic manager).
    • Développement des APIs sur Flask et leur déploiement sur Cloud Run.
  • Kheopsys - Data Engineer

    Informatique | Paris (75000) 2022 - 2022 Au sein du cabinet de conseil Kheopsys,j’ai travaillé sur un projet client Mediarithmics qui avait pour objectif le développement des pipelines data afin de répondre aux besoins client.
    En tant que Data Engineer au sein d’une équipe agile, mon rôle était de développer des workflows
    data sur les services Cloud d’Amazon Web Services.
    • Participation aux rituels agiles (Daily, Sprint planning).
    • Stockage des données métiers au niveau de S3.
    • Implémentation pipelines data permettant l’automatisation de transformation des données.
    • Surveillance de la qualité des données en temps réel (Monitoring).
    • Réalisation des projets ad-hoc: Segmentation des applications Android et IOS dont les données
    sont extraites par webscraping à partir du Play Store et
    App Store sous python.
  • GoMycode - Data Scientist

    Informatique | Tunis 2020 - 2021 As a member of the Data Team, I worked on several tasks since I’ve joined the team:
    ► Verification of the validity and reliability of data.
    ► Data management, processing and analysis.
    ► Update the databases by dealing with missing data and removing errors.
    ► Supervised two engineering students to implement a Machine Learning model for customers performance forecasting: Predict customer performance based on their scores and time spent per section in order to detect anomalies, and deficiencies in the program content and structure by implementing ML algorithms using scikit learn.
    Compétences : Python · Machine Learning
  • GoMyCode - AI Content Creator & Python Instructor

    Informatique | Tunis 2018 - 2019 ► As a part-time AI instructor, I was charged with teaching the Artificial Intelligence program in GoMyCode, teaching such a trending topic to students from different domains, was a challenging and undoubtedly fruitful experience. What I cherish the most about my work experience as an Instructor is the difference I get to make in the lives of my students just as much as they are making in mine.


    ► As a content creator, I implemented a three-level AI program for GoMyCode students. The curriculum of the program is as below:
    Level 1: Coding with python:
    Learn python as the most popular language by exploring its syntax(keywords, comments, indentation, statements), discovering its data types, examining its basic data structures, conditions and loop, and manipulating its libraries such as numpy and pandas, matplotlib and seaborn...
    Level 2: Introduction to AI:
    In this course, the student will be onboarded in Data Science world by:
    **Learning the keys of Data Science(applications, tools, timeline...)
    **Making difference between Data Science, Machine learning, and Deep learning
    **Exploring how to preprocess Data(Data cleaning and transformation)
    **Discovering the algorithms of supervised(regression/classification: logistic regression, knn, decision tree, random forest...) and unsupervised learning( agglomerative clustering, KMeans..)
    **Exploring the strength and weaknesses of each algorithm
    Level 3: Deep learning
    In this course, the student learns how to create powerful deep neural networks and deep learning algorithms.
    **Overview and basics of the most known and successful deep learning networks such as MLP, CNN, RNN, and its variant: Long Short Term Memory (LSTM).**Understand the key parameters in a Neural Network's architecture.
    **Practical methodology to train, debug and improve the performance on deep learning models.

Formations

Réseau

Annuaire des membres :