# Expérience de Machine Learning avec et sans MLflow
Ce notebook illustre comment effectuer et comparer des expériences de machine learning avec et sans MLflow, afin de démontrer l'impact de MLflow sur la traçabilité et la reproductibilité.

## Installation des Dépendances

In [31]:
!pip install mlflow numpy pandas scikit-learn





In [32]:
import numpy as np
import pandas as pd
from sklearn.datasets import load_diabetes
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
import mlflow
import mlflow.sklearn

# Chargement des données
X, y = load_diabetes(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

## Expérience sans MLflow
Tout d'abord, réalisons une expérience simple de machine learning sans utiliser MLflow pour enregistrer les détails de l'expérience.

In [34]:
# Entraînement du modèle
model_without_mlflow = LinearRegression()
model_without_mlflow.fit(X_train, y_train)

# Prédiction et évaluation
y_pred = model_without_mlflow.predict(X_test)
mse_without_mlflow = mean_squared_error(y_test, y_pred)
mae_without_mlflow = mean_absolute_error(y_test, y_pred)
r2_without_mlflow = r2_score(y_test, y_pred)

print(f"Sans MLflow - MSE: {mse_without_mlflow}, MAE: {mae_without_mlflow}, R2: {r2_without_mlflow}")

Sans MLflow - MSE: 2900.19362849348, MAE: 42.79409467959994, R2: 0.4526027629719197


## Expérience avec MLflow
Maintenant, répétons la même expérience en utilisant MLflow pour enregistrer les détails.

In [43]:
mlflow.set_experiment("linear_regression_with_metrics")

with mlflow.start_run():
    # Entraînement du modèle
    model_with_mlflow = LinearRegression()
    model_with_mlflow.fit(X_train, y_train)
    
    # Prédiction et évaluation
    y_pred = model_with_mlflow.predict(X_test)
    mse_with_mlflow = mean_squared_error(y_test, y_pred)
    mae_with_mlflow = mean_absolute_error(y_test, y_pred)
    r2_with_mlflow = r2_score(y_test, y_pred)

    # Enregistrement des métriques avec MLflow
    # mlflow.log_metrics({"mse": mse_with_mlflow, "mae": mae_with_mlflow, "r2": r2_with_mlflow})
    # mlflow.sklearn.log_model(model_with_mlflow, "model")
    mlflow.autolog()
    print(f"Avec MLflow - MSE: {mse_with_mlflow}, MAE: {mae_with_mlflow}, R2: {r2_with_mlflow}")


2024/02/01 18:12:11 INFO mlflow.tracking.fluent: Autologging successfully enabled for sklearn.


Avec MLflow - MSE: 2900.19362849348, MAE: 42.79409467959994, R2: 0.4526027629719197


## Comparaison des Résultats

En comparant les résultats, nous pouvons observer que l'utilisation de MLflow n'affecte pas directement les performances du modèle (mesurées par le MSE dans cet exemple), mais fournit une plate-forme pour enregistrer de manière systématique et accessible les détails de l'expérience, facilitant ainsi la reproductibilité.

In [13]:
!mlflow ui

^C
