Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
documentation:data:pretraitements [2024/04/18 14:20] – [Règle 3 Capteur HS] baudryjdocumentation:data:pretraitements [2024/04/18 14:59] (Version actuelle) – [Prétraitements] baudryj
Ligne 2: Ligne 2:
  
  
 +Bilan de la réunion  de lundi 15/04/2024
 +
 +
 +Il faut intégrer le code de Nour dans ce notebook
 +
 +
 +Lien notedbook : https://colab.research.google.com/drive/13p8E_YmWwedeF0qktLFrJMufNOK9hdsj?usp=sharing
 +
 +
 +{{ :documentation:data:pasted:20240418-165830.png?700 }}
 ===== Règle 1 : x1 ===== ===== Règle 1 : x1 =====
  
Ligne 10: Ligne 20:
  
  
-===== Règle 2 : OutOfRange =====+ 
 +===== Règle 2 Capteur HS ===== 
 + 
 +  * Si les valeurs sont en dehors des bornes pendant 15 min alors le capteur est HS 
 + 
 + 
 + 
 +===== Règle 3 : OutOfRange (mauvaises données) =====
  
   * Si les données ne sont pas dans l'interval [0, 800] on prend la dernière données valide   * Si les données ne sont pas dans l'interval [0, 800] on prend la dernière données valide
Ligne 17: Ligne 34:
  
  
-===== Règle 3 Capteur HS =====+===== Règle 4 : Trous ===== 
 + 
 +  * S'il y a des tous dans les données alors on comble la valeur par la dernière valeur valide 
 +  * Python :  
 + 
 +<code python> 
 +def missed_data_process(data:pd.core.frame.DataFrame, freq='10S'): 
 +  time_index = pd.date_range(start=data.index.min(), end=data.index.max(), freq=freq) 
 +  data = data.resample(freq).interpolate(method='nearest'
 +  return data 
 +data = missed_data_process(data) 
 +</code> 
 +===== Règle 5 : Valeurs incohérentes ===== 
 + 
 +  * techniquement la valeur est bonne [0, 800] mais physiologiquement impossible 
 +  * (règles à déterminer) 
 +  * ajouter un champ pour indiquer si les valeurs sont d'origines ou modifiées par un algo 
 + 
 + 
 +===== Règle 6 : Transformation Gauss / Distance ===== 
 + 
 +  * appliquer la règle et ajouter une colonne "distance" dans la table 
 +  * d = racine(1/gauss) 
 + 
 + 
 +===== Règle 7 : normalisation ===== 
 + 
 +  * Projeter les données dans un espace [0,1] 
 + 
 + 
 +===== Règle 8 ... X ===== 
 + 
 +  * Ajouter des métriques complémentaires 
 +  * Etat : filtration / évitement 
 +  * Activité : ouverture / fermeture 
 +  * Compléter avec d'autres règles / indicateurs
  
-  * Si les valeurs sont en dehors des bornes pendant 15 min alors le capteur est HS 
Haut de page