forked from ScoDoc/ScoDoc
Corrige les erreurs de classement dans synthese_jury_par_tag
This commit is contained in:
parent
c9af2345fb
commit
5828d4aaaf
@ -353,90 +353,90 @@ class JuryPE(object):
|
|||||||
):
|
):
|
||||||
trajectoires_tagguees.append(trajectoire_tagguee)
|
trajectoires_tagguees.append(trajectoire_tagguee)
|
||||||
|
|
||||||
# Ajout des notes
|
# Combien de notes vont être injectées ?
|
||||||
notes = pd.DataFrame(index=etudids, columns=[ [descr], [""], ["note"] ])
|
|
||||||
|
|
||||||
nbre_notes_injectees = 0
|
nbre_notes_injectees = 0
|
||||||
for traj in trajectoires_tagguees:
|
for traj in trajectoires_tagguees:
|
||||||
moy_traj = traj.moyennes_tags[tag]
|
moy_traj = traj.moyennes_tags[tag]
|
||||||
notes_traj = moy_traj.get_df_notes(arrondi=True)
|
inscrits_traj = moy_traj.inscrits_ids
|
||||||
etudids_communs = notes_traj.index.intersection(etudids)
|
etudids_communs = set(etudids) & set(inscrits_traj)
|
||||||
nbre_notes_injectees += len(etudids_communs)
|
nbre_notes_injectees += len(etudids_communs)
|
||||||
notes.loc[etudids_communs, (descr, "", "note")] = notes_traj.loc[etudids_communs, "notes"]
|
|
||||||
|
|
||||||
# Si l'aggrégat est significatif (aka il y a des notes)
|
# Si l'aggrégat est significatif (aka il y a des notes)
|
||||||
if nbre_notes_injectees > 0:
|
if nbre_notes_injectees > 0:
|
||||||
df_synthese = df_synthese.join(notes)
|
# Ajout des données classements & statistiques
|
||||||
|
|
||||||
# Ajout des classements & statistiques
|
|
||||||
donnees = pd.DataFrame(
|
|
||||||
index=etudids,
|
|
||||||
columns=[ [descr]*4, [NOM_STAT_GROUPE]*4, ["class.", "min", "moy", "max"] ],
|
|
||||||
)
|
|
||||||
# donnees[(descr, NOM_STAT_GROUPE, "class.")] = donnees[
|
|
||||||
# (descr, NOM_STAT_GROUPE, "class.")
|
|
||||||
# ].astype(str)
|
|
||||||
# donnees[(descr, NOM_STAT_GROUPE, "class.")] = np.nan
|
|
||||||
|
|
||||||
for traj in trajectoires_tagguees:
|
|
||||||
moy_traj = traj.moyennes_tags[tag]
|
|
||||||
|
|
||||||
# Les classements
|
|
||||||
rangs = moy_traj.get_df_rangs_pertinents()
|
|
||||||
|
|
||||||
# Les etudids communs pour la trajectoire
|
|
||||||
etudids_communs = rangs.index.intersection(etudids)
|
|
||||||
|
|
||||||
donnees.loc[
|
|
||||||
etudids_communs, (descr, NOM_STAT_GROUPE, "class.")
|
|
||||||
] = rangs.loc[etudids_communs, "rangs"]
|
|
||||||
|
|
||||||
# Le min
|
|
||||||
donnees.loc[
|
|
||||||
etudids_communs, (descr, NOM_STAT_GROUPE, "min")
|
|
||||||
] = moy_traj.get_min_for_df()
|
|
||||||
# Le max
|
|
||||||
donnees.loc[
|
|
||||||
etudids_communs, (descr, NOM_STAT_GROUPE, "max")
|
|
||||||
] = moy_traj.get_max_for_df()
|
|
||||||
# La moyenne
|
|
||||||
donnees.loc[
|
|
||||||
etudids_communs, (descr, NOM_STAT_GROUPE, "moy")
|
|
||||||
] = moy_traj.get_moy_for_df()
|
|
||||||
|
|
||||||
df_synthese = df_synthese.join(donnees)
|
|
||||||
|
|
||||||
# Ajoute les données d'interclassement
|
|
||||||
interclass = self.interclassements_taggues[aggregat]
|
|
||||||
moy_traj = interclass.moyennes_tags[tag]
|
|
||||||
|
|
||||||
nom_stat_promo = f"{NOM_STAT_PROMO} {self.diplome}"
|
nom_stat_promo = f"{NOM_STAT_PROMO} {self.diplome}"
|
||||||
donnees = pd.DataFrame(
|
donnees = pd.DataFrame(
|
||||||
index=etudids,
|
index=etudids,
|
||||||
columns=[ [descr]*4, [nom_stat_promo]*4, ["class.", "min", "moy", "max"] ],
|
columns=[
|
||||||
|
[descr] * (1 + 4 * 2),
|
||||||
|
[""] + [NOM_STAT_GROUPE] * 4 + [nom_stat_promo] * 4,
|
||||||
|
["note"] + ["class.", "min", "moy", "max"] * 2,
|
||||||
|
],
|
||||||
)
|
)
|
||||||
|
|
||||||
# Les classements
|
for traj in trajectoires_tagguees:
|
||||||
rangs = moy_traj.get_df_rangs_pertinents()
|
# Les données des trajectoires_tagguees
|
||||||
|
moy_traj = traj.moyennes_tags[tag]
|
||||||
|
|
||||||
etudids_communs = rangs.index.intersection(etudids)
|
# Les étudiants communs entre tableur de synthèse et trajectoires
|
||||||
|
inscrits_traj = moy_traj.inscrits_ids
|
||||||
|
etudids_communs = list(set(etudids) & set(inscrits_traj))
|
||||||
|
|
||||||
donnees.loc[
|
# Les notes
|
||||||
etudids_communs, (descr, nom_stat_promo, "class.")
|
champ = (descr, "", "note")
|
||||||
] = rangs.loc[etudids_communs, "rangs"]
|
notes_traj = moy_traj.get_notes()
|
||||||
|
donnees.loc[etudids_communs, champ] = notes_traj.loc[
|
||||||
|
etudids_communs]
|
||||||
|
|
||||||
# Le min
|
# Les rangs
|
||||||
donnees.loc[
|
champ = (descr, NOM_STAT_GROUPE, "class.")
|
||||||
etudids_communs, (descr, nom_stat_promo, "min")
|
rangs = moy_traj.get_rangs_inscrits()
|
||||||
] = moy_traj.get_min_for_df()
|
donnees.loc[etudids_communs, champ] = rangs.loc[
|
||||||
# Le max
|
etudids_communs
|
||||||
donnees.loc[
|
]
|
||||||
etudids_communs, (descr, nom_stat_promo, "max")
|
|
||||||
] = moy_traj.get_max_for_df()
|
# Les mins
|
||||||
# La moyenne
|
champ = (descr, NOM_STAT_GROUPE, "min")
|
||||||
donnees.loc[
|
mins = moy_traj.get_min()
|
||||||
etudids_communs, (descr, nom_stat_promo, "moy")
|
donnees.loc[etudids_communs, champ] = mins.loc[etudids_communs]
|
||||||
] = moy_traj.get_moy_for_df()
|
|
||||||
|
# Les max
|
||||||
|
champ = (descr, NOM_STAT_GROUPE, "max")
|
||||||
|
maxs = moy_traj.get_max()
|
||||||
|
donnees.loc[etudids_communs, champ] = maxs.loc[etudids_communs]
|
||||||
|
|
||||||
|
# Les moys
|
||||||
|
champ = (descr, NOM_STAT_GROUPE, "moy")
|
||||||
|
moys = moy_traj.get_max()
|
||||||
|
donnees.loc[etudids_communs, champ] = moys.loc[etudids_communs]
|
||||||
|
|
||||||
|
# Ajoute les données d'interclassement
|
||||||
|
interclass = self.interclassements_taggues[aggregat]
|
||||||
|
moy_interclass = interclass.moyennes_tags[tag]
|
||||||
|
|
||||||
|
# Les étudiants communs entre tableur de synthèse et l'interclassement
|
||||||
|
inscrits_interclass = moy_interclass.inscrits_ids
|
||||||
|
etudids_communs = list(set(etudids) & set(inscrits_interclass))
|
||||||
|
|
||||||
|
# Les classements d'interclassement
|
||||||
|
champ = (descr, nom_stat_promo, "class.")
|
||||||
|
rangs = moy_interclass.get_rangs_inscrits()
|
||||||
|
donnees.loc[etudids_communs, champ] = rangs.loc[etudids_communs]
|
||||||
|
|
||||||
|
# Les mins
|
||||||
|
champ = (descr, nom_stat_promo, "min")
|
||||||
|
mins = moy_interclass.get_min()
|
||||||
|
donnees.loc[etudids_communs, champ] = mins.loc[etudids_communs]
|
||||||
|
|
||||||
|
# Les max
|
||||||
|
champ = (descr, nom_stat_promo, "max")
|
||||||
|
maxs = moy_interclass.get_max()
|
||||||
|
donnees.loc[etudids_communs, champ] = maxs.loc[etudids_communs]
|
||||||
|
|
||||||
|
# Les moys
|
||||||
|
champ = (descr, nom_stat_promo, "moy")
|
||||||
|
moys = moy_interclass.get_max()
|
||||||
|
donnees.loc[etudids_communs, champ] = moys.loc[etudids_communs]
|
||||||
|
|
||||||
df_synthese = df_synthese.join(donnees)
|
df_synthese = df_synthese.join(donnees)
|
||||||
# Fin de l'aggrégat
|
# Fin de l'aggrégat
|
||||||
|
@ -73,8 +73,14 @@ class MoyenneTag:
|
|||||||
"""
|
"""
|
||||||
self.tag = tag
|
self.tag = tag
|
||||||
"""Le tag associé à la moyenne"""
|
"""Le tag associé à la moyenne"""
|
||||||
self.synthese = self.comp_moy_et_stat(notes)
|
self.etudids = list(notes.index) # calcul à venir
|
||||||
"""La synthèse des notes/classements/statistiques"""
|
"""Les id des étudiants"""
|
||||||
|
self.inscrits_ids = notes[notes.notnull()].index.to_list()
|
||||||
|
"""Les id des étudiants dont la moyenne est non nulle"""
|
||||||
|
self.df: pd.DataFrame = self.comp_moy_et_stat(notes)
|
||||||
|
"""Le dataframe retraçant les moyennes/classements/statistiques"""
|
||||||
|
self.synthese = self.to_dict()
|
||||||
|
"""La synthèse (dictionnaire) des notes/classements/statistiques"""
|
||||||
|
|
||||||
def __eq__(self, other):
|
def __eq__(self, other):
|
||||||
"""Egalité de deux MoyenneTag lorsque leur tag sont identiques"""
|
"""Egalité de deux MoyenneTag lorsque leur tag sont identiques"""
|
||||||
@ -94,54 +100,85 @@ class MoyenneTag:
|
|||||||
Un dictionnaire stockant les notes, les classements, le min,
|
Un dictionnaire stockant les notes, les classements, le min,
|
||||||
le max, la moyenne, le nb de notes (donc d'inscrits)
|
le max, la moyenne, le nb de notes (donc d'inscrits)
|
||||||
"""
|
"""
|
||||||
# Supprime d'éventuels chaines de caractères dans les notes
|
df = pd.DataFrame(
|
||||||
|
np.nan,
|
||||||
|
index=self.etudids,
|
||||||
|
columns=[
|
||||||
|
"note",
|
||||||
|
"classement",
|
||||||
|
"rang",
|
||||||
|
"min",
|
||||||
|
"max",
|
||||||
|
"moy",
|
||||||
|
"nb_etuds",
|
||||||
|
"nb_inscrits",
|
||||||
|
],
|
||||||
|
)
|
||||||
|
|
||||||
|
# Supprime d'éventuelles chaines de caractères dans les notes
|
||||||
notes = pd.to_numeric(notes, errors="coerce")
|
notes = pd.to_numeric(notes, errors="coerce")
|
||||||
|
df["note"] = notes
|
||||||
|
|
||||||
# Les indices des ... et les notes non nulles/pertinentes
|
# Les nb d'étudiants & nb d'inscrits
|
||||||
indices = notes.notnull()
|
df["nb_etuds"] = len(self.etudids)
|
||||||
notes_non_nulles = notes[indices]
|
df.loc[self.inscrits_ids, "nb_inscrits"] = len(self.inscrits_ids)
|
||||||
|
|
||||||
# Les classements sur les notes non nulles
|
# Le classement des inscrits
|
||||||
(_, class_gen_ue_non_nul) = comp_ranks_series(notes_non_nulles)
|
notes_non_nulles = notes[self.inscrits_ids]
|
||||||
|
(class_str, class_int) = comp_ranks_series(notes_non_nulles)
|
||||||
|
df.loc[self.inscrits_ids, "classement"] = class_int
|
||||||
|
|
||||||
# Les classements (toutes notes confondues, avec NaN si pas de notes)
|
# Le rang (classement/nb_inscrit)
|
||||||
class_gen_ue = pd.Series(np.nan, index=notes.index) # , dtype="Int64")
|
df["rang"] = df["rang"].astype(str)
|
||||||
class_gen_ue[indices] = class_gen_ue_non_nul[indices]
|
df.loc[self.inscrits_ids, "rang"] = (
|
||||||
|
df.loc[self.inscrits_ids, "classement"].astype(int).astype(str)
|
||||||
|
+ "/"
|
||||||
|
+ df.loc[self.inscrits_ids, "nb_inscrits"].astype(int).astype(str)
|
||||||
|
)
|
||||||
|
|
||||||
|
# Les stat (des inscrits)
|
||||||
|
df.loc[self.inscrits_ids, "min"] = notes.min()
|
||||||
|
df.loc[self.inscrits_ids, "max"] = notes.max()
|
||||||
|
df.loc[self.inscrits_ids, "moy"] = notes.mean()
|
||||||
|
|
||||||
|
return df
|
||||||
|
|
||||||
|
def to_dict(self) -> dict:
|
||||||
|
"""Renvoie un dictionnaire de synthèse des moyennes/classements/statistiques"""
|
||||||
synthese = {
|
synthese = {
|
||||||
"notes": notes,
|
"notes": self.df["note"],
|
||||||
"classements": class_gen_ue,
|
"classements": self.df["classement"],
|
||||||
"min": notes.min(),
|
"min": self.df["min"].mean(),
|
||||||
"max": notes.max(),
|
"max": self.df["max"].mean(),
|
||||||
"moy": notes.mean(),
|
"moy": self.df["moy"].mean(),
|
||||||
"nb_inscrits": sum(indices),
|
"nb_inscrits": self.df["nb_inscrits"].mean(),
|
||||||
}
|
}
|
||||||
return synthese
|
return synthese
|
||||||
|
|
||||||
def get_df_notes(self, arrondi=False):
|
def get_notes(self):
|
||||||
"""Série des notes, arrondies à 2 chiffres après la virgule"""
|
"""Série des notes, arrondies à 2 chiffres après la virgule"""
|
||||||
if arrondi:
|
return self.df["note"].round(2)
|
||||||
serie = self.synthese["notes"].round(2)
|
|
||||||
else:
|
|
||||||
serie = self.synthese["notes"]
|
|
||||||
df = serie.to_frame("notes")
|
|
||||||
return df
|
|
||||||
|
|
||||||
def get_df_rangs_pertinents(self) -> pd.Series:
|
def get_rangs_inscrits(self) -> pd.Series:
|
||||||
"""Série des rangs classement/nbre_inscrit"""
|
"""Série des rangs classement/nbre_inscrit"""
|
||||||
classement = self.synthese["classements"]
|
return self.df["rang"]
|
||||||
indices = classement[classement.notnull()].index.to_list()
|
|
||||||
classement_non_nul = classement.loc[indices].to_frame("classements")
|
|
||||||
classement_non_nul.insert(1, "rangs", np.nan)
|
|
||||||
|
|
||||||
nb_inscrit = self.synthese["nb_inscrits"]
|
def get_min(self) -> pd.Series:
|
||||||
|
"""Série des min"""
|
||||||
|
return self.df["min"].round(2)
|
||||||
|
|
||||||
|
def get_max(self) -> pd.Series:
|
||||||
|
"""Série des max"""
|
||||||
|
return self.df["max"].round(2)
|
||||||
|
|
||||||
|
def get_moy(self) -> pd.Series:
|
||||||
|
"""Série des moy"""
|
||||||
|
return self.df["moy"].round(2)
|
||||||
|
|
||||||
classement_non_nul["rangs"] = classement_non_nul["classements"].astype(int).astype(str) + "/" + str(nb_inscrit)
|
|
||||||
return classement_non_nul["rangs"].to_frame("rangs")
|
|
||||||
|
|
||||||
def get_note_for_df(self, etudid: int):
|
def get_note_for_df(self, etudid: int):
|
||||||
"""Note d'un étudiant donné par son etudid"""
|
"""Note d'un étudiant donné par son etudid"""
|
||||||
return round(self.synthese["notes"].loc[etudid], 2)
|
return round(self.df["note"].loc[etudid], 2)
|
||||||
|
|
||||||
def get_min_for_df(self) -> float:
|
def get_min_for_df(self) -> float:
|
||||||
"""Min renseigné pour affichage dans un df"""
|
"""Min renseigné pour affichage dans un df"""
|
||||||
@ -158,11 +195,9 @@ class MoyenneTag:
|
|||||||
def get_class_for_df(self, etudid: int) -> str:
|
def get_class_for_df(self, etudid: int) -> str:
|
||||||
"""Classement ramené au nombre d'inscrits,
|
"""Classement ramené au nombre d'inscrits,
|
||||||
pour un étudiant donné par son etudid"""
|
pour un étudiant donné par son etudid"""
|
||||||
classement = self.synthese["classements"].loc[etudid]
|
classement = self.df["rang"].loc[etudid]
|
||||||
nb_inscrit = self.synthese["nb_inscrits"]
|
|
||||||
if not pd.isna(classement):
|
if not pd.isna(classement):
|
||||||
classement = int(classement)
|
return classement
|
||||||
return f"{classement}/{nb_inscrit}"
|
|
||||||
else:
|
else:
|
||||||
return pe_affichage.SANS_NOTE
|
return pe_affichage.SANS_NOTE
|
||||||
|
|
||||||
|
Loading…
x
Reference in New Issue
Block a user