Traitement des coeffs (état intermédiaire)

2024-02-26 10:29:45 +01:00 · 2024-02-26 10:29:45 +01:00 · 57d616da1a
commit 57d616da1a
parent 21a794a760
6 changed files with 187 additions and 74 deletions
--- a/app/pe/moys/pe_rcstag.py
+++ b/app/pe/moys/pe_rcstag.py
@ -46,9 +46,12 @@ import app.pe.pe_comp as pe_comp
 from app.pe.moys import pe_tabletags, pe_moytag
-class RCSTag(pe_tabletags.TableTag):
+class RCSemXTag(pe_tabletags.TableTag):
    def __init__(
-        self, rcsemx: pe_rcsemx.RCSemX, sxstags: dict[(str, int) : pe_sxtag.SxTag]
+        self,
        rcsemx: pe_rcsemx.RCSemX,
        sxstags: dict[(str, int) : pe_sxtag.SxTag],
        semXs_suivis: dict[int, dict],
    ):
        """Calcule les moyennes par tag (orientées compétences)
        d'un regroupement de SxTag
@ -59,14 +62,19 @@ class RCSTag(pe_tabletags.TableTag):
        Args:
            rcsemx: Le RCSemX (identifié par un nom et l'id de son semestre terminal)
            sxstags: Les données sur les SemX taggués
            semXs_suivis: Les données indiquant quels SXTags sont à prendre en compte
                          pour chaque étudiant
        """
        pe_tabletags.TableTag.__init__(self)
        self.rcs_id: tuple(str, int) = rcsemx.rcs_id
-        """Identifiant du RCSTag (identique au RCSemX sur lequel il s'appuie)"""
+        """Identifiant du RCSemXTag (identique au RCSemX sur lequel il s'appuie)"""
        self.rcsemx: pe_rcsemx.RCSemX = rcsemx
-        """RCSemX associé au RCSTag"""
+        """Le regroupement RCSemX associé au RCSemXTag"""
        self.semXs_suivis = semXs_suivis
        """Les semXs suivis par les étudiants"""
        self.nom = self.get_repr()
        """Représentation textuelle du RSCtag"""
@ -80,20 +88,21 @@ class RCSTag(pe_tabletags.TableTag):
        # Affichage pour debug
        pe_affichage.pe_print(f"*** {self.get_repr(verbose=True)}")
-        # Les données aggrégés (RCRCF + SxTags
+        # Les données aggrégés (RCRCF + SxTags)
        self.semXs_aggreges: dict[(str, int) : pe_rcsemx.RCSemX] = rcsemx.semXs_aggreges
        """Les SemX aggrégés"""
-        self.sxstags = {}
+        self.sxstags_aggreges = {}
        """Les SxTag associés aux SemX aggrégés"""
        try:
            for rcf_id in self.semXs_aggreges:
-                self.sxstags[rcf_id] = sxstags[rcf_id]
+                self.sxstags_aggreges[rcf_id] = sxstags[rcf_id]
        except:
            raise ValueError("Semestres SxTag manquants")
        self.sxtags_connus = sxstags  # Tous les sxstags connus
        # Les étudiants (etuds, états civils & etudis)
-        sems_dans_aggregat = pe_rcs.TYPES_RCS[self.rcs_id[0]]["aggregat"]
+        sems_dans_aggregat = rcsemx.aggregat
-        sxtag_final = self.sxstags[(sems_dans_aggregat[-1], self.rcs_id[1])]
+        sxtag_final = self.sxstags_aggreges[(sems_dans_aggregat[-1], self.rcs_id[1])]
        self.etuds = sxtag_final.etuds
        """Les étudiants (extraits du semestre final)"""
        self.add_etuds(self.etuds)
@ -123,28 +132,48 @@ class RCSTag(pe_tabletags.TableTag):
        """Synthétise les moyennes/classements par tag (qu'ils soient personnalisé ou de compétences)"""
        for tag in self.tags_sorted:
            pe_affichage.pe_print(f"--> Moyennes du tag 👜{tag}")
            # Traitement des inscriptions aux semX(tags)
            # ******************************************
            # Cube d'inscription (etudids_sorted x compétences_sorted x sxstags)
            # indiquant quel sxtag est valide pour chaque étudiant
            inscriptions_df, inscriptions_cube = self.compute_inscriptions_comps_cube(
                tag, self.etudids_sorted, self.competences_sorted, self.sxstags_aggreges
            )
            # Traitement des notes
            # ********************
            # Cube de notes (etudids_sorted x compétences_sorted x sxstags)
            notes_df, notes_cube = self.compute_notes_comps_cube(
-                tag, self.etudids_sorted, self.competences_sorted, self.sxstags
+                tag, self.etudids_sorted, self.competences_sorted, self.sxstags_aggreges
            )
-            # Calcule des moyennes/coeffs sous forme d'un dataframe"""
+            # Calcule les moyennes sous forme d'un dataframe en les "aggrégant"
            # compétence par compétence
            moys_competences = compute_notes_competences(
-                notes_cube, self.etudids_sorted, self.competences_sorted
+                notes_cube,
                inscriptions_cube,
                self.etudids_sorted,
                self.competences_sorted,
            )
-            # Cube de coeffs pour la moyenne générale,
+
-            # traduisant les inscriptions des étudiants aux UEs (etudids_sorted x compétences_sorted x sxstags)
+            # Traitement des coeffs pour la moyenne générale
            # ***********************************************
            # Df des coeffs sur tous les SxTags aggrégés
            coeffs_df, coeffs_cube = self.compute_coeffs_comps_cube(
                tag,
                self.etudids_sorted,
                self.competences_sorted,
-                self.sxstags,
+                self.sxstags_aggreges,
            )
-            # Calcule la synthèse des coefficients à prendre en compte pour la moyenne
+            # Synthèse des coefficients à prendre en compte pour la moyenne générale
            # générale
            matrice_coeffs_moy_gen = compute_coeffs_competences(
-                coeffs_cube, notes_cube, self.etudids_sorted, self.competences_sorted
+                coeffs_cube,
                inscriptions_cube,
                notes_cube,
                self.etudids_sorted,
                self.competences_sorted,
            )
-            self.__aff_profil_coeffs(matrice_coeffs_moy_gen)
+            pe_affichage.aff_profil_coeffs(matrice_coeffs_moy_gen)
            # Mémorise les moyennes et les coeff associés
            self.moyennes_tags[tag] = pe_moytag.MoyennesTag(
@ -162,9 +191,11 @@ class RCSTag(pe_tabletags.TableTag):
        """Renvoie une représentation textuelle (celle de la trajectoire sur laquelle elle
        est basée)"""
        if verbose:
-            return self.rcsemx.get_repr(verbose=verbose)
+            return f"{self.__class__.__name__} basé sur " + self.rcsemx.get_repr(
                verbose=verbose
            )
        else:
-            return f"{self.__class__.__name__} ({self.rcs_id})"
+            return f"{self.__class__.__name__} {self.rcs_id}"
    def compute_notes_comps_cube(
        self,
@ -287,6 +318,57 @@ class RCSTag(pe_tabletags.TableTag):
        return coeffs_dfs, coeffs_etudids_x_comps_x_sxtag
    def compute_inscriptions_comps_cube(
        self,
        tag,
        etudids_sorted: list[int],
        competences_sorted: list[str],
        sxstags: dict[(str, int) : pe_sxtag.SxTag],
    ):
        """Pour un tag donné, construit
        le cube etudid x competences x SxTag traduisant quels sxtags est à prendre
        en compte pour chaque étudiant.
        Contient des 0 et des 1 pour indiquer la prise en compte.
        Args:
            tag: Le tag visé
            etudids_sorted: Les etudis triés
            competences_sorted: Les compétences triées
            sxstags: Les SxTag à réunir
        """
        # Initialisation
        inscriptions_dfs = {}
        for sxtag_id, sxtag in sxstags.items():
            # Partant d'un dataframe vierge
            inscription_df = pd.DataFrame(
                0, index=etudids_sorted, columns=competences_sorted
            )
            # Stocke les dfs
            inscriptions_dfs[sxtag_id] = inscription_df
        for etudid in etudids_sorted:
            for sem in self.rcsemx.aggregat:
                if etudid in self.semXs_suivis:
                    semx_suivi = self.semXs_suivis[etudid][sem]
                    if semx_suivi:
                        semx_suivi_id = semx_suivi.rcs_id
                        if semx_suivi_id not in self.sxtags_connus:
                            pe_affichage.pe_print(
                                f"Un SxTag est manquant : {semx_suivi_id}"
                            )
                        if semx_suivi_id in inscriptions_dfs:
                            # Si le sxtag est l'un des siens
                            inscriptions_dfs[semx_suivi_id].loc[etudid, :] = 1
        """Réunit les inscriptions sous forme d'un cube etudids x competences x semestres"""
        sxtag_x_etudids_x_comps = [inscriptions_dfs[sxtag_id] for sxtag_id in sxstags]
        inscriptions_etudids_x_comps_x_sxtag = np.stack(
            sxtag_x_etudids_x_comps, axis=-1
        )
        return inscriptions_dfs, inscriptions_etudids_x_comps_x_sxtag
    def _do_taglist(self) -> list[str]:
        """Synthétise les tags à partir des Sxtags aggrégés.
@ -294,8 +376,8 @@ class RCSTag(pe_tabletags.TableTag):
            Liste de tags triés par ordre alphabétique
        """
        tags = []
-        for frmsem_id in self.sxstags:
+        for frmsem_id in self.sxstags_aggreges:
-            tags.extend(self.sxstags[frmsem_id].tags_sorted)
+            tags.extend(self.sxstags_aggreges[frmsem_id].tags_sorted)
        return sorted(set(tags))
    def _do_acronymes_to_competences(self) -> dict[str:str]:
@ -307,7 +389,7 @@ class RCSTag(pe_tabletags.TableTag):
            Un dictionnaire {'acronyme_ue' : 'compétences'}
        """
        dict_competences = {}
-        for sxtag_id, sxtag in self.sxstags.items():
+        for sxtag_id, sxtag in self.sxstags_aggreges.items():
            dict_competences |= sxtag.acronymes_ues_to_competences
        return dict_competences
@ -324,60 +406,43 @@ class RCSTag(pe_tabletags.TableTag):
        pe_affichage.pe_print(f"--> Compétences :")
        pe_affichage.pe_print("\n".join(aff_comp))
    def __aff_profil_coeffs(self, matrice_coeffs_moy_gen):
        """Extrait de la matrice des coeffs, les différents types d'inscription
        et de coefficients (appelés profil) des étudiants et les affiche
        (pour debug)
        """
        # Les profils des coeffs d'UE (pour debug)
        profils = []
        for i in matrice_coeffs_moy_gen.index:
            val = matrice_coeffs_moy_gen.loc[i].fillna("-")
            val = " | ".join([str(v) for v in val])
            if val not in profils:
                profils += [val]
        # L'affichage
        if len(profils) > 1:
            profils_aff = "\n" + "\n".join([" " * 10 + prof for prof in profils])
        else:
            profils_aff = "\n".join(profils)
        pe_affichage.pe_print(
            f"     > Moyenne calculée avec pour coeffs (de compétences) : {profils_aff}"
        )
 def compute_coeffs_competences(
    coeff_cube: np.array,
    inscriptions: np.array,
    set_cube: np.array,
    etudids_sorted: list,
    competences_sorted: list,
 ):
    """Calcule les coeffs à utiliser pour la moyenne générale (toutes compétences
-    confondues), en fonction des notes (set_cube) aggrégées.
+    confondues), en fonction des inscriptions.
    Args:
        coeffs_cube: coeffs impliqués dans la moyenne générale (semestres par semestres)
-        set_cube: notes moyennes aux modules ndarray
+        inscriptions: inscriptions aux UES|Compétences ndarray
-                 (etuds x UEs|compétences x sxtags), des floats avec des NaN
+                 (etuds x UEs|compétences x sxtags), des 0 ou des 1
        set_cube: les notes
        etudids_sorted: liste des étudiants (dim. 0 du cube)
-        competences_sorted: list
+        competences_sorted: list (dim. 1 du cube)
    Returns:
        Un DataFrame de coefficients (etudids_sorted x compétences_sorted)
    """
-    nb_etuds, nb_comps, nb_semestres = set_cube.shape
+    nb_etuds, nb_comps, nb_semestres = inscriptions.shape
    assert nb_etuds == len(etudids_sorted)
    assert nb_comps == len(competences_sorted)
    # Applique le masque des inscriptions aux coeffs et aux notes
    coeffs_significatifs = coeff_cube * inscriptions
    set_cube_significatif = set_cube * inscriptions
    # Quelles entrées du cube contiennent des notes ?
-    mask = ~np.isnan(set_cube)
+    mask = ~np.isnan(set_cube_significatif)
    # Enlève les NaN du cube de notes pour les entrées manquantes
-    coeffs_cube_no_nan = np.nan_to_num(coeff_cube, nan=0.0)
+    coeffs_cube_no_nan = np.nan_to_num(coeffs_significatifs, nan=0.0)
-    # Retire les coefficients associées à des données sans notes
+    # Retire les coefficients associés à des données sans notes
    coeffs_cube_no_nan = coeffs_cube_no_nan * mask
    # Somme les coefficients (correspondant à des notes)
@ -395,6 +460,7 @@ def compute_coeffs_competences(
 def compute_notes_competences(
    set_cube: np.array,
    inscriptions: np.array,
    etudids_sorted: list,
    competences_sorted: list,
 ):
@ -406,11 +472,12 @@ def compute_notes_competences(
    par aggrégat de plusieurs semestres.
    Args:
-        set_cube: notes moyennes aux modules ndarray
+        set_cube: notes moyennes aux compétences ndarray
                 (etuds x UEs|compétences x sxtags), des floats avec des NaN
        inscriptions: inscrptions aux compétences ndarray
                 (etuds x UEs|compétences x sxtags), des 0 et des 1
        etudids_sorted: liste des étudiants (dim. 0 du cube)
-        competences_sorted: list
+        competences_sorted: list (dim. 1 du cube)
        tags: liste des tags (dim. 1 du cube)
    Returns:
        Un DataFrame avec pour columns les moyennes par tags,
        et pour rows les etudid
@ -419,11 +486,14 @@ def compute_notes_competences(
    assert nb_etuds == len(etudids_sorted)
    assert nb_comps == len(competences_sorted)
    # Applique le masque d'inscriptions
    set_cube_significatif = set_cube * inscriptions
    # Quelles entrées du cube contiennent des notes ?
-    mask = ~np.isnan(set_cube)
+    mask = ~np.isnan(set_cube_significatif)
    # Enlève les NaN du cube de notes pour les entrées manquantes
-    set_cube_no_nan = np.nan_to_num(set_cube, nan=0.0)
+    set_cube_no_nan = np.nan_to_num(set_cube_significatif, nan=0.0)
    # Les moyennes par tag
    with np.errstate(invalid="ignore"):  # ignore les 0/0 (-> NaN)
--- a/app/pe/pe_affichage.py
+++ b/app/pe/pe_affichage.py
@ -9,7 +9,7 @@
 from flask import g
 from app import log
-PE_DEBUG = False
+PE_DEBUG = True
 # On stocke les logs PE dans g.scodoc_pe_log
@ -41,3 +41,41 @@ def pe_get_log() -> str:
 # Affichage dans le tableur pe en cas d'absence de notes
 SANS_NOTE = "-"
 def aff_profil_coeffs(matrice_coeffs_moy_gen, with_index=False):
    """Affiche les différents types de coefficients (appelés profil)
    d'une matrice_coeffs_moy_gen (pour debug)
    """
    # Les profils des coeffs d'UE (pour debug)
    profils = []
    index_a_profils = {}
    for i in matrice_coeffs_moy_gen.index:
        val = matrice_coeffs_moy_gen.loc[i].fillna("-")
        val = " | ".join([str(v) for v in val])
        if val not in profils:
            profils += [val]
            index_a_profils[val] = [str(i)]
        else:
            index_a_profils[val] += [str(i)]
    # L'affichage
    if len(profils) > 1:
        if with_index:
            elmts = [
                " " * 10
                + prof
                + " (par ex. "
                + ", ".join(index_a_profils[prof][:10])
                + ")"
                for prof in profils
            ]
        else:
            elmts = [" " * 10 + prof for prof in profils]
        profils_aff = "\n" + "\n".join(elmts)
    else:
        profils_aff = "\n".join(profils)
    pe_print(
        f"     > Moyenne calculée avec pour coeffs (de compétences) : {profils_aff}"
    )
--- a/app/pe/pe_jury.py
+++ b/app/pe/pe_jury.py
@ -306,9 +306,11 @@ class JuryPE(object):
        )
        pe_affichage.pe_print("1) Calcul des moyennes des RCSTag")
-        self.rcss_tags = {}
+        self.rcsstags = {}
        for rcs_id, rcsemx in self.rcss_jury.rcsemxs.items():
-            self.rcss_tags[rcs_id] = pe_rcstag.RCSTag(rcsemx, self.sxtags)
+            self.rcsstags[rcs_id] = pe_rcstag.RCSemXTag(
                rcsemx, self.sxtags, self.rcss_jury.semXs_suivis
            )
        # Intègre le bilan des trajectoires tagguées au zip final
        pe_affichage.pe_print("2) Bilan")
@ -317,7 +319,7 @@ class JuryPE(object):
            output, engine="openpyxl"
        ) as writer:
            onglets = []
-            for rcs_tag in self.rcss_tags.values():
+            for rcs_tag in self.rcsstags.values():
                onglet = rcs_tag.get_repr(verbose=False)
                if rcs_tag.is_significatif():
                    df = rcs_tag.to_df()
@ -374,7 +376,7 @@ class JuryPE(object):
                pe_moytag.CODE_MOY_COMPETENCES,
                etudiants_diplomes,
                self.rcss_jury.rcsemxs,
-                self.rcss_tags,
+                self.rcsstags,
                self.rcss_jury.rcsemxs_suivis,
            )
            self.interclasstags[pe_moytag.CODE_MOY_COMPETENCES][nom_rcs] = interclass
--- a/app/pe/rcss/pe_rcs.py
+++ b/app/pe/rcss/pe_rcs.py
@ -87,18 +87,21 @@ class RCS:
    tous se terminant par un (form)semestre final.
    """
-    def __init__(self, nom_rcs: str, semestre_final: FormSemestre):
+    def __init__(self, nom: str, semestre_final: FormSemestre):
-        self.nom: str = nom_rcs
+        self.nom: str = nom
        """Nom du RCS"""
        assert self.nom in TOUS_LES_RCS, "Le nom d'un RCS doit être un aggrégat"
        self.aggregat: list[str] = TYPES_RCS[nom]["aggregat"]
        """Aggrégat (liste des nom des semestres aggrégés)"""
        self.formsemestre_final: FormSemestre = semestre_final
        """(Form)Semestre final du RCS"""
        self.rang_final = self.formsemestre_final.semestre_id
        """Rang du formsemestre final"""
-        self.rcs_id: (str, int) = (nom_rcs, semestre_final.formsemestre_id)
+        self.rcs_id: (str, int) = (nom, semestre_final.formsemestre_id)
        """Identifiant du RCS sous forme (nom_rcs, id du semestre_terminal)"""
        self.fid_final: int = self.formsemestre_final.formsemestre_id
--- a/app/pe/rcss/pe_rcsemx.py
+++ b/app/pe/rcss/pe_rcsemx.py
@ -26,12 +26,12 @@ class RCSemX(pe_rcs.RCS):
    incluant des infos sur les redoublements).
    Args:
-        nom_rcs: Un nom du RCS (par ex: '5S')
+        nom: Un nom du RCS (par ex: '5S')
        semestre_final: Le semestre final du RCS
    """
-    def __init__(self, nom_rcs: str, semestre_final: FormSemestre):
+    def __init__(self, nom: str, semestre_final: FormSemestre):
-        pe_rcs.RCS.__init__(self, nom_rcs, semestre_final)
+        pe_rcs.RCS.__init__(self, nom, semestre_final)
        self.semXs_aggreges: dict[(str, int) : pe_sxtag.SxTag] = {}
        """Les semX à aggréger"""
--- a/app/pe/rcss/pe_trajectoires.py
+++ b/app/pe/rcss/pe_trajectoires.py
@ -25,12 +25,12 @@ class Trajectoire(pe_rcs.RCS):
        * des S1+S2+(année de césure)+S3 si césure, ...
    Args:
-        nom_rcs: Un nom du RCS (par ex: '5S')
+        nom: Un nom du RCS (par ex: '5S')
        semestre_final: Le formsemestre final du RCS
    """
-    def __init__(self, nom_rcs: str, semestre_final: FormSemestre):
+    def __init__(self, nom: str, semestre_final: FormSemestre):
-        pe_rcs.RCS.__init__(self, nom_rcs, semestre_final)
+        pe_rcs.RCS.__init__(self, nom, semestre_final)
        self.semestres_aggreges: dict[int:FormSemestre] = {}
        """Formsemestres regroupés dans le RCS"""