ScoDoc-Front/app/comp/moy_ue.py

# -*- mode: python -*-
# -*- coding: utf-8 -*-

##############################################################################
#
# Gestion scolarite IUT
#
# Copyright (c) 1999 - 2022 Emmanuel Viennet.  All rights reserved.
#
# This program is free software; you can redistribute it and/or modify
# it under the terms of the GNU General Public License as published by
# the Free Software Foundation; either version 2 of the License, or
# (at your option) any later version.
#
# This program is distributed in the hope that it will be useful,
# but WITHOUT ANY WARRANTY; without even the implied warranty of
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
# GNU General Public License for more details.
#
# You should have received a copy of the GNU General Public License
# along with this program; if not, write to the Free Software
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
#
#   Emmanuel Viennet      emmanuel.viennet@viennet.net
#
##############################################################################

"""Fonctions de calcul des moyennes d'UE (classiques ou BUT)
"""
import numpy as np
import pandas as pd

from app import db
from app import models
from app.models import UniteEns, Module, ModuleImpl, ModuleUECoef
from app.comp import moy_mod
from app.models.formsemestre import FormSemestre
from app.scodoc import sco_codes_parcours
from app.scodoc.sco_utils import ModuleType


def df_load_module_coefs(formation_id: int, semestre_idx: int = None) -> pd.DataFrame:
    """Charge les coefs APC des modules de la formation pour le semestre indiqué.

    En APC, ces coefs lient les modules à chaque UE.

    Résultat: (module_coefs_df, ues, modules)
        DataFrame rows = UEs, columns = modules, value = coef.

    Considère toutes les UE (sauf sport) et modules du semestre.
    Les coefs non définis (pas en base) sont mis à zéro.

    Si semestre_idx None, prend toutes les UE de la formation.
    """
    ues = (
        UniteEns.query.filter_by(formation_id=formation_id)
        .filter(UniteEns.type != sco_codes_parcours.UE_SPORT)
        .order_by(UniteEns.semestre_idx, UniteEns.numero, UniteEns.acronyme)
    )
    modules = (
        Module.query.filter_by(formation_id=formation_id)
        .filter(
            (Module.module_type == ModuleType.RESSOURCE)
            | (Module.module_type == ModuleType.SAE)
        )
        .order_by(
            Module.semestre_id, Module.module_type.desc(), Module.numero, Module.code
        )
    )
    if semestre_idx is not None:
        ues = ues.filter_by(semestre_idx=semestre_idx)
        modules = modules.filter_by(semestre_id=semestre_idx)
    ues = ues.all()
    modules = modules.all()
    ue_ids = [ue.id for ue in ues]
    module_ids = [module.id for module in modules]
    module_coefs_df = pd.DataFrame(columns=module_ids, index=ue_ids, dtype=float)
    query = (
        db.session.query(ModuleUECoef)
        .filter(UniteEns.formation_id == formation_id)
        .filter(ModuleUECoef.ue_id == UniteEns.id)
    )
    if semestre_idx is not None:
        query = query.filter(UniteEns.semestre_idx == semestre_idx)

    for mod_coef in query:
        if mod_coef.module_id in module_coefs_df:
            module_coefs_df[mod_coef.module_id][mod_coef.ue_id] = mod_coef.coef
        # silently ignore coefs associated to other modules (ie when module_type is changed)

    module_coefs_df.fillna(value=0, inplace=True)

    return module_coefs_df, ues, modules


def df_load_modimpl_coefs(
    formsemestre: models.FormSemestre, ues=None, modimpls=None
) -> pd.DataFrame:
    """Charge les coefs APC des modules du formsemestre indiqué.

    Comme df_load_module_coefs mais prend seulement les UE
    et modules du formsemestre.
    Si ues et modimpls sont None, prend tous ceux du formsemestre.
    Résultat: (module_coefs_df, ues, modules)
        DataFrame rows = UEs, columns = modimpl, value = coef.
    """
    if ues is None:
        ues = formsemestre.query_ues().all()
    ue_ids = [x.id for x in ues]
    if modimpls is None:
        modimpls = formsemestre.modimpls.all()
    modimpl_ids = [x.id for x in modimpls]
    mod2impl = {m.module.id: m.id for m in modimpls}
    modimpl_coefs_df = pd.DataFrame(columns=modimpl_ids, index=ue_ids, dtype=float)
    mod_coefs = (
        db.session.query(ModuleUECoef)
        .filter(ModuleUECoef.module_id == ModuleImpl.module_id)
        .filter(ModuleImpl.formsemestre_id == formsemestre.id)
    )

    for mod_coef in mod_coefs:
        modimpl_coefs_df[mod2impl[mod_coef.module_id]][mod_coef.ue_id] = mod_coef.coef
    modimpl_coefs_df.fillna(value=0, inplace=True)
    return modimpl_coefs_df, ues, modimpls


def notes_sem_assemble_cube(modimpls_notes: list[pd.DataFrame]) -> np.ndarray:
    """Réuni les notes moyennes des modules du semestre en un "cube"

    modimpls_notes : liste des moyennes de module
                     (DataFrames rendus par compute_module_moy, (etud x UE))
    Resultat: ndarray (etud x module x UE)
    """
    assert len(modimpls_notes)
    modimpls_notes_arr = [df.values for df in modimpls_notes]
    modimpls_notes = np.stack(modimpls_notes_arr)
    # passe de (mod x etud x ue) à (etud x mod x UE)
    return modimpls_notes.swapaxes(0, 1)


def notes_sem_load_cube(formsemestre: FormSemestre) -> tuple:
    """Construit le "cube" (tenseur) des notes du semestre.
    Charge toutes les notes (sql), calcule les moyennes des modules
    et assemble le cube.

    etuds: tous les inscrits au semestre (avec dem. et def.)
    modimpls: _tous_ les modimpls de ce semestre
    UEs: X?X voir quelles sont les UE considérées ici

    Resultat:
        sem_cube : ndarray (etuds x modimpls x UEs)
        modimpls_evals_poids dict { modimpl.id : evals_poids }
        modimpls_results dict { modimpl.id : ModuleImplResultsAPC }
    """
    modimpls_results = {}
    modimpls_evals_poids = {}
    modimpls_notes = []
    for modimpl in formsemestre.modimpls:
        mod_results = moy_mod.ModuleImplResultsAPC(modimpl)
        evals_poids, _ = moy_mod.load_evaluations_poids(modimpl.id)
        etuds_moy_module = mod_results.compute_module_moy(evals_poids)
        modimpls_results[modimpl.id] = mod_results
        modimpls_notes.append(etuds_moy_module)
    if len(modimpls_notes):
        cube = notes_sem_assemble_cube(modimpls_notes)
    else:
        nb_etuds = formsemestre.etuds.count()
        cube = np.zeros((nb_etuds, 0, 0), dtype=float)
    return (
        cube,
        modimpls_evals_poids,
        modimpls_results,
    )


def compute_ue_moys_apc(
    sem_cube: np.array,
    etuds: list,
    modimpls: list,
    ues: list,
    modimpl_inscr_df: pd.DataFrame,
    modimpl_coefs_df: pd.DataFrame,
) -> pd.DataFrame:
    """Calcul de la moyenne d'UE en mode APC (BUT).
    La moyenne d'UE est un nombre (note/20), ou NI ou NA ou ERR
        NI non inscrit à (au moins un) module de cette UE
        NA pas de notes disponibles
        ERR erreur dans une formule utilisateur. [XXX pas encore gérées ici]

    sem_cube: notes moyennes aux modules
                ndarray (etuds x modimpls x UEs)
                (floats avec des NaN)
    etuds : liste des étudiants (dim. 0 du cube)
    modimpls : liste des modules à considérer (dim. 1 du cube)
    ues : liste des UE (dim. 2 du cube)
    modimpl_inscr_df: matrice d'inscription du semestre (etud x modimpl)
    modimpl_coefs_df: matrice coefficients (UE x modimpl)

    Resultat: DataFrame columns UE, rows etudid
    """
    nb_etuds, nb_modules, nb_ues = sem_cube.shape
    assert len(modimpls) == nb_modules
    if nb_modules == 0 or nb_etuds == 0:
        return pd.DataFrame(
            index=modimpl_inscr_df.index, columns=modimpl_coefs_df.index
        )
    assert len(etuds) == nb_etuds
    assert len(ues) == nb_ues
    assert modimpl_inscr_df.shape[0] == nb_etuds
    assert modimpl_inscr_df.shape[1] == nb_modules
    assert modimpl_coefs_df.shape[0] == nb_ues
    assert modimpl_coefs_df.shape[1] == nb_modules
    modimpl_inscr = modimpl_inscr_df.values
    modimpl_coefs = modimpl_coefs_df.values
    # Duplique les inscriptions sur les UEs:
    modimpl_inscr_stacked = np.stack([modimpl_inscr] * nb_ues, axis=2)
    # Enlève les NaN du numérateur:
    # si on veut prendre en compte les modules avec notes neutralisées ?
    sem_cube_no_nan = np.nan_to_num(sem_cube, nan=0.0)

    # Ne prend pas en compte les notes des étudiants non inscrits au module:
    # Annule les notes:
    sem_cube_inscrits = np.where(modimpl_inscr_stacked, sem_cube_no_nan, 0.0)
    # Annule les coefs des modules où l'étudiant n'est pas inscrit:
    modimpl_coefs_etuds = np.where(
        modimpl_inscr_stacked, np.stack([modimpl_coefs.T] * nb_etuds), 0.0
    )
    # Annule les coefs des modules NaN
    modimpl_coefs_etuds_no_nan = np.where(np.isnan(sem_cube), 0.0, modimpl_coefs_etuds)
    #
    # Version vectorisée
    #
    etud_moy_ue = np.sum(
        modimpl_coefs_etuds_no_nan * sem_cube_inscrits, axis=1
    ) / np.sum(modimpl_coefs_etuds_no_nan, axis=1)
    return pd.DataFrame(
        etud_moy_ue, index=modimpl_inscr_df.index, columns=modimpl_coefs_df.index
    )


def compute_ue_moys_classic(
    formsemestre: FormSemestre,
    sem_matrix: np.array,
    ues: list,
    modimpl_inscr_df: pd.DataFrame,
    modimpl_coefs: np.array,
) -> tuple[pd.Series, pd.DataFrame, pd.DataFrame]:
    """Calcul de la moyenne d'UE en mode classique.
    La moyenne d'UE est un nombre (note/20), ou NI ou NA ou ERR
        NI non inscrit à (au moins un) module de cette UE
        NA pas de notes disponibles
        ERR erreur dans une formule utilisateur. [XXX pas encore gérées ici]

    sem_matrix: notes moyennes aux modules
                ndarray (etuds x modimpls)
                (floats avec des NaN)
    etuds : listes des étudiants (dim. 0 de la matrice)
    ues : liste des UE
    modimpl_inscr_df: matrice d'inscription du semestre (etud x modimpl)
    modimpl_coefs: vecteur des coefficients de modules

    Résultat:
     - moyennes générales: pd.Series, index etudid
     - moyennes d'UE: DataFrame columns UE, rows etudid
     - coefficients d'UE: DataFrame, columns UE, rows etudid
        les coefficients effectifs de chaque UE pour chaque étudiant
        (sommes de coefs de modules pris en compte)
    """
    nb_etuds, nb_modules = sem_matrix.shape
    assert len(modimpl_coefs) == nb_modules
    nb_ues = len(ues)
    modimpl_inscr = modimpl_inscr_df.values
    # Enlève les NaN du numérateur:
    sem_matrix_no_nan = np.nan_to_num(sem_matrix, nan=0.0)
    # Ne prend pas en compte les notes des étudiants non inscrits au module:
    # Annule les notes:
    sem_matrix_inscrits = np.where(modimpl_inscr, sem_matrix_no_nan, 0.0)
    # Annule les coefs des modules où l'étudiant n'est pas inscrit:
    modimpl_coefs_etuds = np.where(
        modimpl_inscr, np.stack([modimpl_coefs.T] * nb_etuds), 0.0
    )
    # Annule les coefs des modules NaN (nb_etuds x nb_mods)
    modimpl_coefs_etuds_no_nan = np.where(
        np.isnan(sem_matrix), 0.0, modimpl_coefs_etuds
    )
    # Calcul des moyennes générales:
    with np.errstate(invalid="ignore"):  # ignore les 0/0 (-> NaN)
        etud_moy_gen = np.sum(
            modimpl_coefs_etuds_no_nan * sem_matrix_inscrits, axis=1
        ) / np.sum(modimpl_coefs_etuds_no_nan, axis=1)
    etud_moy_gen_s = pd.Series(etud_moy_gen, index=modimpl_inscr_df.index)
    # Calcul des moyennes d'UE
    ue_modules = np.array(
        [[m.module.ue == ue for m in formsemestre.modimpls] for ue in ues]
    )[..., np.newaxis]
    modimpl_coefs_etuds_no_nan_stacked = np.stack(
        [modimpl_coefs_etuds_no_nan.T] * nb_ues
    )
    # nb_ue x nb_etuds x nb_mods : coefs prenant en compte NaN et inscriptions
    coefs = (modimpl_coefs_etuds_no_nan_stacked * ue_modules).swapaxes(1, 2)
    with np.errstate(invalid="ignore"):  # ignore les 0/0 (-> NaN)
        etud_moy_ue = (
            np.sum(coefs * sem_matrix_inscrits, axis=2) / np.sum(coefs, axis=2)
        ).T
    etud_moy_ue_df = pd.DataFrame(
        etud_moy_ue, index=modimpl_inscr_df.index, columns=[ue.id for ue in ues]
    )
    etud_coef_ue_df = pd.DataFrame(
        coefs.sum(axis=2).T,
        index=modimpl_inscr_df.index,  # etudids
        columns=[ue.id for ue in ues],
    )
    return etud_moy_gen_s, etud_moy_ue_df, etud_coef_ue_df
- Coef evaluations (modèles). - Refactoring. - Changement des noms des classes (modèles) des formations. - Début intégration calculs BUT. - Requiert numpy et pandas. 2021-11-12 22:17:46 +01:00			`# -- mode: python --`
			`# -- coding: utf-8 --`

			`##############################################################################`
			`#`
			`# Gestion scolarite IUT`
			`#`
update copyright 2022-01-01 14:49:42 +01:00			`# Copyright (c) 1999 - 2022 Emmanuel Viennet. All rights reserved.`
- Coef evaluations (modèles). - Refactoring. - Changement des noms des classes (modèles) des formations. - Début intégration calculs BUT. - Requiert numpy et pandas. 2021-11-12 22:17:46 +01:00			`#`
			`# This program is free software; you can redistribute it and/or modify`
			`# it under the terms of the GNU General Public License as published by`
			`# the Free Software Foundation; either version 2 of the License, or`
			`# (at your option) any later version.`
			`#`
			`# This program is distributed in the hope that it will be useful,`
			`# but WITHOUT ANY WARRANTY; without even the implied warranty of`
			`# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the`
			`# GNU General Public License for more details.`
			`#`
			`# You should have received a copy of the GNU General Public License`
			`# along with this program; if not, write to the Free Software`
			`# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA`
			`#`
			`# Emmanuel Viennet emmanuel.viennet@viennet.net`
			`#`
			`##############################################################################`

WIP: unification calculs 2021-12-30 23:58:38 +01:00			`"""Fonctions de calcul des moyennes d'UE (classiques ou BUT)`
- Coef evaluations (modèles). - Refactoring. - Changement des noms des classes (modèles) des formations. - Début intégration calculs BUT. - Requiert numpy et pandas. 2021-11-12 22:17:46 +01:00			`"""`
			`import numpy as np`
			`import pandas as pd`

			`from app import db`
			`from app import models`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`from app.models import UniteEns, Module, ModuleImpl, ModuleUECoef`
			`from app.comp import moy_mod`
WIP: unification calculs 2021-12-30 23:58:38 +01:00			`from app.models.formsemestre import FormSemestre`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`from app.scodoc import sco_codes_parcours`
filtre modules non BUT dans edit_modules_ue_coefs 2022-01-08 19:30:30 +01:00			`from app.scodoc.sco_utils import ModuleType`
- Coef evaluations (modèles). - Refactoring. - Changement des noms des classes (modèles) des formations. - Début intégration calculs BUT. - Requiert numpy et pandas. 2021-11-12 22:17:46 +01:00

Cache coefs et poids. Check conformité PN. 2021-11-29 22:18:37 +01:00			`def df_load_module_coefs(formation_id: int, semestre_idx: int = None) -> pd.DataFrame:`
WIP: unification calculs 2021-12-30 23:58:38 +01:00			`"""Charge les coefs APC des modules de la formation pour le semestre indiqué.`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00
WIP: unification calculs 2021-12-30 23:58:38 +01:00			`En APC, ces coefs lient les modules à chaque UE.`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00
			`Résultat: (module_coefs_df, ues, modules)`
			`DataFrame rows = UEs, columns = modules, value = coef.`

			`Considère toutes les UE (sauf sport) et modules du semestre.`
			`Les coefs non définis (pas en base) sont mis à zéro.`

WIP: Editions formations 2021-11-18 22:46:18 +01:00			`Si semestre_idx None, prend toutes les UE de la formation.`
- Coef evaluations (modèles). - Refactoring. - Changement des noms des classes (modèles) des formations. - Début intégration calculs BUT. - Requiert numpy et pandas. 2021-11-12 22:17:46 +01:00			`"""`
Ordre des modules et UE (edition PN et poids) 2021-12-09 11:52:46 +01:00			`ues = (`
			`UniteEns.query.filter_by(formation_id=formation_id)`
			`.filter(UniteEns.type != sco_codes_parcours.UE_SPORT)`
			`.order_by(UniteEns.semestre_idx, UniteEns.numero, UniteEns.acronyme)`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`)`
filtre modules non BUT dans edit_modules_ue_coefs 2022-01-08 19:30:30 +01:00			`modules = (`
			`Module.query.filter_by(formation_id=formation_id)`
			`.filter(`
			`(Module.module_type == ModuleType.RESSOURCE)`
			`\| (Module.module_type == ModuleType.SAE)`
			`)`
			`.order_by(`
			`Module.semestre_id, Module.module_type.desc(), Module.numero, Module.code`
			`)`
Import ref. Compétences BUT (Orébut) 2021-12-02 12:08:03 +01:00			`)`
WIP: Editions formations 2021-11-18 22:46:18 +01:00			`if semestre_idx is not None:`
			`ues = ues.filter_by(semestre_idx=semestre_idx)`
			`modules = modules.filter_by(semestre_id=semestre_idx)`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`ues = ues.all()`
			`modules = modules.all()`
- Coef evaluations (modèles). - Refactoring. - Changement des noms des classes (modèles) des formations. - Début intégration calculs BUT. - Requiert numpy et pandas. 2021-11-12 22:17:46 +01:00			`ue_ids = [ue.id for ue in ues]`
			`module_ids = [module.id for module in modules]`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`module_coefs_df = pd.DataFrame(columns=module_ids, index=ue_ids, dtype=float)`
Fix: édition coefs semestres, retour au semestre sélectionné. 2021-12-10 15:51:43 +01:00			`query = (`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`db.session.query(ModuleUECoef)`
			`.filter(UniteEns.formation_id == formation_id)`
			`.filter(ModuleUECoef.ue_id == UniteEns.id)`
Fix: édition coefs semestres, retour au semestre sélectionné. 2021-12-10 15:51:43 +01:00			`)`
			`if semestre_idx is not None:`
			`query = query.filter(UniteEns.semestre_idx == semestre_idx)`

			`for mod_coef in query:`
filtre modules non BUT dans edit_modules_ue_coefs 2022-01-08 19:30:30 +01:00			`if mod_coef.module_id in module_coefs_df:`
			`module_coefs_df[mod_coef.module_id][mod_coef.ue_id] = mod_coef.coef`
			`# silently ignore coefs associated to other modules (ie when module_type is changed)`
Fix: édition coefs semestres, retour au semestre sélectionné. 2021-12-10 15:51:43 +01:00
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`module_coefs_df.fillna(value=0, inplace=True)`
Fix: édition coefs semestres, retour au semestre sélectionné. 2021-12-10 15:51:43 +01:00
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`return module_coefs_df, ues, modules`


Génération bulletin BUT json 2021-12-05 20:21:51 +01:00			`def df_load_modimpl_coefs(`
			`formsemestre: models.FormSemestre, ues=None, modimpls=None`
			`) -> pd.DataFrame:`
WIP: unification calculs 2021-12-30 23:58:38 +01:00			`"""Charge les coefs APC des modules du formsemestre indiqué.`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00
			`Comme df_load_module_coefs mais prend seulement les UE`
			`et modules du formsemestre.`
Génération bulletin BUT json 2021-12-05 20:21:51 +01:00			`Si ues et modimpls sont None, prend tous ceux du formsemestre.`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`Résultat: (module_coefs_df, ues, modules)`
			`DataFrame rows = UEs, columns = modimpl, value = coef.`
			`"""`
Génération bulletin BUT json 2021-12-05 20:21:51 +01:00			`if ues is None:`
			`ues = formsemestre.query_ues().all()`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`ue_ids = [x.id for x in ues]`
Génération bulletin BUT json 2021-12-05 20:21:51 +01:00			`if modimpls is None:`
			`modimpls = formsemestre.modimpls.all()`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`modimpl_ids = [x.id for x in modimpls]`
			`mod2impl = {m.module.id: m.id for m in modimpls}`
			`modimpl_coefs_df = pd.DataFrame(columns=modimpl_ids, index=ue_ids, dtype=float)`
			`mod_coefs = (`
			`db.session.query(ModuleUECoef)`
			`.filter(ModuleUECoef.module_id == ModuleImpl.module_id)`
			`.filter(ModuleImpl.formsemestre_id == formsemestre.id)`
			`)`

			`for mod_coef in mod_coefs:`
			`modimpl_coefs_df[mod2impl[mod_coef.module_id]][mod_coef.ue_id] = mod_coef.coef`
			`modimpl_coefs_df.fillna(value=0, inplace=True)`
			`return modimpl_coefs_df, ues, modimpls`


			`def notes_sem_assemble_cube(modimpls_notes: list[pd.DataFrame]) -> np.ndarray:`
			`"""Réuni les notes moyennes des modules du semestre en un "cube"`

			`modimpls_notes : liste des moyennes de module`
			`(DataFrames rendus par compute_module_moy, (etud x UE))`
			`Resultat: ndarray (etud x module x UE)`
			`"""`
Traite #276 2022-01-17 00:06:21 +01:00			`assert len(modimpls_notes)`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`modimpls_notes_arr = [df.values for df in modimpls_notes]`
			`modimpls_notes = np.stack(modimpls_notes_arr)`
			`# passe de (mod x etud x ue) à (etud x mod x UE)`
			`return modimpls_notes.swapaxes(0, 1)`


WIP: unification calculs 2021-12-30 23:58:38 +01:00			`def notes_sem_load_cube(formsemestre: FormSemestre) -> tuple:`
WIP: reorganisation des calculs 2022-01-16 23:47:52 +01:00			`"""Construit le "cube" (tenseur) des notes du semestre.`
			`Charge toutes les notes (sql), calcule les moyennes des modules`
			`et assemble le cube.`

			`etuds: tous les inscrits au semestre (avec dem. et def.)`
			`modimpls: _tous_ les modimpls de ce semestre`
			`UEs: X?X voir quelles sont les UE considérées ici`

affichage non conformité 2021-12-08 23:43:07 +01:00			`Resultat:`
			`sem_cube : ndarray (etuds x modimpls x UEs)`
			`modimpls_evals_poids dict { modimpl.id : evals_poids }`
WIP: refactoring calculs 2021-12-26 19:15:47 +01:00			`modimpls_results dict { modimpl.id : ModuleImplResultsAPC }`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`"""`
WIP: refactoring calculs 2021-12-26 19:15:47 +01:00			`modimpls_results = {}`
affichage non conformité 2021-12-08 23:43:07 +01:00			`modimpls_evals_poids = {}`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`modimpls_notes = []`
			`for modimpl in formsemestre.modimpls:`
WIP: refactoring calculs 2021-12-26 19:15:47 +01:00			`mod_results = moy_mod.ModuleImplResultsAPC(modimpl)`
			`evals_poids, _ = moy_mod.load_evaluations_poids(modimpl.id)`
			`etuds_moy_module = mod_results.compute_module_moy(evals_poids)`
			`modimpls_results[modimpl.id] = mod_results`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`modimpls_notes.append(etuds_moy_module)`
Traite #276 2022-01-17 00:06:21 +01:00			`if len(modimpls_notes):`
			`cube = notes_sem_assemble_cube(modimpls_notes)`
			`else:`
			`nb_etuds = formsemestre.etuds.count()`
			`cube = np.zeros((nb_etuds, 0, 0), dtype=float)`
Génération bulletin BUT json 2021-12-05 20:21:51 +01:00			`return (`
Traite #276 2022-01-17 00:06:21 +01:00			`cube,`
Génération bulletin BUT json 2021-12-05 20:21:51 +01:00			`modimpls_evals_poids,`
WIP: refactoring calculs 2021-12-26 19:15:47 +01:00			`modimpls_results,`
Génération bulletin BUT json 2021-12-05 20:21:51 +01:00			`)`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00

WIP: unification calculs 2021-12-30 23:58:38 +01:00			`def compute_ue_moys_apc(`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`sem_cube: np.array,`
			`etuds: list,`
			`modimpls: list,`
			`ues: list,`
Calcul moyennes BUT: prise en compte des inscriptions aux modules optionnels. 2021-11-29 00:01:39 +01:00			`modimpl_inscr_df: pd.DataFrame,`
			`modimpl_coefs_df: pd.DataFrame,`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`) -> pd.DataFrame:`
WIP: unification calculs 2021-12-30 23:58:38 +01:00			`"""Calcul de la moyenne d'UE en mode APC (BUT).`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`La moyenne d'UE est un nombre (note/20), ou NI ou NA ou ERR`
WIP: reorganisation des calculs 2022-01-16 23:47:52 +01:00			`NI non inscrit à (au moins un) module de cette UE`
			`NA pas de notes disponibles`
			`ERR erreur dans une formule utilisateur. [XXX pas encore gérées ici]`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00
			`sem_cube: notes moyennes aux modules`
			`ndarray (etuds x modimpls x UEs)`
			`(floats avec des NaN)`
WIP: reorganisation des calculs 2022-01-16 23:47:52 +01:00			`etuds : liste des étudiants (dim. 0 du cube)`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`modimpls : liste des modules à considérer (dim. 1 du cube)`
			`ues : liste des UE (dim. 2 du cube)`
WIP: unification calculs 2021-12-30 23:58:38 +01:00			`modimpl_inscr_df: matrice d'inscription du semestre (etud x modimpl)`
			`modimpl_coefs_df: matrice coefficients (UE x modimpl)`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00
			`Resultat: DataFrame columns UE, rows etudid`
			`"""`
			`nb_etuds, nb_modules, nb_ues = sem_cube.shape`
			`assert len(modimpls) == nb_modules`
Traite #276 2022-01-17 00:06:21 +01:00			`if nb_modules == 0 or nb_etuds == 0:`
			`return pd.DataFrame(`
			`index=modimpl_inscr_df.index, columns=modimpl_coefs_df.index`
			`)`
			`assert len(etuds) == nb_etuds`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`assert len(ues) == nb_ues`
Calcul moyennes BUT: prise en compte des inscriptions aux modules optionnels. 2021-11-29 00:01:39 +01:00			`assert modimpl_inscr_df.shape[0] == nb_etuds`
			`assert modimpl_inscr_df.shape[1] == nb_modules`
			`assert modimpl_coefs_df.shape[0] == nb_ues`
			`assert modimpl_coefs_df.shape[1] == nb_modules`
			`modimpl_inscr = modimpl_inscr_df.values`
			`modimpl_coefs = modimpl_coefs_df.values`
			`# Duplique les inscriptions sur les UEs:`
			`modimpl_inscr_stacked = np.stack([modimpl_inscr] * nb_ues, axis=2)`
			`# Enlève les NaN du numérateur:`
Calcul moyenne UE BUT progressif (admet modules sans notes) 2021-12-08 21:49:13 +01:00			`# si on veut prendre en compte les modules avec notes neutralisées ?`
			`sem_cube_no_nan = np.nan_to_num(sem_cube, nan=0.0)`
Calcul moyennes BUT: prise en compte des inscriptions aux modules optionnels. 2021-11-29 00:01:39 +01:00
			`# Ne prend pas en compte les notes des étudiants non inscrits au module:`
			`# Annule les notes:`
Calcul moyenne UE BUT progressif (admet modules sans notes) 2021-12-08 21:49:13 +01:00			`sem_cube_inscrits = np.where(modimpl_inscr_stacked, sem_cube_no_nan, 0.0)`
Calcul moyennes BUT: prise en compte des inscriptions aux modules optionnels. 2021-11-29 00:01:39 +01:00			`# Annule les coefs des modules où l'étudiant n'est pas inscrit:`
			`modimpl_coefs_etuds = np.where(`
			`modimpl_inscr_stacked, np.stack([modimpl_coefs.T] * nb_etuds), 0.0`
			`)`
Calcul moyenne UE BUT progressif (admet modules sans notes) 2021-12-08 21:49:13 +01:00			`# Annule les coefs des modules NaN`
			`modimpl_coefs_etuds_no_nan = np.where(np.isnan(sem_cube), 0.0, modimpl_coefs_etuds)`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`#`
Calcul moyennes BUT: prise en compte des inscriptions aux modules optionnels. 2021-11-29 00:01:39 +01:00			`# Version vectorisée`
			`#`
Calcul moyenne UE BUT progressif (admet modules sans notes) 2021-12-08 21:49:13 +01:00			`etud_moy_ue = np.sum(`
			`modimpl_coefs_etuds_no_nan * sem_cube_inscrits, axis=1`
			`) / np.sum(modimpl_coefs_etuds_no_nan, axis=1)`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`return pd.DataFrame(`
Calcul moyennes BUT: prise en compte des inscriptions aux modules optionnels. 2021-11-29 00:01:39 +01:00			`etud_moy_ue, index=modimpl_inscr_df.index, columns=modimpl_coefs_df.index`
WIP: calcul moyennes UE BUT 2021-11-28 16:31:33 +01:00			`)`
WIP: unification calculs 2021-12-30 23:58:38 +01:00

			`def compute_ue_moys_classic(`
			`formsemestre: FormSemestre,`
			`sem_matrix: np.array,`
			`ues: list,`
			`modimpl_inscr_df: pd.DataFrame,`
			`modimpl_coefs: np.array,`
WIP: reorganisation des calculs 2022-01-16 23:47:52 +01:00			`) -> tuple[pd.Series, pd.DataFrame, pd.DataFrame]:`
WIP: unification calculs 2021-12-30 23:58:38 +01:00			`"""Calcul de la moyenne d'UE en mode classique.`
			`La moyenne d'UE est un nombre (note/20), ou NI ou NA ou ERR`
WIP: reorganisation des calculs 2022-01-16 23:47:52 +01:00			`NI non inscrit à (au moins un) module de cette UE`
			`NA pas de notes disponibles`
			`ERR erreur dans une formule utilisateur. [XXX pas encore gérées ici]`
WIP: unification calculs 2021-12-30 23:58:38 +01:00
			`sem_matrix: notes moyennes aux modules`
			`ndarray (etuds x modimpls)`
			`(floats avec des NaN)`
			`etuds : listes des étudiants (dim. 0 de la matrice)`
			`ues : liste des UE`
			`modimpl_inscr_df: matrice d'inscription du semestre (etud x modimpl)`
			`modimpl_coefs: vecteur des coefficients de modules`

			`Résultat:`
			`- moyennes générales: pd.Series, index etudid`
			`- moyennes d'UE: DataFrame columns UE, rows etudid`
WIP: reorganisation des calculs 2022-01-16 23:47:52 +01:00			`- coefficients d'UE: DataFrame, columns UE, rows etudid`
			`les coefficients effectifs de chaque UE pour chaque étudiant`
			`(sommes de coefs de modules pris en compte)`
WIP: unification calculs 2021-12-30 23:58:38 +01:00			`"""`
			`nb_etuds, nb_modules = sem_matrix.shape`
			`assert len(modimpl_coefs) == nb_modules`
			`nb_ues = len(ues)`
			`modimpl_inscr = modimpl_inscr_df.values`
			`# Enlève les NaN du numérateur:`
			`sem_matrix_no_nan = np.nan_to_num(sem_matrix, nan=0.0)`
			`# Ne prend pas en compte les notes des étudiants non inscrits au module:`
			`# Annule les notes:`
			`sem_matrix_inscrits = np.where(modimpl_inscr, sem_matrix_no_nan, 0.0)`
			`# Annule les coefs des modules où l'étudiant n'est pas inscrit:`
			`modimpl_coefs_etuds = np.where(`
			`modimpl_inscr, np.stack([modimpl_coefs.T] * nb_etuds), 0.0`
			`)`
			`# Annule les coefs des modules NaN (nb_etuds x nb_mods)`
			`modimpl_coefs_etuds_no_nan = np.where(`
			`np.isnan(sem_matrix), 0.0, modimpl_coefs_etuds`
			`)`
			`# Calcul des moyennes générales:`
			`with np.errstate(invalid="ignore"): # ignore les 0/0 (-> NaN)`
			`etud_moy_gen = np.sum(`
			`modimpl_coefs_etuds_no_nan * sem_matrix_inscrits, axis=1`
			`) / np.sum(modimpl_coefs_etuds_no_nan, axis=1)`
			`etud_moy_gen_s = pd.Series(etud_moy_gen, index=modimpl_inscr_df.index)`
			`# Calcul des moyennes d'UE`
			`ue_modules = np.array(`
			`[[m.module.ue == ue for m in formsemestre.modimpls] for ue in ues]`
			`)[..., np.newaxis]`
			`modimpl_coefs_etuds_no_nan_stacked = np.stack(`
			`[modimpl_coefs_etuds_no_nan.T] * nb_ues`
			`)`
			`# nb_ue x nb_etuds x nb_mods : coefs prenant en compte NaN et inscriptions`
			`coefs = (modimpl_coefs_etuds_no_nan_stacked * ue_modules).swapaxes(1, 2)`
			`with np.errstate(invalid="ignore"): # ignore les 0/0 (-> NaN)`
			`etud_moy_ue = (`
			`np.sum(coefs * sem_matrix_inscrits, axis=2) / np.sum(coefs, axis=2)`
			`).T`
			`etud_moy_ue_df = pd.DataFrame(`
			`etud_moy_ue, index=modimpl_inscr_df.index, columns=[ue.id for ue in ues]`
			`)`
WIP: reorganisation des calculs 2022-01-16 23:47:52 +01:00			`etud_coef_ue_df = pd.DataFrame(`
			`coefs.sum(axis=2).T,`
			`index=modimpl_inscr_df.index, # etudids`
			`columns=[ue.id for ue in ues],`
			`)`
			`return etud_moy_gen_s, etud_moy_ue_df, etud_coef_ue_df`