Referentiels/python/ressource.py

import re
from officiel import *
from modeles import *
from officiel import supprime_accent_espace, get_code_from_nom
import ruamel.yaml
from ruamel.yaml.scalarstring import FoldedScalarString as folded
import pypandoc

__LOGGER = logging.getLogger(__name__)


class RessourceDocx():
    """Classe modélisant les ressources, lorsqu'elles sont extraites du docx"""
    def __init__(self, nom, brute):
        self.nom = nom
        self.brute = brute # les données brutes de la ressource

    def charge_informations(self, code, semestre, heures_encadrees, tp, sae, prerequis, description, mots):
        self.code = code
        self.semestre = semestre # <--
        self.heures_encadrees = heures_encadrees
        self.tp = tp
        self.sae = sae
        self.prerequis = prerequis
        self.description = description
        self.contexte = None
        self.contenu = None
        self.mots = mots

    def charge_ac(self, apprentissages):
        self.apprentissages = apprentissages

    def __str__(self):
        print(self.nom + " " + self.code)

    def str_heures_formations(self):
        return self.heures_encadrees if self.heures_encadrees else "???"

    def str_heures_tp(self):
        return self.tp if self.tp else "???"

    def str_semestre(self):
        return int(self.semestre[1])

    def to_yaml(self):

        dico = {"nom": self.nom,
                "code": self.code,
                "semestre" : self.str_semestre(),
                "heures_formation": self.str_heures_formations(),
                "heures_tp": self.str_heures_tp(),
                "acs": self.apprentissages,
                "sae": self.sae,
                "prerequis": self.prerequis,
                "contexte": folded(caracteres_recalcitrants(self.contexte)),
                "contenu": folded(caracteres_recalcitrants(self.contenu)),
                "motscles": caracteres_recalcitrants(self.mots) if self.mots else ""
                }
        # output = yaml.dump(dico, #Dumper=yaml.Dumper,
        #    sort_keys=False, allow_unicode=True)

        output = ruamel.yaml.dump(dico, Dumper=ruamel.yaml.RoundTripDumper,
                                  allow_unicode=True,
                                  width=100)
        output = output.replace("\n\n", "\n")
        return output

def nettoie_heure(r):
    """Nettoie le champ (horaire) (de la forme 46h ou 33...) pour en extraire la valeur numérique :
    le champ peut contenir 2 volumes (heures formation puis heures tp), auquel cas les 2 valeurs sont renvoyées
    dans un tuple"""
    def nettoie_champ_heure(champ):
        try: # champ contenant uniquement un nbre d'heure
            volumes = int(champ)
            return volumes
        except:
            volumes = re.findall("(\d{2}\D|\d{1}\D)", champ)
            if len(volumes) == 1:
                return int(volumes[0][:-1])
            elif len(volumes) == 2:
                volumes = sorted(volumes, reverse=True)
                return (int(volumes[0][:-1]), int(volumes[1][:-1]))

    if r.heures_encadrees: # si les heures encadrées sont renseignées
        volumes = nettoie_champ_heure(r.heures_encadrees)
    if r.tp:
        r.tp = nettoie_champ_heure(r.tp)
    if isinstance(volumes, int):
        r.heures_encadrees = volumes
    elif isinstance(volumes, tuple):
        r.heures_encadrees = volumes[0]
        if not r.tp:
            r.tp = volumes[1]
        elif r.tp != volumes[1]:
            __LOGGER.warning(r"nettoie_heure: ans {r.nom}, pb dans les heures tp/td")
    else:
        r.heures_encadrees = None
        #else:
            #__LOGGER.warning("Heures non détectées")

def nettoie_code(r):
    """Recherche les codes ressources de la forme RXXX dans champ"""
    champ = r.code
    if r.code:
        codes = re.findall(r"(R[0-9][0-9][0-9])", champ)
        # if len(codes) > 1:
        #    __LOGGER.warning("plusieurs codes trouvés :(")
        #elif len(codes) == 0:
        #    __LOGGER.warning("code manquant")
        if len(codes) == 1:
            r.code = codes[0]
        else:
            code_devine = get_code_from_nom(r)
            if code_devine:
                __LOGGER.warning(f"nettoie_code : \"{r.nom}\" => code {code_devine}")
                r.code = code_devine
            else:
                r.code = None
                __LOGGER.warning(f"nettoie_code : \"{r.nom}\" => code manquant")

def nettoie_semestre(r):
    """Nettoie les semestres : semestre 1 => "S1", semestre 2 => "S2" """
    if r.semestre:
        if "1" in r.semestre:
            r.semestre = "S1"
        elif "2" in r.semestre:
            r.semestre = "S2"
        else:
            __LOGGER.warning(f"nettoie_semestre : dans \"{r.nom}, PAS de semestre => rattaché au S2")
            r.semestre = "S2"
    else:
        __LOGGER.warning(f"nettoie_semestre : dans \"{r.nom}, PAS de semestre => rattaché au S2")
        r.semestre = "S2"

def nettoie_titre(r):
    """Nettoie le titre en utilisant les titres officiels"""
    def devine_nom_from_ressources(champ):
        champ_purge = supprime_accent_espace(champ)
        for sem in DATA_RESSOURCES:
            for code in DATA_RESSOURCES[sem]:
                nom_purge = supprime_accent_espace(DATA_RESSOURCES[sem][code])
                if champ_purge.startswith(nom_purge):
                    return DATA_RESSOURCES[sem][code] # le bon nom

    old = r.nom
    titre = devine_nom_from_ressources(r.nom)
    if titre and titre != old:
        __LOGGER.warning(f"nettoie_titre : {old} => titre \"{titre}\"")
        r.nom = titre

def nettoie_acs(r):
    """Nettoie les acs d'une ressource en les remplaçant par leur code pour les 3 compétences"""
    if len(r.apprentissages) != 3:
        __LOGGER.warning(f"nettoie_acs : Problème dans le nombre de compétences de {r.nom}")
    dico = {}
    for comp in range(3):
        donnees = r.apprentissages[comp] # chaine de caractères listant les ACS
        # donnees = donnees.replace("\t", "").replace("-", "") # supprime les tabulations
        acs_avec_code = devine_acs_by_code(donnees)
        acs_avec_nom = devine_code_by_nom_from_dict(donnees, DATA_ACS)
        if acs_avec_code and set(acs_avec_nom).intersection(set(acs_avec_code)) != set(acs_avec_nom):
            __LOGGER.warning(f"Dans {r.nom}, revoir les ACS : {acs_avec_code} vs {acs_avec_nom}")
        acs_finaux = acs_avec_code + acs_avec_nom
        acs_finaux = [ac.replace(" ", "") for ac in acs_finaux]
        acs_finaux = sorted(list(set(acs_finaux)))
        dico["RT" + str(comp+1)] = acs_finaux
    r.apprentissages = dico # [comp] = acs_finaux

def nettoie_sae(r):
    """Nettoie les sae en détectant les codes"""
    SAE_avec_code = devine_sae_by_code(r.sae)
    liste = [l.rstrip() for l in SAE_avec_code]
    r.sae = liste
    if not r.sae:
        __LOGGER.warning(f"nettoie_sae: dans {r.nom} pas de SAE (:")

def nettoie_prerequis(r):
    """Nettoie les prérequis (ressource) en les remplaçant par leur code de ressource"""
    R_avec_code = devine_ressources_by_code(r.prerequis)
    R_avec_nom = devine_code_by_nom_from_dict(r.prerequis, DATA_RESSOURCES)
    liste = R_avec_code + R_avec_nom
    liste = [l.rstrip().replace(",", "").replace(".","") for l in liste] # supprime les espaces
    R_finaux = sorted(list(set(liste)))
    if R_finaux:
        r.prerequis = R_finaux
    else:
        r.prerequis = "Aucun"

def nettoie_mots_cles(r):
    mots = r.mots # .encode('utf8', 'ignore').decode('utf8')
    mots = mots.replace(".", "")
    r.mots = mots


def devine_acs_by_code(champ):
    """Recherche les codes ressources de la forme ACXXX ou AC0XXX dans champ ;
    ramène les codes AC0XXX à 3 chiffres.
    """
    codes3 = re.findall(r"(AC[0-9][0-9][0-9]\D)", champ) # de code à 3 chiffres
    codes4 = re.findall(r"(AC0[0-9][0-9][0-9])", champ)

    codes3 = [c.rstrip() for c in codes3]
    codes4 = [c.rstrip() for c in codes4]
    codes4 += [ "AC0" + c[-3:] for c in codes3] # ajoute les 0 manquants des acs (codage AC0111)

    return sorted(list(set(codes4)))

def devine_ressources_by_code(champ):
    """Recherche les codes ressources de la forme RXXX dans champ ;
    """
    codes = re.findall(r"(R\d{3}\D)", champ) # de code à 3 chiffres
    return sorted(list(set(codes)))

def devine_ressources_by_nom(donnees):
    """Partant d'une chaine de caractères, détermine les ressources
    présentes dans la donnée, en utilisant les infos officielles de
    ressources.yml"""
    donnees_purge = supprime_accent_espace(donnees)
    codes = []
    for sem in DATA_RESSOURCES:
        for code in DATA_RESSOURCES[sem]:
            nom_purge = supprime_accent_espace(DATA_RESSOURCES[sem][code])
            if nom_purge in donnees_purge:
                codes += [code]
    return sorted(list(set(codes)))

def devine_sae_by_code(donnees):
    """Partant d'une chaine de caractères, détermine les codes des SAE"""
    codes = re.findall(r"(SAE\d\d)\D", donnees)
    codes += re.findall(r"(SAÉ\d\d)\D", donnees)# de code à 3 chiffres
    for (i, code) in enumerate(codes):
        codes[i] = codes[i].replace("E", "É")
    return sorted(list(set(codes)))

def split_description(r):
    """Découpe le champ description en un contexte+un contenu ; si pas possible """
    champs = r.description.split("\n")
    champs = [c for c in champs if c] # supprime les lignes vides

    indicea = 0 # la ligne mentionnant le contexte
    if True in [ligne.startswith("Contexte et ") for ligne in champs]:  # la ligne commençant par Contenus
        indicea = [ligne.startswith("Contexte et ") for ligne in champs].index(True)

    indicec = 0
    contexte = []
    if True in [ligne.startswith("Contenus") for ligne in champs]: # la ligne commençant par Contenus
        indicec = [ligne.startswith("Contenus") for ligne in champs].index(True)
    if True in [ligne.startswith("Contexte et ") for ligne in champs]:
        contexte = champs[indicea+1:indicec]
    else:
        contexte = champs[:indicec]
    # suppression des lignes vides
    contexte = "\n".join(remove_ligne_vide(contexte))
    # suppression des liens
    contexte = remove_link(contexte)
    if not contexte:
        contexte = "Aucun"
    contenu = "\n".join(champs[indicec+1:])


    # sauvegarde des champs
    r.contexte = contexte
    r.contenu = contenu

def remove_link(contenu):
    liens = re.findall("(<a\s.*\">)", contenu)
    for m in liens:
        contenu = contenu.replace(m, "")
    contenu = contenu.replace("</a>", "")
    return contenu

def remove_ligne_vide(contenus):
    """Supprime les lignes vides"""
    if isinstance(contenus, list):
        return [c for c in contenus if c.rstrip()]
    else: # contenu = chaine
        temp = contenus.split("\n")
        temp = [t for t in temp if t.replace("\t", "").rstrip()]
        return "\n".join(temp)

def get_marqueur_numerique(contenu):
    """Revoie la liste des marqueurs numériques"""
    m = re.findall(r"(\d/|\d\s/)", contenu)
    m += re.findall(r"(\d\s\)|\d\))", contenu) # les marqueurs de la forme 1)
    m += re.findall(r"(--\s|--\t)", contenu)
    return m

def get_marqueurs(contenus):
    """Renvoie la liste des marqueurs (à 1 caractère) partant d'une liste de ligne"""
    marqueurs = []
    for ligne in contenus:
        m = re.search(r"(\t)*", ligne) # des \t ?
        if m.group() != "":
            ajout = m.group()
        else:
            ajout = ""
        ligne = ligne.replace("\t","")[0].rstrip() # le marqueur en début de ligne (si 1 caractère)
        if ligne[0] not in string.ascii_letters and ligne[0] != "É" and ligne[0] != "/":
            marqueurs += [ajout + ligne[0]] # tous les symboles

    marqueurs_finaux = [] # tri les marqueurs en supprimant les doublons et en gardant un ordre (pour détecter les sous listes)
    for m in marqueurs:
        if m not in marqueurs_finaux:
            marqueurs_finaux.append(m)
    return marqueurs_finaux

def get_marqueur(ligne, marqueurs):
    """Renvoie le marqueur qui marque le début d'une ligne parmi une liste de marqueurs recherchés"""
    for m in marqueurs:
        if ligne.startswith(m):
            return m

def nettoie_contenus(r):
    # suppression des \t
    contenu = r.contenu.replace(" / ", "/") # supprime les nbsp

    if r.code == "R113":
        print("ici")

    marqueurs_numeriques = get_marqueur_numerique(contenu)
    for m in marqueurs_numeriques: # remplace les marqueurs numériques
        contenu = contenu.replace(m, ">")

    contenus = [ligne.rstrip() for ligne in contenu.split("\n")] # les contenus
    contenus = remove_ligne_vide(contenus) # supprime les lignes vides

    marqueurs_finaux = get_marqueurs(contenus)

    contenus_fin = contenus[:] # copie des ligne

    for (i, ligne) in enumerate(contenus):
        m = get_marqueur(ligne, marqueurs_finaux)
        if m:
            pos = marqueurs_finaux.index(m)
            contenus_fin[i] = "\t" * (pos) + "* " + ligne.replace(m, "").replace("\t", "").rstrip()

    contenu = "\n\n".join(contenus_fin)
    # contenu = contenu.replace("\n\n", "\n")

    r.contenu = contenu

class Ressource():
    """Modélise une ressource lorsqu'elle est extraite d'un yaml"""
    __LOGGER = logging.getLogger(__name__)

    def __init__(self, fichieryaml):
        with open(fichieryaml, "r", encoding="utf8") as fid:
            yaml = ruamel.yaml.YAML()
            try:
                self.ressource = yaml.load(fid.read())
            except:
                Ressource.__LOGGER.warning(f"Pb de chargement de {fichieryaml}")

    def str_to_latex(self, modele="pn/modele_ressource.tex"):
        """Génère le code latex décrivant la ressource"""
        modlatex = get_modele(modele) #"pn/modele_ressource.tex")


        if self.ressource["code"] == "R107":
            print("ici")

        # Préparation des ac
        ajoutac = "\\ajoutac{%s}{%s}"
        compRT = []
        for accomp in self.ressource["acs"]:
            comps = []

            for no_ac in range(len(self.ressource["acs"][accomp])): # les ac de la comp
                code_ac = self.ressource["acs"][accomp][no_ac]
                comps.append( ajoutac % (code_ac, DATA_ACS[accomp][code_ac]) )
            compRT.append("\n".join(comps))

        # Préparation des sae
        ajoutsaes = "\\ajoutsae{%s}{%s}"
        saesRT = []
        for (i, sae) in enumerate(self.ressource["sae"]): # in range(len(self.apprentissages)):
            saesRT.append(ajoutsaes % (sae, get_officiel_sae_name_by_code(sae)))
        saes = "\n".join(saesRT)

        ajoutprerequis = "\\ajoutprerequis{%s}{%s}"
        prerequis = ""
        if self.ressource["prerequis"] == "Aucun":
            prerequis = ""
        else:
            liste = []
            for (no, mod) in enumerate(self.ressource["prerequis"]):
                liste.append(ajoutprerequis % (mod, get_officiel_ressource_name_by_code(mod)))
            prerequis = "\n".join(liste)

        # préparation du contexte
        contexte = self.ressource["contexte"]
        contexte = contexte.replace("\n", "\n\n").replace("\n" * 4,
                                                        "\n")  # corrige les suppressions de ligne à la relecture du yaml

        output = pypandoc.convert_text(contexte, 'tex', format='md',
                                       extra_args=['--atx-headers'])
        output = output.replace("\r\n", "\n")
        contexte = caracteres_recalcitrants(output)
        contexte = remove_ligne_vide(contexte)

        # contexte = remove_ligne_vide(contexte)
        # préparation du contenu

        contenu = self.ressource["contenu"] #supprime les passages à la ligne
        contenu = contenu.replace("\n", "\n\n").replace("\n"*4, "\n") # corrige les suppressions de ligne à la relecture du yaml

        output = pypandoc.convert_text(contenu, 'tex', format='md',
            extra_args=['--atx-headers'])
        output = output.replace("\r\n", "\n")
        contenu = caracteres_recalcitrants(output)
        contenu = remove_ligne_vide(contenu)

        chaine = ""
        chaine = TemplateLatex(modlatex).substitute(code=self.ressource["code"],
                                                       nom=self.ressource["nom"],
                                                       heures_formation=self.ressource["heures_formation"],
                                                       heures_tp=self.ressource["heures_tp"],
                                                       compRT1=compRT[0],
                                                       compRT2=compRT[1],
                                                       compRT3=compRT[2],
                                                       saes=saes,
                                                       motscles=caracteres_recalcitrants(self.ressource["motscles"]),
                                                       prerequis=prerequis,
                                                       contexte=caracteres_recalcitrants(contexte),
                                                       contenu=contenu,
                                                   )
        # chaine = chaine.replace("&", "\&")

        chaine = chaine.replace("\\tightlist\n", "")
        return chaine

def caracteres_recalcitrants(contenu):
    contenu = contenu.replace("è", "è").replace("’", "'").replace("é", "é")
    contenu = contenu.replace("â", "â").replace(b'a\xcc\x82'.decode("utf8"), "â")
    contenu = contenu.replace('\xa0', ' ') # le nbsp
    return contenu

if __name__=="__main__":
    # Eléments de test
    for sem in DATA_RESSOURCES:
        for code in DATA_RESSOURCES[sem]:
            nom_data = supprime_accent_espace(DATA_RESSOURCES[sem][code])
            print(nom_data)
-												Ajout du tableau de synthèse des ressources & heures de formation/TP

											
										
										
											2021-03-29 13:50:16 +02:00
+								import re
-												Déporte les données officielles dans officiel.py

											
										
										
											2021-03-30 07:59:21 +02:00
+								from officiel import *
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
+								from modeles import *
-												Sépare le script de traitement en 2 : 1 pour le parsing -> yaml, 1 autre pour yaml -> latex

											
										
										
											2021-03-31 10:34:56 +02:00
+								from officiel import supprime_accent_espace, get_code_from_nom
-												Amélioration du dump yaml

											
										
										
											2021-03-30 11:00:23 +02:00
+								import ruamel.yaml
 								from ruamel.yaml.scalarstring import FoldedScalarString as folded
-												Améliore l'export latex en utilisant pypandoc (suppose d'avoir installé pandoc sur la machine)

											
										
										
											2021-04-02 09:09:41 +02:00
+								import pypandoc
-												Ajout du tableau de synthèse des ressources & heures de formation/TP

											
										
										
											2021-03-29 13:50:16 +02:00
-												Début du traitement des données => détection des heures

											
										
										
											2021-03-29 11:20:05 +02:00
+								__LOGGER = logging.getLogger(__name__)
-												Ajout de yaml contenant les info "officielles" sur les ressources et les sae.
Elément de nettoyage des données (code/nom/semestre) pour uniformisation

											
										
										
											2021-03-29 16:22:51 +02:00
-												Sépare le script de traitement en 2 : 1 pour le parsing -> yaml, 1 autre pour yaml -> latex

											
										
										
											2021-03-31 10:34:56 +02:00
+								class RessourceDocx():
 								    """Classe modélisant les ressources, lorsqu'elles sont extraites du docx"""
-												Début du traitement des données => détection des heures

											
										
										
											2021-03-29 11:20:05 +02:00
+								    def __init__(self, nom, brute):
 								        self.nom = nom
 								        self.brute = brute # les données brutes de la ressource
 								    def charge_informations(self, code, semestre, heures_encadrees, tp, sae, prerequis, description, mots):
 								        self.code = code
 								        self.semestre = semestre # <--
 								        self.heures_encadrees = heures_encadrees
 								        self.tp = tp
 								        self.sae = sae
 								        self.prerequis = prerequis
 								        self.description = description
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
+								        self.contexte = None
 								        self.contenu = None
-												Début du traitement des données => détection des heures

											
										
										
											2021-03-29 11:20:05 +02:00
+								        self.mots = mots
 								    def charge_ac(self, apprentissages):
 								        self.apprentissages = apprentissages
 								    def __str__(self):
 								        print(self.nom + " " + self.code)
-												Export yaml (avec pb d'encodage)

											
										
										
											2021-03-30 09:22:21 +02:00
+								    def str_heures_formations(self):
-												Résoud le pb des lignes "trop courtes" dans le yaml

											
										
										
											2021-03-31 09:30:40 +02:00
+								        return self.heures_encadrees if self.heures_encadrees else "???"
-												Export yaml (avec pb d'encodage)

											
										
										
											2021-03-30 09:22:21 +02:00
 								    def str_heures_tp(self):
-												Résoud le pb des lignes "trop courtes" dans le yaml

											
										
										
											2021-03-31 09:30:40 +02:00
+								        return self.tp if self.tp else "???"
-												Export yaml (avec pb d'encodage)

											
										
										
											2021-03-30 09:22:21 +02:00
 								    def str_semestre(self):
 								        return int(self.semestre[1])
 								    def to_yaml(self):
-												Amélioration du dump yaml

											
										
										
											2021-03-30 11:00:23 +02:00
-												Export yaml (avec pb d'encodage)

											
										
										
											2021-03-30 09:22:21 +02:00
+								        dico = {"nom": self.nom,
 								                "code": self.code,
 								                "semestre" : self.str_semestre(),
 								                "heures_formation": self.str_heures_formations(),
 								                "heures_tp": self.str_heures_tp(),
 								                "acs": self.apprentissages,
-												ajout du traitement des saé mentionnées dans les ressources

											
										
										
											2021-03-30 12:34:59 +02:00
+								                "sae": self.sae,
-												Export yaml (avec pb d'encodage)

											
										
										
											2021-03-30 09:22:21 +02:00
+								                "prerequis": self.prerequis,
-												Correction de coquilles diverses

											
										
										
											2021-04-02 10:46:42 +02:00
+								                "contexte": folded(caracteres_recalcitrants(self.contexte)),
 								                "contenu": folded(caracteres_recalcitrants(self.contenu)),
 								                "motscles": caracteres_recalcitrants(self.mots) if self.mots else ""
-												Export yaml (avec pb d'encodage)

											
										
										
											2021-03-30 09:22:21 +02:00
+								                }
-												Amélioration du dump yaml

											
										
										
											2021-03-30 11:00:23 +02:00
+								        # output = yaml.dump(dico, #Dumper=yaml.Dumper,
 								        #    sort_keys=False, allow_unicode=True)
-												Résoud le pb des lignes "trop courtes" dans le yaml

											
										
										
											2021-03-31 09:30:40 +02:00
-												Amélioration du dump yaml

											
										
										
											2021-03-30 11:00:23 +02:00
+								        output = ruamel.yaml.dump(dico, Dumper=ruamel.yaml.RoundTripDumper,
-												Résoud le pb des lignes "trop courtes" dans le yaml

											
										
										
											2021-03-31 09:30:40 +02:00
+								                                  allow_unicode=True,
-												Améliore l'export latex en utilisant pypandoc (suppose d'avoir installé pandoc sur la machine)

											
										
										
											2021-04-02 09:09:41 +02:00
+								                                  width=100)
-												compilation latex avec quelques erreurs d'unicode restantes :(

											
										
										
											2021-03-30 16:55:47 +02:00
+								        output = output.replace("\n\n", "\n")
-												Export yaml (avec pb d'encodage)

											
										
										
											2021-03-30 09:22:21 +02:00
+								        return output
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
+								def nettoie_heure(r):
-												Matrice ACs vs ressources

											
										
										
											2021-03-29 22:11:17 +02:00
+								    """Nettoie le champ (horaire) (de la forme 46h ou 33...) pour en extraire la valeur numérique :
 								    le champ peut contenir 2 volumes (heures formation puis heures tp), auquel cas les 2 valeurs sont renvoyées
 								    dans un tuple"""
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
+								    def nettoie_champ_heure(champ):
 								        try: # champ contenant uniquement un nbre d'heure
 								            volumes = int(champ)
 								            return volumes
 								        except:
 								            volumes = re.findall("(\d{2}\D|\d{1}\D)", champ)
 								            if len(volumes) == 1:
 								                return int(volumes[0][:-1])
 								            elif len(volumes) == 2:
 								                volumes = sorted(volumes, reverse=True)
 								                return (int(volumes[0][:-1]), int(volumes[1][:-1]))
 								    if r.heures_encadrees: # si les heures encadrées sont renseignées
 								        volumes = nettoie_champ_heure(r.heures_encadrees)
 								    if r.tp:
 								        r.tp = nettoie_champ_heure(r.tp)
 								    if isinstance(volumes, int):
 								        r.heures_encadrees = volumes
 								    elif isinstance(volumes, tuple):
 								        r.heures_encadrees = volumes[0]
 								        if not r.tp:
 								            r.tp = volumes[1]
 								        elif r.tp != volumes[1]:
 								            __LOGGER.warning(r"nettoie_heure: ans {r.nom}, pb dans les heures tp/td")
 								    else:
 								        r.heures_encadrees = None
-												Matrice ACs vs ressources

											
										
										
											2021-03-29 22:11:17 +02:00
+								        #else:
 								            #__LOGGER.warning("Heures non détectées")
-												Début du traitement des données => détection des heures

											
										
										
											2021-03-29 11:20:05 +02:00
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
+								def nettoie_code(r):
-												Ajout du tableau de synthèse des ressources & heures de formation/TP

											
										
										
											2021-03-29 13:50:16 +02:00
+								    """Recherche les codes ressources de la forme RXXX dans champ"""
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
+								    champ = r.code
 								    if r.code:
 								        codes = re.findall(r"(R[0-9][0-9][0-9])", champ)
 								        # if len(codes) > 1:
 								        #    __LOGGER.warning("plusieurs codes trouvés :(")
 								        #elif len(codes) == 0:
 								        #    __LOGGER.warning("code manquant")
 								        if len(codes) == 1:
 								            r.code = codes[0]
 								        else:
 								            code_devine = get_code_from_nom(r)
 								            if code_devine:
 								                __LOGGER.warning(f"nettoie_code : \"{r.nom}\" => code {code_devine}")
 								                r.code = code_devine
 								            else:
 								                r.code = None
 								                __LOGGER.warning(f"nettoie_code : \"{r.nom}\" => code manquant")
 								def nettoie_semestre(r):
 								    """Nettoie les semestres : semestre 1 => "S1", semestre 2 => "S2" """
 								    if r.semestre:
 								        if "1" in r.semestre:
 								            r.semestre = "S1"
 								        elif "2" in r.semestre:
 								            r.semestre = "S2"
 								        else:
 								            __LOGGER.warning(f"nettoie_semestre : dans \"{r.nom}, PAS de semestre => rattaché au S2")
 								            r.semestre = "S2"
 								    else:
 								        __LOGGER.warning(f"nettoie_semestre : dans \"{r.nom}, PAS de semestre => rattaché au S2")
 								        r.semestre = "S2"
-												Début du traitement des données => détection des heures

											
										
										
											2021-03-29 11:20:05 +02:00
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
+								def nettoie_titre(r):
 								    """Nettoie le titre en utilisant les titres officiels"""
 								    def devine_nom_from_ressources(champ):
 								        champ_purge = supprime_accent_espace(champ)
 								        for sem in DATA_RESSOURCES:
 								            for code in DATA_RESSOURCES[sem]:
 								                nom_purge = supprime_accent_espace(DATA_RESSOURCES[sem][code])
 								                if champ_purge.startswith(nom_purge):
 								                    return DATA_RESSOURCES[sem][code] # le bon nom
 								    old = r.nom
 								    titre = devine_nom_from_ressources(r.nom)
 								    if titre and titre != old:
 								        __LOGGER.warning(f"nettoie_titre : {old} => titre \"{titre}\"")
 								        r.nom = titre
 								def nettoie_acs(r):
 								    """Nettoie les acs d'une ressource en les remplaçant par leur code pour les 3 compétences"""
 								    if len(r.apprentissages) != 3:
 								        __LOGGER.warning(f"nettoie_acs : Problème dans le nombre de compétences de {r.nom}")
-												ajoute les noms de compétences associés aux acs dans le yaml pour une meilleure lisibilité

											
										
										
											2021-03-31 09:38:56 +02:00
+								    dico = {}
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
+								    for comp in range(3):
 								        donnees = r.apprentissages[comp] # chaine de caractères listant les ACS
 								        # donnees = donnees.replace("\t", "").replace("-", "") # supprime les tabulations
 								        acs_avec_code = devine_acs_by_code(donnees)
-												Export yaml (avec pb d'encodage)

											
										
										
											2021-03-30 09:22:21 +02:00
+								        acs_avec_nom = devine_code_by_nom_from_dict(donnees, DATA_ACS)
-												Améliore l'export latex en utilisant pypandoc (suppose d'avoir installé pandoc sur la machine)

											
										
										
											2021-04-02 09:09:41 +02:00
+								        if acs_avec_code and set(acs_avec_nom).intersection(set(acs_avec_code)) != set(acs_avec_nom):
 								            __LOGGER.warning(f"Dans {r.nom}, revoir les ACS : {acs_avec_code} vs {acs_avec_nom}")
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
+								        acs_finaux = acs_avec_code + acs_avec_nom
 								        acs_finaux = [ac.replace(" ", "") for ac in acs_finaux]
 								        acs_finaux = sorted(list(set(acs_finaux)))
-												ajoute les noms de compétences associés aux acs dans le yaml pour une meilleure lisibilité

											
										
										
											2021-03-31 09:38:56 +02:00
+								        dico["RT" + str(comp+1)] = acs_finaux
 								    r.apprentissages = dico # [comp] = acs_finaux
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
-												Intègre l'affichage des pré-requis

											
										
										
											2021-03-30 12:14:27 +02:00
+								def nettoie_sae(r):
 								    """Nettoie les sae en détectant les codes"""
-												ajout du traitement des saé mentionnées dans les ressources

											
										
										
											2021-03-30 12:34:59 +02:00
+								    SAE_avec_code = devine_sae_by_code(r.sae)
 								    liste = [l.rstrip() for l in SAE_avec_code]
 								    r.sae = liste
 								    if not r.sae:
 								        __LOGGER.warning(f"nettoie_sae: dans {r.nom} pas de SAE (:")
-												Intègre l'affichage des pré-requis

											
										
										
											2021-03-30 12:14:27 +02:00
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
+								def nettoie_prerequis(r):
 								    """Nettoie les prérequis (ressource) en les remplaçant par leur code de ressource"""
 								    R_avec_code = devine_ressources_by_code(r.prerequis)
-												Export yaml (avec pb d'encodage)

											
										
										
											2021-03-30 09:22:21 +02:00
+								    R_avec_nom = devine_code_by_nom_from_dict(r.prerequis, DATA_RESSOURCES)
-												Intègre l'affichage des pré-requis

											
										
										
											2021-03-30 12:14:27 +02:00
+								    liste = R_avec_code + R_avec_nom
-												Améliore détection des pré-requis

											
										
										
											2021-04-02 11:50:22 +02:00
+								    liste = [l.rstrip().replace(",", "").replace(".","") for l in liste] # supprime les espaces
-												Intègre l'affichage des pré-requis

											
										
										
											2021-03-30 12:14:27 +02:00
+								    R_finaux = sorted(list(set(liste)))
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
+								    if R_finaux:
 								        r.prerequis = R_finaux
 								    else:
 								        r.prerequis = "Aucun"
-												Ajout de yaml contenant les info "officielles" sur les ressources et les sae.
Elément de nettoyage des données (code/nom/semestre) pour uniformisation

											
										
										
											2021-03-29 16:22:51 +02:00
-												compilation latex avec quelques erreurs d'unicode restantes :(

											
										
										
											2021-03-30 16:55:47 +02:00
+								def nettoie_mots_cles(r):
 								    mots = r.mots # .encode('utf8', 'ignore').decode('utf8')
 								    mots = mots.replace(".", "")
 								    r.mots = mots
-												Ajout de yaml contenant les info "officielles" sur les ressources et les sae.
Elément de nettoyage des données (code/nom/semestre) pour uniformisation

											
										
										
											2021-03-29 16:22:51 +02:00
-												Ajoute l'extraction des apprentissages critiques en se basant sur les noms/codes officiels donnés dans acs.yml

											
										
										
											2021-03-29 17:25:16 +02:00
+								def devine_acs_by_code(champ):
 								    """Recherche les codes ressources de la forme ACXXX ou AC0XXX dans champ ;
 								    ramène les codes AC0XXX à 3 chiffres.
 								    """
 								    codes3 = re.findall(r"(AC[0-9][0-9][0-9]\D)", champ) # de code à 3 chiffres
 								    codes4 = re.findall(r"(AC0[0-9][0-9][0-9])", champ)
-												Ajout de yaml contenant les info "officielles" sur les ressources et les sae.
Elément de nettoyage des données (code/nom/semestre) pour uniformisation

											
										
										
											2021-03-29 16:22:51 +02:00
-												Améliore l'export latex en utilisant pypandoc (suppose d'avoir installé pandoc sur la machine)

											
										
										
											2021-04-02 09:09:41 +02:00
+								    codes3 = [c.rstrip() for c in codes3]
 								    codes4 = [c.rstrip() for c in codes4]
 								    codes4 += [ "AC0" + c[-3:] for c in codes3] # ajoute les 0 manquants des acs (codage AC0111)
-												Elements d'export

											
										
										
											2021-03-30 19:35:52 +02:00
+								    return sorted(list(set(codes4)))
-												Ajoute l'extraction des apprentissages critiques en se basant sur les noms/codes officiels donnés dans acs.yml

											
										
										
											2021-03-29 17:25:16 +02:00
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
+								def devine_ressources_by_code(champ):
 								    """Recherche les codes ressources de la forme RXXX dans champ ;
 								    """
 								    codes = re.findall(r"(R\d{3}\D)", champ) # de code à 3 chiffres
 								    return sorted(list(set(codes)))
 								def devine_ressources_by_nom(donnees):
 								    """Partant d'une chaine de caractères, détermine les ressources
 								    présentes dans la donnée, en utilisant les infos officielles de
 								    ressources.yml"""
 								    donnees_purge = supprime_accent_espace(donnees)
 								    codes = []
 								    for sem in DATA_RESSOURCES:
 								        for code in DATA_RESSOURCES[sem]:
 								            nom_purge = supprime_accent_espace(DATA_RESSOURCES[sem][code])
 								            if nom_purge in donnees_purge:
 								                codes += [code]
 								    return sorted(list(set(codes)))
-												ajout du traitement des saé mentionnées dans les ressources

											
										
										
											2021-03-30 12:34:59 +02:00
+								def devine_sae_by_code(donnees):
 								    """Partant d'une chaine de caractères, détermine les codes des SAE"""
 								    codes = re.findall(r"(SAE\d\d)\D", donnees)
 								    codes += re.findall(r"(SAÉ\d\d)\D", donnees)# de code à 3 chiffres
 								    for (i, code) in enumerate(codes):
 								        codes[i] = codes[i].replace("E", "É")
 								    return sorted(list(set(codes)))
-												Amélioration du dump yaml

											
										
										
											2021-03-30 11:00:23 +02:00
+								def split_description(r):
 								    """Découpe le champ description en un contexte+un contenu ; si pas possible """
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
+								    champs = r.description.split("\n")
 								    champs = [c for c in champs if c] # supprime les lignes vides
 								    indicea = 0 # la ligne mentionnant le contexte
 								    if True in [ligne.startswith("Contexte et ") for ligne in champs]:  # la ligne commençant par Contenus
 								        indicea = [ligne.startswith("Contexte et ") for ligne in champs].index(True)
 								    indicec = 0
-												compilation latex avec quelques erreurs d'unicode restantes :(

											
										
										
											2021-03-30 16:55:47 +02:00
+								    contexte = []
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
+								    if True in [ligne.startswith("Contenus") for ligne in champs]: # la ligne commençant par Contenus
 								        indicec = [ligne.startswith("Contenus") for ligne in champs].index(True)
-												Correction de coquilles diverses

											
										
										
											2021-04-02 10:46:42 +02:00
+								    if True in [ligne.startswith("Contexte et ") for ligne in champs]:
-												compilation latex avec quelques erreurs d'unicode restantes :(

											
										
										
											2021-03-30 16:55:47 +02:00
+								        contexte = champs[indicea+1:indicec]
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
+								    else:
-												compilation latex avec quelques erreurs d'unicode restantes :(

											
										
										
											2021-03-30 16:55:47 +02:00
+								        contexte = champs[:indicec]
 								    # suppression des lignes vides
 								    contexte = "\n".join(remove_ligne_vide(contexte))
 								    # suppression des liens
 								    contexte = remove_link(contexte)
 								    if not contexte:
 								        contexte = "Aucun"
-												Amélioration du dump yaml

											
										
										
											2021-03-30 11:00:23 +02:00
+								    contenu = "\n".join(champs[indicec+1:])
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
-												compilation latex avec quelques erreurs d'unicode restantes :(

											
										
										
											2021-03-30 16:55:47 +02:00
-												Amélioration du dump yaml

											
										
										
											2021-03-30 11:00:23 +02:00
+								    # sauvegarde des champs
-												Amélioration de la détection des marqueurs dans le contenu

											
										
										
											2021-03-30 11:09:43 +02:00
+								    r.contexte = contexte
-												Amélioration du dump yaml

											
										
										
											2021-03-30 11:00:23 +02:00
+								    r.contenu = contenu
-												compilation latex avec quelques erreurs d'unicode restantes :(

											
										
										
											2021-03-30 16:55:47 +02:00
+								def remove_link(contenu):
 								    liens = re.findall("(<a\s.*\">)", contenu)
 								    for m in liens:
 								        contenu = contenu.replace(m, "")
 								    contenu = contenu.replace("</a>", "")
 								    return contenu
-												Amélioration du dump yaml

											
										
										
											2021-03-30 11:00:23 +02:00
+								def remove_ligne_vide(contenus):
 								    """Supprime les lignes vides"""
-												Correction de coquilles diverses

											
										
										
											2021-04-02 10:46:42 +02:00
+								    if isinstance(contenus, list):
 								        return [c for c in contenus if c.rstrip()]
 								    else: # contenu = chaine
 								        temp = contenus.split("\n")
 								        temp = [t for t in temp if t.replace("\t", "").rstrip()]
 								        return "\n".join(temp)
-												Amélioration du dump yaml

											
										
										
											2021-03-30 11:00:23 +02:00
 								def get_marqueur_numerique(contenu):
 								    """Revoie la liste des marqueurs numériques"""
-												Améliore l'export latex en utilisant pypandoc (suppose d'avoir installé pandoc sur la machine)

											
										
										
											2021-04-02 09:09:41 +02:00
+								    m = re.findall(r"(\d/|\d\s/)", contenu)
 								    m += re.findall(r"(\d\s\)|\d\))", contenu) # les marqueurs de la forme 1)
 								    m += re.findall(r"(--\s|--\t)", contenu)
-												Amélioration du dump yaml

											
										
										
											2021-03-30 11:00:23 +02:00
+								    return m
 								def get_marqueurs(contenus):
-												Améliore l'export latex en utilisant pypandoc (suppose d'avoir installé pandoc sur la machine)

											
										
										
											2021-04-02 09:09:41 +02:00
+								    """Renvoie la liste des marqueurs (à 1 caractère) partant d'une liste de ligne"""
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
+								    marqueurs = []
 								    for ligne in contenus:
-												Améliore l'export latex en utilisant pypandoc (suppose d'avoir installé pandoc sur la machine)

											
										
										
											2021-04-02 09:09:41 +02:00
+								        m = re.search(r"(\t)*", ligne) # des \t ?
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
+								        if m.group() != "":
 								            ajout = m.group()
 								        else:
 								            ajout = ""
-												Amélioration du dump yaml

											
										
										
											2021-03-30 11:00:23 +02:00
+								        ligne = ligne.replace("\t","")[0].rstrip() # le marqueur en début de ligne (si 1 caractère)
-												Elements d'export

											
										
										
											2021-03-30 19:35:52 +02:00
+								        if ligne[0] not in string.ascii_letters and ligne[0] != "É" and ligne[0] != "/":
-												Amélioration du dump yaml

											
										
										
											2021-03-30 11:00:23 +02:00
+								            marqueurs += [ajout + ligne[0]] # tous les symboles
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
-												Amélioration du dump yaml

											
										
										
											2021-03-30 11:00:23 +02:00
+								    marqueurs_finaux = [] # tri les marqueurs en supprimant les doublons et en gardant un ordre (pour détecter les sous listes)
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
+								    for m in marqueurs:
-												Amélioration du dump yaml

											
										
										
											2021-03-30 11:00:23 +02:00
+								        if m not in marqueurs_finaux:
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
+								            marqueurs_finaux.append(m)
-												Amélioration du dump yaml

											
										
										
											2021-03-30 11:00:23 +02:00
+								    return marqueurs_finaux
-												Elements d'export

											
										
										
											2021-03-30 19:35:52 +02:00
+								def get_marqueur(ligne, marqueurs):
 								    """Renvoie le marqueur qui marque le début d'une ligne parmi une liste de marqueurs recherchés"""
 								    for m in marqueurs:
 								        if ligne.startswith(m):
 								            return m
-												Amélioration du dump yaml

											
										
										
											2021-03-30 11:00:23 +02:00
+								def nettoie_contenus(r):
 								    # suppression des \t
-												Correction de coquilles diverses

											
										
										
											2021-04-02 10:46:42 +02:00
+								    contenu = r.contenu.replace(" / ", "/") # supprime les nbsp
-												Améliore l'export latex en utilisant pypandoc (suppose d'avoir installé pandoc sur la machine)

											
										
										
											2021-04-02 09:09:41 +02:00
-												Correction de coquilles diverses

											
										
										
											2021-04-02 10:46:42 +02:00
+								    if r.code == "R113":
-												Améliore l'export latex en utilisant pypandoc (suppose d'avoir installé pandoc sur la machine)

											
										
										
											2021-04-02 09:09:41 +02:00
+								        print("ici")
-												Amélioration de la détection des marqueurs dans le contenu

											
										
										
											2021-03-30 11:09:43 +02:00
-												Amélioration du dump yaml

											
										
										
											2021-03-30 11:00:23 +02:00
+								    marqueurs_numeriques = get_marqueur_numerique(contenu)
 								    for m in marqueurs_numeriques: # remplace les marqueurs numériques
 								        contenu = contenu.replace(m, ">")
-												Améliore l'export latex en utilisant pypandoc (suppose d'avoir installé pandoc sur la machine)

											
										
										
											2021-04-02 09:09:41 +02:00
+								    contenus = [ligne.rstrip() for ligne in contenu.split("\n")] # les contenus
-												Amélioration du dump yaml

											
										
										
											2021-03-30 11:00:23 +02:00
+								    contenus = remove_ligne_vide(contenus) # supprime les lignes vides
 								    marqueurs_finaux = get_marqueurs(contenus)
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
 								    contenus_fin = contenus[:] # copie des ligne
-												Amélioration de la détection des marqueurs dans le contenu

											
										
										
											2021-03-30 11:09:43 +02:00
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
+								    for (i, ligne) in enumerate(contenus):
-												Amélioration de la détection des marqueurs dans le contenu

											
										
										
											2021-03-30 11:09:43 +02:00
+								        m = get_marqueur(ligne, marqueurs_finaux)
 								        if m:
 								            pos = marqueurs_finaux.index(m)
-												Améliore l'export latex en utilisant pypandoc (suppose d'avoir installé pandoc sur la machine)

											
										
										
											2021-04-02 09:09:41 +02:00
+								            contenus_fin[i] = "\t" * (pos) + "* " + ligne.replace(m, "").replace("\t", "").rstrip()
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
-												Améliore l'export latex en utilisant pypandoc (suppose d'avoir installé pandoc sur la machine)

											
										
										
											2021-04-02 09:09:41 +02:00
+								    contenu = "\n\n".join(contenus_fin)
 								    # contenu = contenu.replace("\n\n", "\n")
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
 								    r.contenu = contenu
-												Amélioration du dump yaml

											
										
										
											2021-03-30 11:00:23 +02:00
-												Sépare le script de traitement en 2 : 1 pour le parsing -> yaml, 1 autre pour yaml -> latex

											
										
										
											2021-03-31 10:34:56 +02:00
+								class Ressource():
 								    """Modélise une ressource lorsqu'elle est extraite d'un yaml"""
 								    __LOGGER = logging.getLogger(__name__)
 								    def __init__(self, fichieryaml):
 								        with open(fichieryaml, "r", encoding="utf8") as fid:
 								            yaml = ruamel.yaml.YAML()
 								            try:
 								                self.ressource = yaml.load(fid.read())
 								            except:
 								                Ressource.__LOGGER.warning(f"Pb de chargement de {fichieryaml}")
 								    def str_to_latex(self, modele="pn/modele_ressource.tex"):
 								        """Génère le code latex décrivant la ressource"""
 								        modlatex = get_modele(modele) #"pn/modele_ressource.tex")
-												Améliore détection des pré-requis

											
										
										
											2021-04-02 11:50:22 +02:00
+								        if self.ressource["code"] == "R107":
 								            print("ici")
-												Sépare le script de traitement en 2 : 1 pour le parsing -> yaml, 1 autre pour yaml -> latex

											
										
										
											2021-03-31 10:34:56 +02:00
+								        # Préparation des ac
 								        ajoutac = "\\ajoutac{%s}{%s}"
 								        compRT = []
 								        for accomp in self.ressource["acs"]:
 								            comps = []
-												Améliore l'export latex en utilisant pypandoc (suppose d'avoir installé pandoc sur la machine)

											
										
										
											2021-04-02 09:09:41 +02:00
-												Sépare le script de traitement en 2 : 1 pour le parsing -> yaml, 1 autre pour yaml -> latex

											
										
										
											2021-03-31 10:34:56 +02:00
+								            for no_ac in range(len(self.ressource["acs"][accomp])): # les ac de la comp
-												Améliore l'export latex en utilisant pypandoc (suppose d'avoir installé pandoc sur la machine)

											
										
										
											2021-04-02 09:09:41 +02:00
+								                code_ac = self.ressource["acs"][accomp][no_ac]
-												Améliore détection des pré-requis

											
										
										
											2021-04-02 11:50:22 +02:00
+								                comps.append( ajoutac % (code_ac, DATA_ACS[accomp][code_ac]) )
-												Sépare le script de traitement en 2 : 1 pour le parsing -> yaml, 1 autre pour yaml -> latex

											
										
										
											2021-03-31 10:34:56 +02:00
+								            compRT.append("\n".join(comps))
 								        # Préparation des sae
 								        ajoutsaes = "\\ajoutsae{%s}{%s}"
 								        saesRT = []
 								        for (i, sae) in enumerate(self.ressource["sae"]): # in range(len(self.apprentissages)):
 								            saesRT.append(ajoutsaes % (sae, get_officiel_sae_name_by_code(sae)))
 								        saes = "\n".join(saesRT)
 								        ajoutprerequis = "\\ajoutprerequis{%s}{%s}"
-												Intègre l'affichage des pré-requis

											
										
										
											2021-03-30 12:14:27 +02:00
+								        prerequis = ""
-												Sépare le script de traitement en 2 : 1 pour le parsing -> yaml, 1 autre pour yaml -> latex

											
										
										
											2021-03-31 10:34:56 +02:00
+								        if self.ressource["prerequis"] == "Aucun":
 								            prerequis = ""
 								        else:
 								            liste = []
 								            for (no, mod) in enumerate(self.ressource["prerequis"]):
 								                liste.append(ajoutprerequis % (mod, get_officiel_ressource_name_by_code(mod)))
 								            prerequis = "\n".join(liste)
 								        # préparation du contexte
 								        contexte = self.ressource["contexte"]
-												Correction de coquilles diverses

											
										
										
											2021-04-02 10:46:42 +02:00
+								        contexte = contexte.replace("\n", "\n\n").replace("\n" * 4,
 								                                                        "\n")  # corrige les suppressions de ligne à la relecture du yaml
-												Sépare le script de traitement en 2 : 1 pour le parsing -> yaml, 1 autre pour yaml -> latex

											
										
										
											2021-03-31 10:34:56 +02:00
-												Correction de coquilles diverses

											
										
										
											2021-04-02 10:46:42 +02:00
+								        output = pypandoc.convert_text(contexte, 'tex', format='md',
 								                                       extra_args=['--atx-headers'])
 								        output = output.replace("\r\n", "\n")
 								        contexte = caracteres_recalcitrants(output)
 								        contexte = remove_ligne_vide(contexte)
 								        # contexte = remove_ligne_vide(contexte)
-												Sépare le script de traitement en 2 : 1 pour le parsing -> yaml, 1 autre pour yaml -> latex

											
										
										
											2021-03-31 10:34:56 +02:00
+								        # préparation du contenu
 								        contenu = self.ressource["contenu"] #supprime les passages à la ligne
-												Correction de coquilles diverses

											
										
										
											2021-04-02 10:46:42 +02:00
+								        contenu = contenu.replace("\n", "\n\n").replace("\n"*4, "\n") # corrige les suppressions de ligne à la relecture du yaml
-												Améliore l'export latex en utilisant pypandoc (suppose d'avoir installé pandoc sur la machine)

											
										
										
											2021-04-02 09:09:41 +02:00
 								        output = pypandoc.convert_text(contenu, 'tex', format='md',
 								            extra_args=['--atx-headers'])
-												Correction de coquilles diverses

											
										
										
											2021-04-02 10:46:42 +02:00
+								        output = output.replace("\r\n", "\n")
 								        contenu = caracteres_recalcitrants(output)
 								        contenu = remove_ligne_vide(contenu)
-												Sépare le script de traitement en 2 : 1 pour le parsing -> yaml, 1 autre pour yaml -> latex

											
										
										
											2021-03-31 10:34:56 +02:00
 								        chaine = ""
 								        chaine = TemplateLatex(modlatex).substitute(code=self.ressource["code"],
 								                                                       nom=self.ressource["nom"],
 								                                                       heures_formation=self.ressource["heures_formation"],
 								                                                       heures_tp=self.ressource["heures_tp"],
 								                                                       compRT1=compRT[0],
 								                                                       compRT2=compRT[1],
 								                                                       compRT3=compRT[2],
 								                                                       saes=saes,
-												Correction de coquilles diverses

											
										
										
											2021-04-02 10:46:42 +02:00
+								                                                       motscles=caracteres_recalcitrants(self.ressource["motscles"]),
-												Sépare le script de traitement en 2 : 1 pour le parsing -> yaml, 1 autre pour yaml -> latex

											
										
										
											2021-03-31 10:34:56 +02:00
+								                                                       prerequis=prerequis,
-												Correction de coquilles diverses

											
										
										
											2021-04-02 10:46:42 +02:00
+								                                                       contexte=caracteres_recalcitrants(contexte),
 								                                                       contenu=contenu,
-												Sépare le script de traitement en 2 : 1 pour le parsing -> yaml, 1 autre pour yaml -> latex

											
										
										
											2021-03-31 10:34:56 +02:00
+								                                                   )
-												Correction de coquilles diverses

											
										
										
											2021-04-02 10:46:42 +02:00
+								        # chaine = chaine.replace("&", "\&")
 								        chaine = chaine.replace("\\tightlist\n", "")
-												Sépare le script de traitement en 2 : 1 pour le parsing -> yaml, 1 autre pour yaml -> latex

											
										
										
											2021-03-31 10:34:56 +02:00
+								        return chaine
-												Correction de coquilles diverses

											
										
										
											2021-04-02 10:46:42 +02:00
+								def caracteres_recalcitrants(contenu):
 								    contenu = contenu.replace("è", "è").replace("’", "'").replace("é", "é")
 								    contenu = contenu.replace("â", "â").replace(b'a\xcc\x82'.decode("utf8"), "â")
 								    contenu = contenu.replace('\xa0', ' ') # le nbsp
 								    return contenu
-												amélioratios diverses

											
										
										
											2021-03-30 07:56:41 +02:00
-												Ajoute l'extraction des apprentissages critiques en se basant sur les noms/codes officiels donnés dans acs.yml

											
										
										
											2021-03-29 17:25:16 +02:00
+								if __name__=="__main__":
 								    # Eléments de test
 								    for sem in DATA_RESSOURCES:
 								        for code in DATA_RESSOURCES[sem]:
 								            nom_data = supprime_accent_espace(DATA_RESSOURCES[sem][code])
 								            print(nom_data)