From cdeb5f0b6131233b73c7b511c8aaae80c6447060 Mon Sep 17 00:00:00 2001 From: cy_altern Date: Fri, 12 May 2023 17:00:49 +0200 Subject: [PATCH] =?UTF-8?q?Feat=20:=20renommage=20des=20pages=20pour=20mei?= =?UTF-8?q?lleure=20compr=C3=A9hension.=20Ajout=20de=20la=20page=20d'explo?= =?UTF-8?q?ration=20d'un=20corpus=20complet=20(toutes=20les=20lignes=20des?= =?UTF-8?q?=20fichiers=20JSONL=20soumis)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ...{mouline_corpus.html => apercu_jsonl.html} | 14 ++- content/explo_jsonl.html | 114 ++++++++++++++++++ content/mouline_videos.html | 6 +- corpus_web_fonctions.php | 15 ++- footer/dist.html | 90 ++++++++++++++ formulaires/configurer_corpus_web.html | 5 +- paquet.xml | 2 + 7 files changed, 234 insertions(+), 12 deletions(-) rename content/{mouline_corpus.html => apercu_jsonl.html} (84%) create mode 100644 content/explo_jsonl.html create mode 100644 footer/dist.html diff --git a/content/mouline_corpus.html b/content/apercu_jsonl.html similarity index 84% rename from content/mouline_corpus.html rename to content/apercu_jsonl.html index f6e3541..998b1f1 100644 --- a/content/mouline_corpus.html +++ b/content/apercu_jsonl.html @@ -1,10 +1,15 @@ -

Traitement fichiers JSONL

-

Chargement des fichiers Jsonl après leur décompaction et affichage du contenu de leur 1ère et denière ligne

+[(#REM) + affichage en boucle DATA des premières et dernières lignes des fichiers JSONL stockés dans un répertoire corpus + on fait tout un tas de traitements en fonction du type de donnée par champ pour essayer d'afficher qq chose de "lisible par un humain" + +] +

Aperçu d'un lot de fichiers JSONL

+

Chargement des fichiers Jsonl après leur décompaction et affichage du contenu de leur 1ère et dernière ligne

] - diff --git a/content/explo_jsonl.html b/content/explo_jsonl.html new file mode 100644 index 0000000..d602457 --- /dev/null +++ b/content/explo_jsonl.html @@ -0,0 +1,114 @@ +[(#REM) + affichage en boucle DATA des premières et dernières lignes des fichiers JSONL stockés dans un répertoire corpus + on fait tout un tas de traitements en fonction du type de donnée par champ pour essayer d'afficher qq chose de "lisible par un humain" + +] +

Contenus d'un lot de fichiers JSONL

+

Chargement des fichiers Jsonl après leur décompaction et affichage du contenu de toutes leurs lignes +
pour mémoire : 1 ligne du fichier JSONL = 1 page HTML du site aspiré/archivé +

+
+ +
+ + + + \ No newline at end of file diff --git a/content/mouline_videos.html b/content/mouline_videos.html index c9356e5..c66323a 100644 --- a/content/mouline_videos.html +++ b/content/mouline_videos.html @@ -7,7 +7,7 @@ On part d'une table remplie par un import CSV ] -

Traitement CSV des vidéos : TXT

+

Import CSV des vidéos : TXT

Intégration des contenus textuels des vidéos dans la table spip_corpus_videos

-

Traitement CSV des vidéos : XML

+

Import CSV des vidéos : XML

Intégration des contenus XML des vidéos dans la table spip_corpus_videos

-

Traitement CSV des vidéos : titres

+

Import CSV des vidéos : titres

Création d'un titre à partir de la description si absent