54 lines
No EOL
1.6 KiB
HTML
54 lines
No EOL
1.6 KiB
HTML
[(#REM)
|
|
affichage en boucle DATA des premières et dernières lignes des fichiers JSONL stockés dans un répertoire corpus
|
|
on fait tout un tas de traitements en fonction du type de donnée par champ pour essayer d'afficher qq chose de "lisible par un humain"
|
|
|
|
]
|
|
<h1>Synthèse des contenus extraits d'un lot de fichiers JSONL</h1>
|
|
<p>Chargement des fichiers Jsonl après leur décompaction et récupération de "contenus significatifs" puis mise en tableau pour filtrages/tris/extractions CSV
|
|
<br>Nombre de lignes configuré par le "pas" de l'itération dans les pages : ici <strong>#CONFIG{corpus_web/pas_corpus, 10}</strong> (1 = toutes les pages, 10 = 1 page sur 10...)
|
|
<br><small>pour mémoire : 1 ligne du fichier JSONL = 1 page HTML du site aspiré/archivé</small>
|
|
</p>
|
|
</div></div>
|
|
<div class="la_une">
|
|
<INCLURE{fond=inclure/gamutable,
|
|
apiuri="spip.php?page=json_affiche_corpus.json",
|
|
tparpage=[15,25,50,'Tous'],
|
|
champcsv="search",
|
|
delimitercsv=";",
|
|
vueblocdefaut='tableau',
|
|
namecsv="extractions_corpus.csv",
|
|
env
|
|
}>
|
|
</div>
|
|
|
|
<script type="text/javascript">
|
|
jQuery(function () {
|
|
$('.aff_masq').each(function() {
|
|
$(this).siblings('.details').toggleClass('js-hidden');
|
|
});
|
|
|
|
$('.aff_masq').on('click', function() {
|
|
$(this).siblings('.details').toggleClass('js-hidden');
|
|
});
|
|
});
|
|
</script>
|
|
|
|
<style type="text/css" media="screen">
|
|
.aff_masq, .aff_masq_ {
|
|
cursor: pointer;
|
|
font-weight: bold;
|
|
}
|
|
.aff_masq:hover {
|
|
background-color: #DDD;
|
|
}
|
|
.details br:first-of-type {
|
|
display: none;
|
|
}
|
|
textarea {
|
|
width: 100%;
|
|
height: 200px;
|
|
}
|
|
.non_traite {
|
|
color: #777;
|
|
}
|
|
</style> |