Derniere mise a jour : 9 fevrier 2026

Compteur de Mots

2024 Outil Python

Presentation

Objectif principal : Un outil pour analyser des textes : compter les mots, les caracteres, les phrases, la frequence de chaque mot, le temps de lecture estime. Utile pour les rapports et dissertations.

Technologies utilisees : Python avec collections.Counter pour les frequences. Regex pour decouper en mots proprement. Interface CLI simple avec des options.

Fonctionnalites cles : Compte mots/caracteres/phrases, top 10 des mots les plus frequents (hors mots vides), temps de lecture estime, indice de lisibilite Flesch, export en JSON.

Livrables attendus : Un script en ligne de commande qui analyse des fichiers texte. Resultat affiche dans le terminal ou exporte en fichier.

Calendrier previsionnel : 3 jours. Simple mais utile. Le plus long c'etait de peaufiner la detection des phrases (les ? et ! comptent aussi, pas que les points).

Parties prenantes & criteres de succes : Projet perso pour avoir un outil pratique. Je l'utilise pour verifier la longueur de mes rapports.

Le Defi

Definir ce qu'est un "mot". Les nombres comptent ? Les abreviations comme "M." ? Les mots composes avec tiret c'est un ou deux mots ? J'ai du faire des choix et les documenter.

La Solution

J'ai utilise une regex qui matche les sequences de lettres et chiffres. Les nombres comptent. Les mots composes comptent pour un mot. Les abreviations aussi. C'est coherent avec ce que fait Word. Y'a une option pour personnaliser si besoin.

Architecture Technique

Une classe TextAnalyzer qui prend le texte en entree. Methodes count_words(), count_chars(), count_sentences(), word_frequency(), reading_time(). Une liste de stop words (le, la, de, etc.) pour les exclure des frequences. Le temps de lecture c'est nombre de mots / 200 (moyenne humaine).

Points Cles

  • Stats completes sur le texte
  • Frequence des mots hors stop words
  • Indice de lisibilite Flesch

Apercu

Resultats & Apprentissages

Outil simple mais que j'utilise vraiment. J'ai appris a utiliser les regex proprement et collections.Counter qui est super pratique. Aussi comment calculer des indices de lisibilite, c'est interessant.

Evolutions Futures

Une interface graphique pour drag & drop des fichiers. Comparer deux textes pour detecter le plagiat. Support des fichiers PDF et Word. Generer un nuage de mots graphique.

Retour aux projets Me contacter