Table des matières

LECOEUR Nolwenn

Comment trier des données ?


I- Introduction

Vous aurez sûrement remarqué qu’il est plus rapide et plus simple de trouver quelque chose lorsque les données dans lesquelles on cherche sont triées.

C’est une chose que nous savons depuis qu’il existe des bibliothèques et des bibliothécaires : même si cela est long et fatigant, il vaut mieux ranger les livres d’une bibliothèque une fois pour toutes, par exemple dans l’ordre alphabétique, plutôt que les laisser en vrac et arpenter des kilomètres de rayonnages à chaque fois que l’on cherche un volume.

Cela mène naturellement à un nouveau problème : comment trier des données ? Selon le dictionnaire, “trier” signifie “répartir en plusieurs classes selon certains critères”. De manière plus restrictive, le terme de “tri” en algorithmique est très souvent attaché au processus de classement d'un ensemble d'éléments dans un ordre donné.

Par exemple, trier N entiers dans l'ordre croissant, ou N noms dans l'ordre alphabétique. Tout ensemble muni d'un ordre total peut fournir une suite d'éléments à trier.

Ainsi, pour trier des données, on utilise généralement des algorithmes de tri. Ils sont fondamentaux dans certains domaines, comme l'informatique de gestion où l'on tri de manière quasi-systématique des données avant de les utiliser.


II- Algorithmes de tri : définition

Un algorithme de tri est, en informatique ou en mathématiques, un algorithme qui permet d'organiser une collection d'objets selon un ordre déterminé. Les objets à trier font donc partie d'un ensemble muni d'une relation d'ordre (de manière générale un ordre total). Les ordres les plus utilisés sont l’ordre numérique et l'ordre lexicographique (dictionnaire).

La collection à trier est souvent donnée sous forme de tableau, afin de permettre l'accès direct aux différents éléments de la collection, ou sous forme de liste, ce qui peut se révéler être plus adapté à certains algorithmes et à l'usage de la programmation fonctionnelle.

De plus, tous les algorithmes ne sont pas identiques, il existe plusieurs critères qui permettent des les différencier afin de choisir celui le plus adapté pour un cas. Les principales caractéristiques qui permettent de différencier les algorithmes de tri sont :


III- Différents types d’algorithmes de tri

1) Tris par comparaison

a) Algorithmes lents

Autres exemples d’algorithmes lents :

b) Algorithmes rapides

Le principe de cet algorithme est le suivant :

  1. On découpe les données à trier en deux parties plus ou moins égales
  2. On trie les 2 sous-parties ainsi déterminées
  3. On fusionne les deux sous-parties pour retrouver les données de départ

Autres exemples d’algorithmes rapides :

2) Tris utilisant la structure des données

3) Tri volumineux

Les algorithmes de tri doivent aussi être adaptés en fonction des configurations informatiques sur lesquels ils sont utilisés. Dans les exemples cités plus haut, on suppose que toutes les données sont présentes en mémoire centrale (ou accessibles en mémoire virtuelle). La situation se complexifie si l'on veut trier des volumes de données supérieurs à la mémoire centrale disponible (ou si l'on cherche à améliorer le tri en optimisant l'utilisation de la hiérarchie de mémoire).

Ces algorithmes sont souvent basés sur une approche assez voisine de celle du tri fusion. Le principe est le suivant :

  1. On découpe le volume de données à trier en sous-ensembles de taille inférieure à la mémoire rapide disponible ;
  2. On trie chaque sous-ensemble en mémoire centrale pour former des « monotonies » (sous-ensembles triés) ;
  3. On interclasse ces monotonies.