Sys.command "ocaml -version";;
The OCaml toplevel, version 4.04.2
- : int = 0
On s'intéresse à deux algorithmes de tris. Pour plus de détails, voir les pages Wikipédia (ou le [Cormen] par exemple) :
On veut implémenter les deux et les comparer, sur plein d'entrées.
(** Un échange T[i] <-> T[j]. Utilise une valeur temporaire *)
let swap tab i j =
let tmp = tab.(i) in
tab.(i) <- tab.(j);
tab.(j) <- tmp
;;
val swap : 'a array -> int -> int -> unit = <fun>
Le tri à bulle a une complexité en $\mathcal{O}(n^2)$ dans le pire des cas et en moyenne. Il a l'avantage d'être en place.
let tri_bulle cmp tab =
let n = Array.length tab in
for i = n - 1 downto 1 do
for j = 0 to i - 1 do
if cmp tab.(j + 1) tab.(j) < 0 then
swap tab (j + 1) j;
done
done
;;
val tri_bulle : ('a -> 'a -> int) -> 'a array -> unit = <fun>
On utilise une fonction de comparaison générique. La fonction compare
(Pervasives.compare
) fonctionne pour tous les types par défaut.
Une version plus efficace existe aussi (voir ces explications).
let tri_bulle_opt cmp tab =
let n = Array.length tab in
let i = ref 0 in
let last_swap = ref (-1) in
while !i < n - 1 do
(* séquence d'échanges sur T[i..n]: *)
last_swap := n - 1;
for j = n-1 downto !i + 1 do
if cmp tab.(j) tab.(j-1) < 0 then begin
swap tab j (j-1);
last_swap := j - 1
end;
(* i avance "plus vite" :*)
i := !last_swap + 1;
done
done
;;
val tri_bulle_opt : ('a -> 'a -> int) -> 'a array -> unit = <fun>
(** Taille max des éléments dans les tableaux aléatoires *)
let maxint = int_of_float(1e3);;
val maxint : int = 1000
(** Créer un tableau aléatoire. En O(n). *)
let rand_array length =
Array.init length (fun _ -> Random.int maxint)
;;
val rand_array : int -> int array = <fun>
(** Vérifie que chaque élément du tableau n'y est qu'une seule fois (test l'égalité <> et pas !==).
Mal codé, en O(n^2). *)
let isInjArray tab =
try begin
Array.iteri (fun i x ->
(Array.iteri (fun j y ->
assert( (x<>y) || (i=j) )
) tab)
) tab;
true
end
with _ -> false
;;
val isInjArray : 'a array -> bool = <fun>
(** En moyenne, est en O(n^2) si [maxint] est bien plus grand que [n]. *)
let rand_array_inj = function
| 0 -> [||]
| length ->
let tab = ref (rand_array length) in
while not(isInjArray (!tab)) do
tab := rand_array length;
done;
!tab
;;
val rand_array_inj : int -> int array = <fun>
Cette fonction prend un seul argument, la taille du tableau :
rand_array_inj 12;;
- : int array = [|344; 685; 182; 641; 439; 500; 104; 20; 921; 370; 217; 885|]
rand_array_inj 12;;
- : int array = [|949; 678; 615; 412; 401; 606; 428; 869; 289; 393; 14; 423|]
rand_array_inj 12;;
- : int array = [|723; 544; 96; 803; 500; 570; 649; 212; 755; 211; 357; 197|]
Fonction de test :
let print = Printf.printf;;
let testtri mysort cmp length nbrun () =
print "Test d'un tri, %i simulations avec des tableaux de longueur %i.\n " nbrun length;
for i = 0 to nbrun - 1 do
let t1 = rand_array length in
let t2 = Array.copy t1 in
mysort cmp t1;
Array.fast_sort cmp t2;
try assert( t1 = t2 ) with _ -> begin
print "Avec des tableaux de taille %i, le test numéro %i a échoué." length i;
Format.printf "@[t1=[|"; Array.iter (fun i -> Format.printf " %i;" i) t1; Format.printf "|]@]@ ";
Format.printf "@[t2=[|"; Array.iter (fun i -> Format.printf " %i;" i) t2; Format.printf "|]@]@ ";
end;
done;
flush_all ();
;;
val print : ('a, out_channel, unit) format -> 'a = <fun>
val testtri : ((int -> int -> int) -> int array -> 'a) -> (int -> int -> int) -> int -> int -> unit -> unit = <fun>
La fonction de tri par défaut marche bien, évidemment.
testtri Array.sort compare 10 10 ();;
- : unit = ()
Test d'un tri, 10 simulations avec des tableaux de longueur 10.
testtri tri_bulle compare 10 10 ();;
- : unit = ()
Test d'un tri, 10 simulations avec des tableaux de longueur 10.
testtri tri_bulle_opt compare 10 10 ();;
Test d'un tri, 10 simulations avec des tableaux de longueur 10.
- : unit = ()
Ça marche !
testtri tri_bulle compare 100 1000 ();;
Test d'un tri, 1000 simulations avec des tableaux de longueur 100.
- : unit = ()
Il est très semblable au tri à bulle, sauf que le tableau sera parcouru alternativement dans les deux sens.
Le tri cocktail a une complexité en $\mathcal{O}(n^2)$ dans le pire des cas et en moyenne. Il a l'avantage d'être en place.
let tri_cocktail cmp tab =
let n = Array.length tab in
let echange = ref true in
while !echange do
echange := false;
(* Parcours croissant *)
for j = 0 to n - 2 do
if cmp tab.(j + 1) tab.(j) < 0 then begin
swap tab (j + 1) j;
echange := true
end;
done;
(* Parcours decroissant *)
for j = n - 2 downto 0 do
if cmp tab.(j + 1) tab.(j) < 0 then begin
swap tab (j + 1) j;
echange := true
end;
done;
done;
;;
val tri_cocktail : ('a -> 'a -> int) -> 'a array -> unit = <fun>
Il existe aussi une version plus efficace, qui diminue la taille des parcours au fur et à mesure.
let tri_cocktail_opt cmp tab =
let n = Array.length tab in
let echange = ref true in
let debut = ref 0 and fin = ref (n - 2) in
while !echange do
echange := false;
(* Parcours croissant *)
for j = !debut to !fin do
if cmp tab.(j + 1) tab.(j) < 0 then begin
swap tab (j + 1) j;
echange := true
end;
done;
fin := !fin - 1;
(* Parcours decroissant *)
for j = !fin downto !debut do
if cmp tab.(j + 1) tab.(j) < 0 then begin
swap tab (j + 1) j;
echange := true
end;
done;
debut := !debut + 1;
done;
;;
val tri_cocktail_opt : ('a -> 'a -> int) -> 'a array -> unit = <fun>
testtri tri_cocktail compare 10 10 ();;
Test d'un tri, 10 simulations avec des tableaux de longueur 10.
- : unit = ()
testtri tri_cocktail_opt compare 10 10 ();;
Test d'un tri, 10 simulations avec des tableaux de longueur 10.
- : unit = ()
Ça marche !
testtri tri_cocktail compare 100 1000 ();;
Test d'un tri, 1000 simulations avec des tableaux de longueur 100.
- : unit = ()
Avec ce morceau de code on peut facilement mesurer le temps d'exécution :
let time f =
let t = Sys.time() in
let res = f () in
Printf.printf " Temps en secondes: %fs\n" (Sys.time() -. t);
flush_all ();
res
;;
val time : (unit -> 'a) -> 'a = <fun>
time (testtri Array.sort compare 100 10000);;
Test d'un tri, 10000 simulations avec des tableaux de longueur 100. Temps en secondes: 2.612000s
- : unit = ()
time (testtri tri_bulle compare 100 10000);;
Test d'un tri, 10000 simulations avec des tableaux de longueur 100. Temps en secondes: 2.976000s
- : unit = ()
time (testtri tri_bulle_opt compare 100 10000);;
Test d'un tri, 10000 simulations avec des tableaux de longueur 100. Temps en secondes: 3.144000s
- : unit = ()
time (testtri tri_cocktail compare 100 10000);;
Test d'un tri, 10000 simulations avec des tableaux de longueur 100. Temps en secondes: 3.380000s
- : unit = ()
time (testtri tri_cocktail_opt compare 100 10000);;
Test d'un tri, 10000 simulations avec des tableaux de longueur 100. Temps en secondes: 2.724000s
- : unit = ()
Sur de petits tableaux, les versions "optimisées" ne sont pas plus forcément plus rapides (comme toujours).
On vérifie quand même que sur des tableaux aléatoires, le tri cocktail optimisé semble le plus rapide des quatre implémentations.
Ca suffit à voir que les quatre algorithmes implémentés ici ne sont pas en temps sous quadratique.
time (testtri Array.sort compare 1000 1000);;
Test d'un tri, 1000 simulations avec des tableaux de longueur 1000. Temps en secondes: 3.072000s
- : unit = ()
time (testtri tri_bulle compare 1000 1000);;
Test d'un tri, 1000 simulations avec des tableaux de longueur 1000. Temps en secondes: 26.116000s
- : unit = ()
time (testtri tri_bulle_opt compare 1000 1000);;
Test d'un tri, 1000 simulations avec des tableaux de longueur 1000. Temps en secondes: 29.944000s
- : unit = ()
time (testtri tri_cocktail compare 1000 1000);;
Test d'un tri, 1000 simulations avec des tableaux de longueur 1000. Temps en secondes: 27.296000s
- : unit = ()
time (testtri tri_cocktail_opt compare 1000 1000);;
Test d'un tri, 1000 simulations avec des tableaux de longueur 1000. Temps en secondes: 22.584000s
- : unit = ()
Les deux algorithmes ne sont pas trop difficiles à implémenter, et fonctionnent de façon très similaire.
Allez voir d'autres notebooks !