Une imprimante sert à sortir sur papier un document numérique, un scanner fait tout à fait l’inverse. À partir d’un objet matériel (généralement une feuille de papier), il permet d’obtenir un document numérique. Je vous propose d’aborder le scanner de la même façon que l’imprimante, en commençant par le principe de fonctionnement, avant de passer aux caractéristiques importantes.
Principe du scanner
Les scanners les plus courants sont les scanners « à plat », accueillant le document à numériser sous leur capot :

Mais ce type de scanner n’est pas le seul existant. On trouve également des douchettes (lecteurs de codes barres) ou des scanners à défilement :

Les douchettes sont plutôt utilisées en milieu professionnel. Les scanners à défilement sont plus compact, ce qui peut s’avérer un atout précieux sur un petit bureau, mais ils ont le gros inconvénient de ne pas pouvoir scanner autre chose qu’une feuille. Impossible de numériser une carte d’identité ou un livre par exemple (certains ont essayé, ils ont eu des problèmes…).

Quel que soit le type de scanner, le principe est à peu près similaire. L’idée est de parcourir tout le document afin d’en faire une « photo » numérique. Pour ce faire, une puissante source lumineuse éclaire le document et un capteur récupère les rayons réfléchis. Selon la longueur d’onde du rayon, le scanner est alors capable de déduire la couleur en un point particulier du document.
Ce procédé est répété sur l’ensemble du document à numériser, de différentes façons selon le type de scanner :
- avec un scanner à plat, la source lumineuse fait un passage sur tout le document ;
- avec un scanner à défilement, c’est le document qui se déplace ;
- enfin avec une douchette, le déplacement est manuel.
Caractéristiques
Résolution et interpolation
Passons à présent aux critères de choix d’un scanner. Le plus important d’entre eux est, là encore, la résolution. Elle définit le nombre de pixels par unité de surface des images produites par le scanner. Elle doit donc naturellement être la plus élevée possible. Une résolution de 2400 ppp est un minimum, mais elle peut monter jusqu’à 9600 ppp.
Mais il y a mieux. La résolution dont je parle ci-dessus est la résolution « optique » du scanner, c’est-à-dire la résolution d’image que peuvent produire les capteurs du scanner. Les scanners sont dotés d’un logiciel interne capable d’interpoler la résolution des images obtenues, afin de l’augmenter artificiellement. Concrètement, le scanner peut par exemple produire une image de résolution 2400 ppp puis la transformer en une image de résolution 4800 ppp.
Exactement ! Le scanner invente les nouveaux pixels ! Il le fait en se basant sur les pixels déjà présents. Prenons un exemple avec une image de résolutions horizontale et verticale de 2 ppp (oui, c’est peu, mais c’est pour l’exemple ). 2 ppp de résolution horizontale, cela signifie qu’horizontalement, sur une longueur d’un pouce, il y a de la place pour 2 pixels. Idem verticalement. Ainsi, en prenant un petit carré d’un pouce de côté au sein de notre image, celui-ci sera constitué de quatre pixels :

L’image ci-dessus a été créée par le scanner à partir d’un document numérisé. Mais le nombre trop faible de pixels ne permet pas de représenter convenablement la réalité.
L’interpolation à laquelle procède le scanner a pour but d’augmenter la résolution. Dans notre exemple, soyons fous, nous allons la doubler ! Il y aura donc maintenant quatre pixels horizontalement et verticalement (et non plus deux), soit seize pixels en tout. Mais alors quelle va-t-être la couleur des nouveaux pixels ainsi créés ?

Toute la difficulté réside dans la détermination des couleurs des nouveaux pixels. Le scanner les calcule en se basant sur les couleurs des pixels déjà présents. Il existe de nombreuses méthodes aux algorithmes parfois très poussés. Mais une possibilité serait de faire une sorte de « moyenne » des couleurs des pixels alentours. Par exemple, si le pixel à « colorer » se trouve entre un pixel blanc et un pixel vert, alors la couleur résultante du nouveau pixel sera un vert clair . Dans notre cas, les nouveaux pixels seront un savant mélange de rouge, vert, bleu et jaune, selon leur position :

L’image ainsi produite par le scanner a donc une meilleure résolution que ce que permet en théorie le matériel. Elle semble ainsi moins « pixelisée » que si aucune interpolation n’avait été faite et représente donc mieux la réalité.
Cette technique a toutefois ses limites, car si l’on pousse un peu trop l’interpolation, les pixels déduits n’auront plus grand rapport avec la réalité. De plus, le poids de l’image (en Mo) augmente avec sa résolution : plus il y a de pixels, plus il y a d’informations, plus l’image est lourde.
Profondeur de couleur
On l’a vu, une image numérique produite par le scanner est un ensemble de pixels. Une image est donc une liste de pixels, pour chacun desquels on connaît les deux informations suivantes :
- la position du pixel au sein de l’image ;
- la couleur du pixel.
Vous le savez, en informatique on utilise des « 0 » et des « 1 », les bits, pour stocker les informations. La couleur d’un pixel ne fait pas exception et est également codée sous forme de bits. On appelle profondeur de couleur le nombre de bits utilisés pour définir la couleur que peut prendre un pixel.
Si la profondeur de couleur est de 1, alors les couleurs sont codées sur un seul bit : 0 ou 1. En général, dans ces cas-là, 0 correspond au noir et 1 correspond au blanc. Une image de profondeur 1 est donc une image en noir et blanc.
Avec une profondeur de 2, les couleurs peuvent maintenant être codées sur deux bits chacune. On a ainsi :
- 00 : le noir ;
- 01 : le gris foncé ;
- 10 : le gris clair ;
- 11 : le blanc.
Avec une profondeur de 2, il y a donc 4 couleurs différentes possibles. La relation entre la profondeur p et le nombre de couleurs n est donnée par la simple formule suivante :
La profondeur de couleur définit donc indirectement le nombre de couleurs différentes que peut gérer le scanner.
Les scanners actuels gèrent des profondeurs de couleurs de 24, 36 ou 48 bits. Je vous laisse faire les calculs… Cela étant, quand on sait que l’œil humain est capable de discerner environ 2 millions de couleurs « seulement », on peut se poser la question du réel intérêt de disposer de couleurs.
Reconnaissance de caractère
La ROC (ou OCR en anglais) consiste à produire un document informatisé à partir d’un document imprimé. Vous passez ainsi d’un format physique (une feuille de papier) à un format numérique (un fichier .txt), que vous pourrez alors utiliser dans votre logiciel de traitement de texte préféré. Cela peut s’avérer par exemple très utile pour récupérer un document dont vous avez perdu toutes les sauvegardes numériques et dont il ne vous reste plus qu’une version papier.
Tout le processus de reconnaissance des caractères se fait au niveau software, grâce à un logiciel dédié. Cela ne concerne donc pas directement les caractéristiques techniques du scanner. Néanmoins, certains scanners sont vendus avec un logiciel de ROC, ce qui en fait un point à prendre en compte à l’heure du choix.
Il est bien sûr possible d’acheter un tel logiciel à part, mais si votre besoin est précisément la numérisation des textes, il peut être intéressant (financièrement parlant) de faire un tir groupé. Notons cependant qu’il existe des logiciels libres (et gratuits) facilement accessibles sur Internet.
Comme pour les imprimantes…
Les critères de format, de vitesse et de connectique sont tout à fait similaires à ce dont nous avons déjà parlé du côté des imprimantes. Le format de scanner le plus répandu est le format A4, soit 21 sur 29,7 centimètres. Les scanners de plus grand format sont destinés à un usage professionnel.
De la même façon que pour la vitesse d’impression d’une imprimante, la vitesse d’acquisition d’un scanner se mesure en ppm. Elle dépend généralement de la résolution du scanner : plus celle-ci est élevée, plus le scanner mettra de temps à numériser une page. Cette caractéristique n’est cependant valable que pour les scanners à défilement.
Pour ce qui est de la connectique, l’USB, le Bluetooth et le Wi-Fi seront là encore les interfaces les plus courantes avec l’ordinateur. Enfin, certains rares (et chers) scanners peuvent être branchés en réseau.
Scanner :
Un bon scanner se démarque d’abord par une résolution élevée et une profondeur de couleur acceptable. Prenez garde en lisant les caractéristiques d’un scanner, à distinguer la résolution native de la résolution interpolée. La première est la résolution dont est véritablement capable le matériel. La seconde est déduite artificiellement. Il faut ensuite faire attention à la vitesse d’acquisition et à la connectique (avec ou sans fil, réseau ou non).