Depuis plus de dix ans, Google s’est lancé dans un vaste chantier : numériser et indexer tous les livres, pour alimenter la base de donnée de Google Livres, son moteur de recherché spécialisé dans les livres. Une initiative qui lui avait attiré les foudres d’un grand syndicat d’auteurs américain.
En effet, bien que Google Livres ne permette pas de consulter des livres en entier, mais seulement des extraits correspondant à la recherche effectuée, les auteurs estimaient que Google n’avait pas le droit de réaliser cette indexation sans verser de droits aux auteurs concernés.
Après une très longue procédure judiciaire, Google a finalement obtenu la reconnaissance de son droit de numériser les livres pour en diffuser de cours extrait. La justice américaine a en effet considéré que cette pratique tombe dans le cadre du « Fair Use », une exception au copyright autorisant certaines entorses aux droits d’auteur pour des pratiques « raisonnables » et ne portant pas atteinte aux intérêts de l’auteur. Une décision justifiée par le fait que la simple diffusion d’extrait ne fait pas de concurrence aux livres complets (et on pourrait même aller plus loin : Google Livres propose dans ses pages de résultats des liens permettant d’acheter les livres trouvés…), mais aussi et surtout par le fait que cette numérisation va dans le sens de l’intérêt général, en rendant la connaissance plus accessible au grand public.
Les scanners de livres de Google vont donc pouvoir reprendre du service à plein régime, tout comme les millions de bénévoles qui aident chaque jour et souvent sans le savoir les OCR de Google à déchiffrer ces contenus numérisés via le service reCAPTCHA, qui ces derniers temps avait un peu délaissé les livres numérisés pour se concentrer sur la lecture des numéros de bâtiments sur les photos de Street View.