Ngrams : Google nous offre un outil de poids

Home  /  A la une  /  Current Page

C’est en 2004 que le géant Google a commencé à numériser les ouvrages du monde entier afin de créer Google Books.
Cette grande bibliothèque en ligne constituée de plus de 15 millions de livres (chiffre de 2010) permet au géant des moteurs de recherche de monétiser l’accès à ces ouvrages et de les proposer à la consultation à travers le globe.
Beaucoup de procès ont eu lieu concernant la mainmise de Google sur ces oeuvres, notamment sur les livres encore soumis aux droits d’auteurs. Mais depuis, de nombreux arrangements ont été conclus pour apaiser les esprits.
Mais voilà que la firme de Larry Page met en place un nouveau service dérivé de Google Books : Ngrams.

Ngrams est un outil statistique. Il permet de rechercher, sur une période donnée, le nombre d’occurrences d’un mot dans un ensemble de livres numérisés.
Une base de données à l’échelle de la littérature sur environ 5,2 millions d’ouvrages dans les principales langues parlées sur la surface de la planète. Soit, selon Google, 4% des livres publiés dans le monde.
Bien sûr, tout a une limite. Pour des raisons de rareté des ouvrages, la recherche n’est pertinente que sur une période de 200 ans, entre 1800 et les années 2000.
Mais nous avons là un formidable outil, inédit dans l’histoire de l’humanité (et je pèse mes mots).

 


On peut remarquer qu’en France, le mot « geek » est réellement apparu en 1969 et n’a cessé de se répandre depuis cette année.

Il faut noter que Google a mis à disposition les données brutes sous licence Créative Common (droit de partager et de modifier, à condition de citer les auteurs).

Il reste néanmoins regrettable qu’un si formidable outil soit imputable à une entreprise privée.
Les moyens de Google sont colossaux, bien entendu, mais les moyens des nations ne sont ils pas plus conséquents ? Les gouvernements n’ont-ils pas l’obligation de mettre à disposition et de conserver le patrimoine national ?
La firme de Larry page aurait-elle pour ambition d’indexer le monde ?

 

je sers l’Agence et c’est ma joie.

Merci à dissensus pour la relecture/correction.


Post Tags: , ,



Leave a Reply