La palabra "guerra" fue más usada que "Dios" en el siglo XX

Google Books "rastrea" libros desde 1500.

COLABORACION. Google y Harvard crearon un software conjunto. DAVIDVIELBA.WORDPRESS.COM COLABORACION. Google y Harvard crearon un software conjunto. DAVIDVIELBA.WORDPRESS.COM
28 Diciembre 2010
La biblioteca más grande del mundo está en construcción y se llama Google Books. Por ahora sólo tiene 15 millones de libros en formato digital pero ya ha lanzado una herramienta de búsqueda que promete revolucionar los estudios culturales en el futuro próximo. Se trata de una aplicación que permite calcular la frecuencia de palabras y frases en más de 5 millones de libros publicados entre el año 1500 y el 2008.

La colaboración entre Google Books y la universidad de Harvard resultó en la creación de un software que calcula las veces que se repiten las palabras en los libros escaneados. El Books Ngram Viewer calcula la frecuencia dividiendo las veces que aparece una palabra por el total de palabras escritas ese año. Esta herramienta es como el contador de palabras de un documento de texto digital y se aplica a cerca del cuatro por ciento de los libros del mundo, unas 500 mil millones de palabras en inglés, español, francés, ruso, chino y alemán.

En alza y en baja
Algunas curiosidades resultan de usar la aplicación. Si uno tipea "Tucumán" el resultado es un gráfico que muestra cómo desde 1880 el nombre de la provincia ha pasado con creciente asiduidad por la imprenta. El pico mayor se da alrededor de 1940 y desde entonces la frecuencia del nombre de la provincia no ha dejado de caer.

En todos los idiomas, "hombre" se repite muchas más veces que "mujer"; sin embargo desde la década del 60 la brecha es cada vez más chica. En inglés británico y en francés la diferencia es mayor que en español y alemán. Sólo en el inglés americano, "mujer" superó a "hombre" en 1980, pero ya lo había igualado en 1740. A la hora de usar el plural, "mujeres" se disparó en la década del 70, relegando significativamente a sus compañeros.

"Dios" parece ser el nombre más importante pero si los datos del Ngram Viewer dicen algo es que su popularidad cotiza en baja desde 1820. Una de las pocas palabras capaz de hacerle sombra en las estadísticas es "guerra", más popular que "Dios" en la mayor parte del siglo XX. Sólo en la década del 20 se escribió más veces la palabra "amor" que "muerte". La última vez que "trabajo" estuvo cerca de "dinero" fue en 1810. Desde entonces están cada vez más separados.

El lanzamiento vino acompañado con un estudio publicado en la revista Science. Se calcula que la mitad de las palabras son "materia negra": palabras sin reconocimiento oficial o nombres propios. Unas 8.500 palabras se agregan cada año sólo al inglés.

Esta novedad permitirá realizar estudios culturales y detectar cambios en el lenguaje y las formas de pensar durante determinados períodos de tiempo. Restan perfeccionar algunos aspectos del software como diferenciar los múltiples sentidos de las palabras: No es lo mimo referirse a Dios en un estudio religioso que escribir en un dialogo de ficción "¡Dios santo y la virgen!" La idea es escanear todos los libros del mundo, y que estos pasen por la nueva herramienta, y así más certeros serán los patrones que se descubran. La aplicación está disponible en http://ngrams.googlelabs.com.

Tamaño texto
Comentarios
Comentarios