Romanica Olomucensia 2011, 23(2):137-146 | DOI: 10.5507/ro.2011.018

Aplicación de las Leyes de Zipf en los textos españoles

Daniel Petrík

Las Leyes de Zipf son reglas que describen la distribución de palabras en el texto mediante su frecuencia, el número de significados diferentes u otras características. Su autor, profesor de Harvard George Kingsley Zipf (1902-1950), al estudiar las lenguas naturales menciona el llamado Principio del mínimo esfuerzo, o sea que el lenguaje se centra en la economía y en la claridad. El principio tiene cierto impacto en cómo el hablante elige inconscientemente los términos mediante los cuales expresa sus ideas (por ejemplo, las palabras mayormente utilizadas suelen ser las más cortas y con significados múltiples, etc.). Las Leyes de Zipf están en vigor en cualquier lenguaje natural, e incluso en otros sistemas naturales; sin embargo, hay que tener en cuenta algunas carecterísticas individuales de cada lengua. En los textos españoles, por ejemplo, es necesario hacer frente a una mayor frecuencia de determinantes y preposiciones. Estas y otras peculiaridades de su aplicación trataremos en este artículo.

Palabras clave: lexema; palabra; distribución de palabras; significado; agrupaciones de palabras.

Zipf's Laws are rules that describe the distribution of words in the text by their frequency, the number of different meanings and other features. Its author, Harvard professor George Kingsley Zipf (1902-1950), while studying natural languages mentioned the so-called Principle of least effort, which means that the language is focused on the economy and clarity. The principle has an impact on how the speaker unconsciously choose the terms by which he expresses his ideas (for example, the mostly used words are usually the shortest and with multiple meanings, etc.). Zipf's Laws are valid in any natural language and even in other natural systems; however, we must take into account the individual features of each language. In Spanish texts, for example, is necessary to deal with a higher frequency of determinants and prepositions. These and other peculiarities of its implementation are discussed in this paper.

Keywords: lexeme; word; distribution of words; meaning; clusters of words.

Published: December 1, 2011  Show citation

ACS AIP APA ASA Harvard Chicago Chicago Notes IEEE ISO690 MLA NLM Turabian Vancouver
Petrík D. Aplicación de las Leyes de Zipf en los textos españoles. Romanica Olomucensia. 2011;23(2):137-146. doi: 10.5507/ro.2011.018.
Download citation

References

  1. Abney, Steve (1996), "Statistical methods and linguistics", in: Klavans, J. - Resnik, P. (editors), The Balancing Act: Combining Symbolic and Statistical Approaches to Language, The MIT Press.
  2. Calderón, F. - Curilef, S. - Ladrón De Guevara, M. L. (2009), "Probability distribution in a quantitative linguistic problem", Brazilian Journal of Physics, vol. 39, no. 2, São Paulo. Departamento de Física, Universidad Católica del Norte, Antofagasta, Chile. [online] [cit. 2011-01-20]. Disponible en: http://www.scielo.br/scielo.php?script=sci_arttextπd=S0103-97332009000400028 Go to original source...
  3. Petrík, Daniel (2010), Sémanticko-stylistická perspektiva při volbě lexikálních prostředků ve ąpanělątině, Diplomová práce ÚRS FF UK.
  4. Roberts, Carl (1989), "Other Than Counting Words: A Linguistic Approach to Content Analysis", Social Forces, Vol. 68, No. 1, s. 147-177. Go to original source...
  5. Zipf, George Kingsley (1949), Human behavior and the Principle of least effort, Addison-Wesley Press.
  6. Zipf, George Kingsley (1932), Selected Studies of the Principle of Relative Frequency in Language, Harward University Press.
  7. Zipf, George Kingsley (1941), "Semantic Frequency List", American Speech, Vol. 16, No. 1, s. 43-45. Go to original source...
  8. Zipf, George Kingsley (1937). "Statistical Methods and Dynamic Philology", Language, Vol. 13, No. 1, s. 60-70. Go to original source...
  9. Zipf, George Kingsley (1965), The Psycho-Biology of Language, The MIT Press.