Romanica Olomucensia 2023, 35(1):157-172 | DOI: 10.5507/ro.2023.011

La traducción e interpretación de nombres de organizaciones en el eurolecto inglés y español: un estudio basado en corpus

Fernando Sánchez Rodas
Universidad de Málaga, Spain

Las entidades nombradas multipalabra (ENMP) constituyen importantes nodos de información lingüística que, en numerosas ocasiones, ofrecen claves fundamentales para la comprensión de los textos en los que aparecen. Sin embargo, los estudios dedicados en exclusiva a este tipo de unidades son de muy reciente cuño y provienen en su gran mayoría de un único campo de estudio, el Procesamiento del Lenguaje Natural (PLN). El siguiente trabajo tiene como objetivo realizar un análisis contrastivo de una serie de nombres de organizaciones multipalabra (ORGMP) extraídos de dos corpus comparables inglés-español (uno escrito y otro oral) de material del Parlamento Europeo. Se sigue para ello una metodología de corte construccionista. Primero, empleamos técnicas de reconocimiento automático de entidades nombradas y recuperación manual para extraer los nombres propios, y evaluamos el rendimiento de ambas tareas mediante métricas. Después, se anotan cuatro parámetros para cada entrada. El análisis desvela que, a este nivel onomástico, el eurolecto inglés no traducido contiene en realidad un número significativo de traducciones (17,3 %) y el inglés no interpretado cuenta con un porcentaje aún mayor de interpretaciones (24,3 %). En el eurolecto español traducido (80,5 %) e interpretado (98,1 %) dominan las traducciones, interpretaciones, préstamos y fusiones de ORGMP, aunque estos esquemas mediadores también conviven con construcciones del onomasticón nativo. Los resultados de este estudio manifiestan el potencial desapercibido de los nombres propios como puerta de acceso al entendimiento de que la traducción e interpretación no son categorías absolutas, sino que cada género textual (no) traducido o (no) interpretado se rige por una gramática construccional distinta que reparte cantidades dispares de construcciones mediadoras y no mediadoras en función de parámetros como el idioma, las normas y eventos que rodean la producción textual.

Palabras clave: entidad nombrada; Parlamento Europeo; traducción; interpretación; esquemas mediadores

Translation and interpreting of organisation names in the English and Spanish Eurolect: a corpus-based study

Multi-word named entities (MWNEs) are crucial bearers of information and often provide answers to major questions concerning the understanding of texts; however, work focusing exclusively on MWNEs is of very recent origin and comes mostly from a single field of study, Natural Language Processing (NLP). This paper aims to perform a contrastive analysis of a set of English and Spanish multi-word organisation names(MWORGs) extracted from two bilingual comparable corpora (written and oral) created from texts and speeches of the European Parliament. The methodology will follow a data-driven Constructionist approach. First, Named Entity Recognition (NER) and manual recall are employed to retrieve the MWORGs, and their performance is evaluated through metrics. Then, four items of metadata are annotated for each entity. The analysis unveils that, at this onomastic level, the non-translated English Eurolect in fact contains a considerable number of translations (17.3%), while non-interpreted English has an even higher percentage of interpretations (24.3%). In the translated and interpreted Spanish Eurolect, mediating schemes (translations, interpretations, borrowings, and blending) are predictably dominant (80.5% and 98.1% respectively), although they also coexist with native onomastic constructions. The results of the study boost the commonly disregarded potential of proper names as a key tool for understanding translation and interpreting as relative categories in which each (non-)translated and (non-)interpreted textual genre is ruled by its own set of constructional rules, establishing different quantities of mediating and non-mediating constructions depending on factors such as the language, the norms, and the events which condition textual production.

Keywords: named entity; European Parliament; translation; interpreting; mediating schemes

Published: July 26, 2023  Show citation

ACS AIP APA ASA Harvard Chicago Chicago Notes IEEE ISO690 MLA NLM Turabian Vancouver
Sánchez Rodas F. Translation and interpreting of organisation names in the English and Spanish Eurolect: a corpus-based study. Romanica Olomucensia. 2023;35(1):157-172. doi: 10.5507/ro.2023.011.
Download citation

References

  1. Baldwin, Timothy - Nam Kim, Su (2010) «Multiword Expressions», en Indurkhya, N. - Damerau, F. J. (eds.), Handbook of Natural Language Processing (Second Edition), Boca Raton: CRC Press, 267-292.
  2. Corpas Pastor, Gloria (2021) «Technology Solutions for Interpreters: The VIP System», Hermēneus. Revista de Traducción e Interpretación 23, 91-123. Go to original source...
  3. Corpas Pastor, Gloria - Sánchez Rodas, Fernando (2022), «NLP-Enhanced Shift Analysis of Named Entities in an EnglishSpanish Intermodal Corpus of European Petitions», en Kajzer-Wietrzny, M. - Bernardini, S. - Ferraresi, A. - Ivaska, I. (eds.), Empirical Investigations into the Forms of Mediated Discourse at the European Parliament, Berlín: Language Science Press, 219-251.
  4. Corpas Pastor, Gloria - Sánchez Rodas, Fernando (en prensa), «EU Phraseological Verbal Patterns in the PETIMOD 2.0 Corpus: A NER-Enhanced Approach», en Biel, L. - Kockaert, H. (eds.), Handbook of Legal Terminology, Ámsterdam: John Benjamins.
  5. Corpas Pastor, Gloria - Monti, Johanna - Seretan, Violeta - Mitkov, Ruslan (eds.) (2016), Workshop Proceedings: Multi-Word Units in Machine Translation and Translation Technologies MUMTTT2015, Ginebra: Tradulex.
  6. Fauconnier, Gilles, - Turner, Mark (2002), The Way We Think: Conceptual Blending and the Mind's Hidden Complexities, Nueva York: Basic Books.
  7. Goffin, Roger (1994), «L ' Eurolecte : Oui, Jargon Communautaire : Non», Meta 39 (4), 636-642. Go to original source...
  8. Hatami, Ali - Mitkov, Ruslan - Corpas Pastor, Gloria (2021), «Cross-Lingual Named Entity Recognition via FastAlign: A Case Study», en Proceedings of the Translation and Interpreting Technology Online Conference, Shoumen: INCOMA Ltd, 85-92. Go to original source...
  9. Jackendoff, Ray (1997), The Architecture of the Language Faculty, Cambridge: MIT Press.
  10. Knappová, Miroslava (2017), «Chrématoymum», en Nový Encyklopedický Slovník Èe¹tiny Online [disponible en , 06/11/2022].
  11. Lieber, Rochelle - ©tekauer, Pavol (eds.) (2009), The Oxford Handbook of Compounding, Oxford: Oxford University Press.
  12. Mitkov, Ruslan - Monti, Johanna - Corpas Pastor, Gloria - Seretan, Violeta (eds.) (2018), Multiword Units in Machine Translation and Translation Technology, Ámsterdam/Filadelfia: John Benjamins. Go to original source...
  13. Ortega Arjonilla, Emilio - Martínez López, Ana Belén - Delgado Pugés, Iván (eds.) (2018), La traducción e interpretación jurídicas en la Unión Europea: Retos para la Europa de los ciudadanos, Granada: Comares.
  14. Sag, Ivan A. - Baldwin, Timothy - Bond, Francis - Copestake, Ann - Flickinger, Dan (2002), «Multiword Expressions: A Pain in the Neck for NLP», en Proceedings of the Third International Conference on Intelligent Text Processing and Computational Linguistics (CICLing-2002), Ciudad de México, 1-15. Go to original source...
  15. Sánchez Rodas, Fernando (2022a), «A Corpus-Based Analysis of Mediation in EU Multi-Word Organization Names», en Corpas Pastor, G. - Mitkov, R. - Kunilovskaya, M. - Caro Quintana, R. (eds.), Proceedings of the International Conference EUROPHRAS 2022, Shoumen: INCOMA Ltd., 160-69. Go to original source...
  16. Sánchez Rodas, Fernando (2022b), «Introducing the PETIMOD Corpus: A Resource for the Analysis of Personification in Mediated and Non-Mediated Discourse», en Esteves-Ferreira, J. - Mitkov, R. - Recort Ruiz, M. - Stefanov, O. (eds.), Proceedings of 43rd Conference Translating and the Computer (TC43), Ginebra: Tradulex, 128-132.
  17. Spossito, Osvaldo Mario - Ryckeboer, Hugo Emilio - Ledesma, Viviana - Procopio, Gastón et al. (2021), «Propuesta Para La Construcción de Un Corpus Jurídico Utilizando Expresiones Regulares», en XXVII Congreso Argentino de Ciencias de La Computación (CACIC) (Modalidad Virtual, 4 Al 8 de Octubre de 2021), 746-755.
  18. Stecconi, Ubaldo (2009), «Semiotics», en Baker, M. - Saldanha, G. (eds.), Routledge Encyclopedia of Translation Studies, Londres/Nueva York: Routledge, 260-263.
  19. Steinberger, Ralf - Pouliquen, Bruno - Kabadjov, Mijail - Belyaeva, Jenya -Van Der Goot, Erik (2011), «JRC-NAMES: A Freely Available, Highly Multilingual Named Entity Resource», en International Conference Recent Advances in Natural Language Processing, RANLP, 104-110.
  20. Viimaranta, Johanna - Mustajoki, Arto (2020), «What Can Science, Religion, Politics, Culture and the Economy Do? A Corpus Study of Metonymical Conceptualization Combined with Personification», Scando-Slavica 66 (1), 71-85. Go to original source...
  21. Zgusta, Ladislav (1998), «The Terminology of Name Studies (In Margine of Adrian Room's Guide to the Language of Name Studies)», Names: A Journal of Onomastics 46 (3), 189-203. https://doi.org/10.1179/nam.1998.46.3.189. Go to original source...

This is an open access article distributed under the terms of the Creative Commons Attribution-ShareAlike 4.0 International License (CC BY-SA 4.0), which permits use, distribution, and reproduction in any medium, provided the original publication is properly cited. No use, distribution or reproduction is permitted which does not comply with these terms.