Romanica Olomucensia 2023, 35(1):55-70 | DOI: 10.5507/ro.2023.005

Cómo dominar la fraseología y automatizar el proceso de documentación: una solución tecnológica para la formación de intérpretes en la combinación español<>árabe

Mahmoud Gaber
Universidad de Málaga, Spain

Las tecnologías de la interpretación se están extendiendo cada vez más gracias a los avances en la inteligencia artificial, los cambios en los entornos de trabajo ocasionados por la pandemia del COVID-19, los intereses comerciales, etc. No obstante, se nota cierta escasez, en términos de cantidad y de calidad, en las tecnologías disponibles para el uso de los intérpretes profesionales. Dicha escasez se acentúa aún más en el ámbito de la formación de intérpretes, sobre todo en lenguas de pocos recursos como el caso del árabe. Con ánimo de cubrir las lagunas existentes en la formación de intérpretes, este estudio tiene el doble objetivo de: i) establecer una metodología basada en soluciones tecnológicas para la documentación y el dominio de la fraseología a partir de corpus comparables (oral y textual), y ii) presentar un análisis contrastivo de patrones colocacionales entre el árabe y el español. Para lograr nuestros objetivos, se establecerá el protocolo de diseño y compilación del corpus comparable que nos servirá para la documentación y la extracción de las unidades fraseológicas y terminológicas y la adquisición del conocimiento temático. El método de explotación del corpus para la documentación y la extracción de la fraseología de cara a una tarea de interpretación se ilustra detalladamente en el presente estudio. Los resultados del estudio revelan varias ventajas que aporta nuestra metodología para el interprete en formación durante la fase de documentación y preparación sobre un ámbito especializado (ciberseguridad). Además, el estudio ilustra el porcentaje de frecuencia de colocaciones en el subcorpus de árabe y de español para el ámbito que hemos seleccionado.

Palabras clave: compilación semi-automática de corpus; extracción de fraseología; tecnologías de la interpretación; reconocimiento automático del habla; interpretación de conferencias

How to master phraseology and automate the documentation process: a technological solution for interpreter training in the Spanish<>Arabic combination

Interpreting technologies are becoming more and more widespread thanks to the advances in Artificial Intelligence, the changes in the work environment caused by the COVID-19 pandemic, commercial interests, etc. However, there is a certain scarcity, in terms of quantity and quality, of technologies available to professional interpreters. This scarcity is even more acute in the field of interpreting training, especially in under-resourced languages, as in the case of Arabic. This study aims to: i) fill the existing gaps in interpreting training by introducing a methodology based on technological solutions for the documentation and mastery of phraseology from comparable corpora (spoken and written text), and ii) introduce a contrastive analysis of phraseology between Arabic and Spanish. In order to achieve our objectives, the design protocol and compilation process of the comparable corpora shall be described in detail. The corpus exploitation method used to carry out the documentation and phraseology extraction previous to the interpretation task is also illustrated. The results of the study reveal several advantages of our methodology for the trainee interpreter during documentation and preparation on a specialised topic (cybersecurity). Moreover, the study illustrates the most frequent collocations in both Arabic and Spanish subcorpora for the topic we have selected.

Keywords: semi-automatic corpus compilation; phraseology extraction: interpreting technologies; automatic speech recognition; conference interpreting

Received: November 14, 2022; Revised: November 14, 2022; Accepted: May 15, 2023; Published: July 26, 2023  Show citation

ACS AIP APA ASA Harvard Chicago Chicago Notes IEEE ISO690 MLA NLM Turabian Vancouver
Gaber M. How to master phraseology and automate the documentation process: a technological solution for interpreter training in the Spanish<>Arabic combination. Romanica Olomucensia. 2023;35(1):55-70. doi: 10.5507/ro.2023.005.
Download citation

References

  1. Akinnaso, F. Niyi (1982), «On the differences between spoken and written language», Language and speech 25/2, 97-125. Go to original source...
  2. Arce Romeral, Lorena - Seghiri, Míriam (2018), «Booth-friendly term extraction methodology based on parallel corpora for training medical interpreters», Current Trends in Translation Teaching and Learning E 5, 1-46 [disponible en , 05/09/2022].
  3. Aston, Guy (2015), «Learning phraseology from speech corpora», Multiple affordances of language corpora for data-driven learning 69, 65-84. Go to original source...
  4. Bale, Richard (2013), «Undergraduate Consecutive Interpreting and Lexical Knowledge», The Interpreter and Translator Trainer 7/1, 27-50. Go to original source...
  5. Bendazzoli, Claudio - Sandrelli, Annalisa (2009), «Corpus-based Interpreting Studies: Early work and future prospects», Tradumàtica 7, 1-9 [disponible en , 18/09/2022].
  6. Cattaneo, Elena (2004), Idiomatic expressions in conference interpreting, Graduation thesis, SSLMIT, Università degli Studi di Bologna, Sede di Forlì.
  7. Consejo Europeo. Europa digital [25/10/2022].
  8. Corpas Pastor, Gloria (1996), Manual de fraseología española, Madrid: Gredos.
  9. Corpas Pastor, Gloria (2018), «Tools for Interpreters: the Challenges that Lie Ahead», Current Trends in Translation Teaching and Learning E 5, 157-182 [disponible en , 20/10/2022].
  10. Corpas Pastor, Gloria. (2021), «Technology Solutions for Interpreters: The VIP System», Hermēneus. Revista de Traducción e Interpretación 23, 91-123. Go to original source...
  11. Corpas Pastor, Gloria (2022), «Interpreting Tomorrow? How to Build a Computer-Assisted Glossary of Phraseological Units in (Almost) No Time», International Conference on Computational and Corpus-Based Phraseology, Londres: Springer, 62-77. Go to original source...
  12. Corpas Pastor, Gloria - Gaber, Mahmoud (2021), «Extracción de fraseología para intérpretes a partir de corpus comparables compilados mediante reconocimiento automático del habla», en Corpas Pastor, G - Bautista Zambrana, M. R. - Hidalgo Ternero, C. M. (eds.), Sistemas fraseológicos en contraste: enfoques computacionales y de corpus, Granada: Comares, 271-291.
  13. Crezee, Ineke - Grant, Lynn (2013), «Missing the plot? Idiomatic language in interpreter education», International Journal of Interpreter Education 5/1, 17-33 [disponible en , 13/09/2022].
  14. Fantinuoli, Claudio (2006), «Specialized Corpora from the Web for Simultaneous Interpreters», Wacky! Working papers on the Web as Corpus, Bolonia: GEDIT, 173-190.
  15. Fantinuoli, Claudio. (2017), «Computer-assisted preparation in conference interpreting», Translation and Interpreting 9/2, 24-37 [disponible en , 02/10/2022]. Go to original source...
  16. Fantinuoli, Claudio - Prandi, Bianca (2018), «Teaching information and communication technologies: a proposal for the interpreting classroom», Transkom 11/2, 162-182.
  17. Gaber, Mahmoud - Corpas Pastor, Gloria (2022; en prensa), «La tecnología del reconocimiento automático del habla: recurso de documentación y apoyo tecnológico para la docencia en interpretación», Granada: Comares.
  18. Gallego-Hernández, Daniel - Tolosa-Igualada, Miguel (2012), «Terminología bilingüe y documentación ad hoc para intérpretes de conferencias: Una aproximación metodológica basada en corpus», Estudios de Traducción 2, 33-46 [disponible en , 25/09/2022]. Go to original source...
  19. Gile, Daniel (1995/2009), Basic Concepts and Models for Interpreter and Translator Training, Amsterdam, Philadelphia: John Benjamins. Go to original source...
  20. Halliday, Michael Alexander Kirkwood (1989), Spoken and written language, Oxford: Oxford University Press.
  21. Markiè, Jasmina (2012), «Acerca de la (in)traducibilidad de las unidades fraseológicas en la interpretación de conferencias», en Jesen¹ek V. (ed.), Phraseologie im Wörterbuch und Korpus = Phraseology in Dictionaries and Corpora, Maribor: Univerza v Mariboru, 193-203.
  22. Nolan, James (2005), Interpretation: Techniques and exercises, Clevedon, Reino Unido: Multilingual Matters.
  23. Pérez-Pérez, Pablo (2018), «The Use of a Corpus Management Tool for the Preparation of Interpreting Assignments: A Case Study», The International Journal for Translation and Interpreting Research 10(1), 137-151 [disponible en , 05/10/2022]. Go to original source...
  24. Sandrelli, Annalisa. (2015), «Becoming an interpreter: the role of computer technology», MonTI Special Issue 2, 111-138. Go to original source...
  25. Sánchez Ramos, María del Mar (2017), «Interpretación sanitaria y herramientas informáticas de traducción: los sistemas de gestión de corpus», Panace@ 18/46, 133-141.
  26. Seghiri, Míriam (2017), «Corpus e interpretación biosanitaria: extracción terminológica basada en bitextos del campo de la Neurología para la fase documental del intérprete (Corpora and medical interpreting: terminology extraction based on bitexts for the interpreter's documentation process)», Panace@ 18/46, 123-132.
  27. Setton, Robin (2011), «Corpus-based interpreting studies (CIS): Overview and prospects», en Kruger, A- Wallmach, K. - Munday, J. (eds.), Corpus-based translation studies research and applications, Londres: Continuum International, 33-75.
  28. Shlesinger, Miriam (1998), «Corpus-based interpreting studies as an Offshoot of Corpus-based Translation Studies», Meta 43/4, 486-493. Go to original source...
  29. Tolosa-Igualada, Miguel - Mezcua, Aurora Ruiz (2010), «La opacidad de las unidades fraseológicas y su tratamiento por intérpretes en formación», en Opacidad, idiomaticidad, traducción, Alicante: Universidad de Alicante; París: Université Paris 13; La Manouba: Université de la Manouba, 365-383.
  30. Xu, Ran (2018), «Corpus-based terminological preparation for simultaneous interpreting», Interpreting 20/1, 33-62. Go to original source...

This is an open access article distributed under the terms of the Creative Commons Attribution-ShareAlike 4.0 International License (CC BY-SA 4.0), which permits use, distribution, and reproduction in any medium, provided the original publication is properly cited. No use, distribution or reproduction is permitted which does not comply with these terms.