Corpora-based analysis of specialised text for translation training : term and neologisms

Ескіз

Дата

2025

Назва журналу

Номер ISSN

Назва тому

Видавець

Видавничий дім «Гельветика»

Анотація

(en) Language corpora are one of the most effective tools of applied linguistics, which are actively used in various fields of human life. The automated selection, compilation and analysis of text corpora of virtually unlimited size open up new perspectives not only for linguistic research, but also for professionals who use such data to solve practical problems. Corpus-based methods have great potential for improving language teaching, including translation, as they allow for the accurate and targeted selection of specialised linguistic materials necessary for mastering the lexical minimum, peculiarities of usage and translation of key language units, as well as for identifying current language trends in a particular field. Among the tools for working with corpora, Sketch Engine stands out as one of the most powerful, as it does not only analyse existing corpora but also creates your own, including multilingual ones. This makes it possible to quickly and efficiently research professional texts, identify key terminology and common phrases, analyse translation strategies, and create training materials for future translators. The use of the CQL query language allows improving search accuracy and obtaining more relevant linguistic data. The given article, which is a part of a larger study, discusses such an important function of Sketch Engine for searching, analysing and selecting lexical material as term recognition and extraction using the built-in Sketch Engine Keywords tool. This tool not only allows to identify terms and term combinations in professional texts with high accuracy, but also to compare the frequency of use of such words and combinations in both the studied and the reference corpora, which significantly increases the efficiency of search in general and linguistic analysis of selected units in particular. Another aspect of this study is the methodology of corpus search for neologisms and rarely used words. The latter is a challenge for corpus-based text analysis, as there are no universal search formulas or even principles for finding such vocabulary, which, however, is an important component of professional texts. The study is based on a corpus of English-language legal texts related to the IT sector, including licence agreements and contracts. (ua) Мовні корпуси – один із найефективніших інструментів прикладної лінгвістики, що активно застосовуються в різних сферах діяльності. Автоматизований підбір, компіляція та аналіз текстових масивів практично необмеженого обсягу відкривають нові перспективи не лише для філологічних досліджень, а й для фахівців, які використовують такі данні для вирішення практичних завдань. Корпусні методи мають значний потенціал для вдосконалення викладання мов, зокрема перекладу, оскільки дозволяють точно та цілеспрямовано відбирати спеціалізовані лінгвістичні матеріали, необхідні для засвоєння лексичного мінімуму, особливостей вживання та перекладу ключових мовних одиниць, а також для виявлення актуальних лінгвістичних тенденцій у конкретній галузі. Серед інструментів для роботи з корпусами Sketch Engine виділяється як один із найпотужніших, оскільки забезпечує не лише аналіз існуючих корпусів, а й створення власних, у тому числі багатомовних. Це дає змогу швидко та ефективно досліджувати галузеві тексти, виявляти ключову термінологію, типові словосполучення, аналізувати перекладацькі стратегії та складати навчальні матеріали для майбутніх перекладачів. Використання мови запитів CQL дозволяє підвищити точність пошуку та отримувати більш релевантні лінгвістичні дані. У пропонованій статті, що є продовженням більш масштабного дослідження, розглядаються така важлива функція Sketch Engine для пошуку, аналізу та відбору лексичного матеріалу, як розпізнавання та екстракція термінів за допомогою вбудованого інструмента Sketch Engine Keywords. Цей інструмент не лише дозволяє з високою точністю ідентифікувати терміни та термінологічні сполучення у фахових текстах, а й порівнювати частотність вживання таких слів та сполучень у досліджуваному та референтному корпусах, що значно підвищує ефективність пошуку загалом та лінгвістичного аналізу відібраних одиниць зокрема. Іще одним аспектом даного дослідження є методика корпусного пошуку неологізмів та рідковживаних слів. Останній являє собою певний виклик для корпусного текстового аналізу, адже не існує універсальних пошукових формул або навіть принципів пошуку такої лексики, яка, однак, є важливою складовою фахових текстів. Дослідження виконано на основі створеного корпусу англомовних юридичних текстів, пов’язаних із IT-сферою, зокрема ліцензійних угод і договорів.

Опис

Tarnavska M. M. Corpora-based analysis of specialised text for translation training : term and neologisms / Марина Миколаївна Тарнавська // Наукові записки ЦДУ ім. Володимира Винниченка. Серія : Філологічні науки : зб. наук. праць / ред. кол. : Михида С. П. [та ін.]. – Кропивницький : Видавничий дім «Гельветика», 2025. – Вип. 2 (213). – С. 177-183. DOI https://doi.org/10.32782/2522-4077-2025-213-23

Ключові слова

corpus-based research, corpus, professional text, core vocabulary, term, neologism, Sketch Engine, CQL universal query language, корпусні дослідження, корпус, фаховий текст, термін, неологізм, універсальна мова запитів CQL

Бібліографічний опис

Endorsement

Review

Supplemented By

Referenced By