Лицензионное соглашение об использовании научных материалов.
|
|
Контекстуальные признаки лингвистических многозначных терминов для их идентификации в китайском, английском и русском языках
|
Хуан Шанлун
Новосибирский государственный университет
|
Дата поступления рукописи в редакцию:
2 июня 2025
г.
|
Аннотация.
Цель исследования – разработать эффективные методы построения корпуса, предназначенного для идентификации лингвистических значений терминов в китайском, английском и русском языках на основе закономерностей образования терминосочетаний. В статье для изучения способов образования лингвистических многозначных терминов, значимых для выявления их контекстуальных особенностей, были проанализированы словарные описания таких терминов, полученные методом сплошной выборки. На материале отобранных корпусов китайского, английского и русского языков были исследованы узкий и широкий контексты терминов, указывающие на их лингвистические значения. Научная новизна исследования заключается в получении принципиально новой методики создания корпуса, предназначенного для распознавания лингвистических терминов в разных языках, аналогичные исследования ранее не проводились. Полученные результаты показали, что в лингвистике выделяются различные модели образования терминов в трех языках, рассмотренных в данном исследовании, но наиболее типичной структурой является Adj. + N. В результате анализа контекстуальных особенностей были выявлены два варианта: для одного класса лингвистических многозначных терминов анализ их устойчивых сочетаний может способствовать прямому распознаванию значений терминов, для другого класса таких терминов при идентификации их значений следует использовать, наряду с устойчивыми сочетаниями, также широкий контекст их употребления.
|
Ключевые слова и фразы:
лингвистические многозначные термины
сравнение языков
закономерности образования терминов
контекстуальные признаки
идентификация терминов
linguistic polysemous terms
comparison of languages
patterns of term formation
contextual features
identification of terms
|
|
Открыть
полный текст статьи в формате PDF. Бесплатный просмотрщик PDF-файлов можно скачать здесь.
|
|
Список литературы:
- Верещагин Е. М., Костомаров В. Г. Лингвострановедческая теория слова. M.: Русский язык, 1980.
- Гибкий П. В., Супрунчук Н. В. Сохранение эквивалентности при передаче значения категории пассивного залога с русского языка на китайский (на материале сайтов минского тракторного завода и индустриального парка «Великий камень») // Вестник Омского государственного педагогического университета. Гуманитарные исследования. 2021. № 4 (33).
- Инютина Л. А., Большакова И. Д. О сопоставимости лингвистической терминологии в русском и английском языке // Успехи гуманитарных наук. 2021. № 9.
- Крапивник Е. В., Носенко А. О. Национально специфичные особенности метафоризации как способа терминообразования (на материале лингвистической терминологии русского и английского языков) // Гуманитарные исследования. 2021. № 1 (77).
- Allahyari M., Pouriyeh S., Assefi M., Safaei S., Trippe E., Gutierrez J., Kochut K. A brief survey of text mining: classification, clustering and extraction techniques. https://doi.org/10.48550/arXiv.1707.02919.
- Festman J. Learning and processing multiple languages: The more the easier? // Language Learning. 2021. Vol. 71 (1).
- Gortych-Michalak K., Grzybek J. Polysemic Terms in Chinese, German, Greek and Polish Legal Language: A Comparative Study // Comparative Legal Linguistics: International Journal for Legal Communication. 2013. Vol. 15.
- Hamon T., Grabar N. Linguistic approach for identification of medication names and related information in clinical narratives // Journal of the American Medical Informatics Association. 2010. Vol. 17 (5).
- Huang S. Application of Informatics and Electronics on a Linguistic Level for Handling Consubstantial Terms in Automatic Processing of Scientific Publications // IEEE 24th International Conference of Young Professionals in Electron Devices and Materials (EDM). 2023. https://doi.org/10.1109/EDM58354.2023.10225126
- Kim S., Liu L., Cao F. How does first language (L1) influence second language (L2) reading in the brain? Evidence from Korean-English and Chinese-English bilinguals // Brain and Language. 2017. Vol. 171.
- Laparra E., Mascio A., Velupilla S., Miller T. A review of recent work in transfer learning and domain adaptation for natural language processing of electronic health records // Yearbook of Medical Informatics. 2021. Vol. 30 (1).
- Liu Z., Chen Y., Tang B., Wang X., Chen Q., Li H., Wang J., Deng Q., Zhu S. Automatic de-identification of electronic medical records using token-level and character-level conditional random fields // Journal of Biomedical Informatics. 2015. Vol. 58.
- Pikhart M., Klímová B. Managerial computer communication: implementation of applied linguistics approaches in managing electronic communication // Advances in Computer, Communication and Computational Sciences: Proceedings of IC4S 2019. Berlin: Springer, 2020. Vol. 1158.
- Tsinaraki C., Velegrakis Y., Kiyavitskaya N., Mylopoulos J. A Context-Based Model for the Interpretation of Polysemous Terms // On the Move to Meaningful Internet Systems (OTM 2010). Berlin – Heidelberg: Springer, 2010. Vol. 6427. https://doi.org/10.1007/978-3-642-16949-6_20
- Venuti L. The Translator’s Invisibility: A History of Translation. L. – N. Y.: Routledge, 1995.
- Wang Y., Wang L., Rastegar-Mojarad M., Moon S., Shen F., Afzal N., Liu S., Zeng Y., Mehrabi S., Sohn S., Liu H. Clinical information extraction applications: A literature review // Journal of Biomedical Informatics. 2018. Vol. 77.
- Wijayasekara D., Linda O., Manic M., Rieger C. Mining building energy management system data using fuzzy anomaly detection and linguistic descriptions // IEEE Transactions on Industrial Informatics. 2014. Vol. 10 (3).
- Yuniarti W. D., Hartati S., Priyanta S., Surjono H. D. Utilization of linguistic data for learner assessment on e-learning: instrument and processing // Seventh International Conference on Informatics and Computing (ICIC). 2022. https://doi.org/10.1109/icic56845.2022.10006977
- 荀恩东, 饶高琦, 肖晓悦, 臧娇娇. 大数据背景下BCC语料库的研制 // 语料库语言学. 2016. № 1 (Xun E., Rao G., Xiao X., Zang J. The construction of the BCC Corpus in the age of Big Data // Corpus Linguistics. 2016. Vol. 3 (1)).
|
|