თათრული სოციოპოლიტიკური ტერმინოლოგია ორენოვან თეზაურუსში
საკვანძო სიტყვები:
ორენოვანი თეზაურუსი, სოციალურ-პოლიტიკური ლექსიკა, ლექსიკური სინონიმიაანოტაცია
სტატიაში განხილულია რუსულ-თათრული სოციოპოლიტიკური თეზაურუსის (http://tattez.antat.ru/) შედგენის ძირითად მეთოდოლოგია. აღნიშნული თეზაურუსი იქმნება რუსული რუტესის თეზაურუსის ფორმატის საფუძველზე (http://www.labinform.ru/pub/ruthes/index.htm). პროექტის მიზანია, შეავსოს სოციოპოლიტიკურ სფეროებთან დაკავშირებული თანამედროვე თათრული ლექსიკა, რომელიც შეეხება შემდეგ სფეროებს: სახელმწიფო მმართველობას, ეკონომიკას, სოციალურ ცხოვრებას, მართლმსაჯულებას, საომარ მოქმედებებს, კულტურასა და რელიგიას. თათრული თეზაურუსი მოიცავს ზოგიერთ ისეთ ლექსიკურ ერთეულს, რომელიც შეიძლება ხშირად დადასტურდეს სხვადასხვა დარგობრივ ტექსტშიც. თითოეული ცნება უკავშირდება და ტექსტშივე მიემართება (ლექსიკურ ჩანაწერს) ენობრივ გამოთქმათა გარკვეულ ჯგუფს (ერთსიტყვიან და რამდენიმესიტყვიან გამონათქვამს). თეზაურუსის თათრული ნაწილი ეფუძნება რუტესის ცნებათა ნუსხას, შესაბამისად, შენარჩუნებულია რუტესის ძირითადი აგებულება.
თათრული თეზაურუსი ეყრდნობა შემდეგი კორპუსებს:
- თათართა ეროვნული კორპუსი (http://tugantel.tatar/?lang=en);
- სამწერლობო თათრული ენის კორპუსი (http://www.corpus.tatar/en).
სტატიაში ასევე განხილულია თათრული ენის ტერმინოლოგიური პრობლემები და რუსული და თათრული ენების იმ სემანტიკურ მიმართებათა შორის განსხვავება, რომლის გამოყენებითაც იქმნება ტერმინები.
პროექტზე მუშაობის მთავარი ამოცანაა ლექსიკური მონაცემების მოპოვება და თათრულ ენაში არსებული სოციალურ-პოლიტიკური ლექსიკის შეძლებისდაგვარად სრულად წარმოდგენა, მათ შორის – მოჭარბებული სინონიმებისაც. ვინაიდან თათრული კულტურა დასავლური და აღმოსავლური ცივილიზაციების გზაგასაყარზეა, ენაში ხშირია ლექსიკური ნასესხობანი როგორც არაბულ-მუსლიმანური, ისე ევროპული კულტურებიდან. ევროპული ენებიდან ნასესხები სიტყვები თათრულში მკვიდრდება შუამავალი ენის – რუსულის – მეშვეობით, სწორედ რუსულიდან სესხულობს თათრული ენა ბევრ სიტყვასა თუ კონსტრუქციას. გარდა ამისა, სინონიმთა მნიშვნელოვანი ნაწილი თურქული და თათრული ლექსიკური მასალის საფუძველზეა შექმნილი. სწორედ ამიტომ თანამედროვე თათრულ ენაში სხვადასხვა წარმო-მავლობის სინონიმებია (თურქული, რუსული, არაბული, სპარსული, ბერძნული, ლათინური და ინგლისური), რომლებიც მდიდარ ლექსიკურ მასალას ქმნის. დაბოლოს, თათრული ენის გრამატიკული სისტემა საშუალებას იძლევა ტერმინები სიტყვაწარმოებითი თუ სინტაქსური სტრუქტურის საშუალებით შეიქმნას. შედეგად, სოციოპოლიტიკურ ტერმინებს აქვთ სხვადასხვა ლექსიკური შედგენილობისა და სტრუქტურის მქონე სინონიმები, რომლებიც უკლებლივ უნდა აისახოს თათრულ თეზაურუსში.
წყაროები
Bilgin, O., Çetinoğlu, Ö., Oflazer, K. 2004 - 'Building a wordnet for Turkish. Romanian Journal of Information Science and Technology, 7(1-2), 163-172.
Corpus of Written Tatar - URL: http:/corpus.tatar/.
Doborjginidze, N., Lobzhanidze, I. 2016 - Corpus of the Georgian language. In Margalitadze T., Meladze G. (eds.). Proceedings of the XVII EURALEX International Congress: Lexicography and Linguistic Diversity. 6 – 10 September, 2016 — Tbilisi, Ivane Javakhishvili Tbilisi State University, 328 – 334.
El-Haj, M., Kruschwitz, U., Fox, C. 2015 - 'Creating language resources for under-resourced languages: methodologies, and experiments with Arabic'. Language Resources and Evaluation, 49(3), 549-580. http://eprints.lancs.ac.uk/71289/1/ELHAJ_LREV.pdf
Fellbaum, C. 2010 - 'Wordnet'. In Theory and applications of ontology: computer applications. Springer, 231–243.
Galieva, A. 2018 - 'Synonymy in Modern Tatar Reflected by the Tatar-Russian Socio-Political Thesaurus'. In: Čibej J., Gorjanc V., Kosem I., Krek S. (eds.) Proceedings of the XVIII EURALEX International Congress: Lexicography in Global Contexts. Ljubljana, 585 — 994.
Galieva, A., Nevzorova, O., Yakubova, D. 2017 - 'Russian-Tatar Socio-Political Thesaurus: Methodology, Challenges, the Status of the Project'. In: Angelova, G. et al. (eds). International Conference Recent Advances in Natural Language Processing, Varn, 245 - 252.
Information materials on the final results of the 2010 All-Russian Population Census - (2010) [Informatsionnye materialy ob okonchatel'nyh itogah Vserossijskoj perepisi naseleniya 2010 goda]. URL: http://www.gks.ru/free_doc/new_site/perepis2010/perepis_itogi1612.ht
m.
Khakimov, B.E. 2018 - 'The Experience of Thesaurus Modeling of Tatar Information Technologies Terminology' [Opyt tezaurusnogo modelirovaniya tatarskoy terminologii informatsionnyih tehnologiy]. Kazanskaya nauka, 11, 193-198.
Loukachevitch, N. 2011 - Thesauri in information retrieval problems [Tezaurusy v zadachakh informatsionnogo poiska]. Moscow: Moscow State University Press.
Loukachevitch, N., Dobrov, B. 2014 - 'RuThes Linguistic Ontology vs. Russian Wordnets'. In: Proceedings of the Seventh Global Wordnet Conference. Tartu: University of Tartu Press, 154-162.
Loukachevitch, N., Dobrov B. 2015 - 'The Socio-Political Thesaurus as a Resource for Automatic Document Processing in Russian'. Terminology, vol. 21(2), 237-262.
Margalitadze, T., Meladze, G. 2016 - 'Importance of the Issue of Partial Equivalence for Bilingual Lexicography and Language Teaching'. In: Margalitadze T., Meladze G. (eds.) Proceedings of the XVII EURALEX International Congress: Lexicography and Linguistic Diversity. 6 – 10 September, 2016 — Tbilisi, Ivane Javakhishvili Tbilisi State University, 2016, 787-797.
Miller, G. A. 1995 - 'Wordnet: a Lexical Database for English'. Communications of the ACM, 38(11):39–41.
Russian-Tatar Socio-Political Thesaurus. URL: http://tattez. turklang.tatar/
Scannell, K. P. 2007 - 'The Crúbadán Project: Corpus Building for Under-resourced Languages'. In Building and Exploring Web Corpora: Proceedings of the 3rd Web as Corpus Workshop, Vol. 4, pp. 5-15.
Shvedova, N. Yu. (ed.) 1980 - Russian Grammar [Russkaya grammatika], V. Moskow: Nauka.
Socio-Political Subcorpus of Tatar National Corpus/ URL: http://tugantel.tatar/corpus/op/.
Tachbelie, M. Y., Abate, S. T., Besacier, L. 2011 - 'Part-of-Speech Tagging for Underresourced and Morphologically Rich Languages—the Case of Amharic'. In the Conference on Human Language Technology for Development, Alexandria, Egypt, 2-5 May, 50-55.
Tatar National Corpus - http://tugantel.tatar/?lang=en Vossen, P. 1997 - 'Eurowordnet: a Multilingual Database for Information Retrieval'. In: Proceedings of the DELOS workshop on Cross-language Information Retrieval, 5–7.
Vossen, P. 2002 - EuroWordNet: General Document. URL:
http://vossen.info/docs/2002/EWNGeneral.pdf.
Yandex Translate - URL: https://translate.yandex.com/