ქართული ენის ციფრული პორტრეტი - ინტერვიუ ნინო დობორჯგინიძესთან

14 აპრილი ქართული ენის  დაცვის დღეა. 1978 წლის 14 აპრილს, თბილისში ხალხმრავალი დემონსტრაციები გაიმართა. საბჭოთა საქართველოს მოქალაქეები, უმეტესად სტუდენტები, აპროტესტებდნენ კომუნისტური პარტიის მცდელობას, შეეცვალა ქართული ენის სტატუსი და სახელმწიფო ენად რუსული გამოეცხადებინა.

ილიას სახელმწიფო უნივერსიტეტის რექტორი, ნინო დობორჯგინიძე მათ შორის იყო, ვინც 1978 წელს ენის დასაცავად ქუჩაში იდგა.

რა გამოწვევები აქვს ქართულ ენას დღეს? - რადიო თავისუფლება ენის დღეს ნინო დობორჯგინიძეს ესაუბრა.

ჩვენნაირი პატარა ქვეყნებისა და ენებისთვის, ალბათ, განსაკუთრებით მნიშვნელოვანია და, ამავე დროს, რთული ენის „გადატანა” ციფრულ პლატფორმებზე. რატომ არის დღეს ენის გადარჩენა დამოკიდებული მის გაციფრულებაზე?

21-ე საუკუნის დასაწყისში გამოქვეყნდა BBC-ის ცნობილი პროგნოზები, რა მოხდება 21-ე საუკუნის ბოლომდე და ერთ-ერთი ყველაზე დრამატული იყო ენების მიმართ წინასწარმეტყველება, რომელიც ამბობდა, რომ ენების უმეტესობა შეწყვეტს სიცოცხლეს, ვეღარ იქნება დიდ გლობალურ პროცესებში ჩართული იმიტომ, რომ მხარდაჭერილი არ იქნება ტექნოლოგიურად.

სახელმძღვანელოების მაგალითებზე რომ წარმოვიდგინოთ: დაინგრა საბჭოთა კავშირი და რამდენი ღირებული სახელმძღვანელო შევქმენით და ვთარგმნეთ? მაგალითად, 20 წლის შემდეგ თქვენს შვილებს რომ დასჭირდეთ, კარგი, ღირებული სახელმძღვანელო ნანოტექნოლოგიებზე, ის თუ ქართულად არ გვექნება ნათარგმნი ან დაწერილი, ხომ მოუწევს სხვა ენაზე წაკითხვა?

მეცხრამეტე საუკუნეში, 1811 წელს, პეტერბურგის საიმპერატორო კანცელარიაში ქუთაისის გუბერნიიდან გაიგზავნა წერილი: „ა ბატონო, რაც გინდოდათ, ყველაფერი შევასრულეთ, საქართველოს რუსიფიკაციის გეგმა დავასრულეთ: ტყით სარგებლობის წესი გამოვეცით ქართულად და დანარჩენი ყველაფერი, ლიტურგიით დაწყებული რუსულ ენაზე გადავიყვანეთო”.

ენის, როგორც ბრძოლის იარაღის გამოყენება ყოველთვის კარგად იცოდა რუსეთმა. ამიტომაც შეუქმნა მეცხრამეტე საუკუნეში დამწერლობა ჩრდილოკავკასიურ ენებს - ეს იყო მისი დიდი, იმპერიული პროექტი იმისთვის, რომ მერე ისინი [ენები და ხალხი] კარგად ეკონტროლებინა. აფხაზური ენის კორპუსიც შექმნა რუსეთმა იანდექსის* პლატფორმაზე. იმიტომ კი არა, რომ აფხაზური ენა გადარჩეს, იმიტომ რომ თვითონ იყოს ბატონ-პატრონი და დირექტორი.

მე მახსოვს, 2000-იანი წლების დასაწყისში საქართველოში „ფოლკსვაგენის” გრანტები** შემოიტანეს გერმანელმა მეცნიერებმა და იყო ერთი გაწევ-გამოწევა, იყო ხალხი, ვინც ამას ეწინააღმდგებოდა. მაშინ საქართველო იყო ერთადერთი პოსტსაბჭოთა ქვეყნებიდან, რომელმაც ციფრული ენის პროექტების კეთება დაიწყო არა იანდექსის პლატფორმაზე, არამედ დამოუკიდებლად.

ენათმეცნიერებსაც აქვთ თავიანთი ბრძოლის ველი და ჩვენი ბრძოლის ველი დღეს იმაზე გადის, რამდენად მოვახერხებთ დამოუკიდებლად და სწორად განვითარებას. იმაზე, თუ რამდენად მოვახერხებთ, ქართული ენა დროის, გარემოებების მიხედვით ფუნქციონირებდეს. [ამაზე] იქნება დამოკიდებული მისი მომავალი და თუ ამ ქვეყანას აქვს ამბიცია და პრეტენზია, გააგრძელოს თანამედროვე სამყაროში პოზიციონირება ქართულ ენაზე, მან კეთილი უნდა ინებოს და ისე აღჭურვოს ეს ენა ციფრული ინსტუმენტებით, როგორც არის აღჭურვილი, მაგალითად, ინგლისური, გერმანული, ფრანგული და სხვა ენები.

რას ნიშნავს ენის აღჭურვა ციფრული ინსტრუმენტებით და რა პროექტები გაქვთ, რაც მნიშვნელოვანია ქართული ენის სიცოცხლისუნარიანობისთვის?

რა იყო ის 14 აპრილი? მაშინ ის [პროტესტი] ქართული ენის სრულფასოვნად ფუნქციონირებას და კონსტიტუციაში ადეკვატურად ასახვას ეხებოდა. მე მახსოვს, მაშინ მე და ჩემმა მეგობრებმა ჩანაწერები, დღიურები, რომლებიც არ გვინდოდა ვინმე სხვას ენახა, წინა დღეს დავწვით. დღეს რას ვაკეთებთ იმისთვის, რისთვისაც მაშინ ახალგაზრდობა მზად იყო, სიცოცხლე გაეწირა?

ილია გვეუბნებოდა, დამთავრდა ომის დრო, ახლა ფუტკრისგან ნასწავლი შრომით უნდა მოვახერხოთ და დავიცვათ ქართული ენის ფუნქციები. თანამედროვე, გლობალურ სამყაროში მართლაც წამოუდგენელია სრულფასოვნად ფუნქციონირებდეს ენა, რომელიც ტექნოლოგიურად სრულფასოვნად არ იქნება მხარდაჭერილი.

მე ლინგვისტურ კვლევათა ინსტიტუტის დირექტორი ვიყავი 2011 წლიდან და არ მახსოვს, ჩვენ მიერ ინიცირებული პროექტი არ ყოფილიყო ილიას უნივერსიტეტის მხრიდან მხარდაჭერილი: იქნებოდა ეს უმდიდრესი ქართული ენობრივი მემკვიდრეობის დოკუმენტირება თანამედროვე ციფრული სტანდარტების მიხედვით თუ ამ ქვეყანაში დაცული ენობრივი მრავალფეროვნების ასახვა ციფრული კორპუსების სახით. ილიას უნივერსიტეტის ლექსიკოგრაფიისა და ენობრივი ტექნოლოგიების ცენტრმა „მცდარბეჭდილმძებნთან” [გუნდი, რომელიც მუშაობს ქართული ენის სპელჩეკერზე - რ.თ.] ერთად გააკეთა ინგლისურ-ქართული მანქანური მთარგმნელი. ბევრად სჯობნის ეს მთარგმნელი ხშირ შემთხვევაში დიდი ხნით ნაგროვებ გუგლის მთარგმნელის მონაცემებს.

ილიას სახელმწიფო უნივერსიტეტი არაერთი წელია მუშაობს ფიცრული ჰუმანიტარიის მიმართულებით და უკვე არაერთი პლატფორმა აქვს გაკეთებული ენის ტექნოლოგიური მხარდაჭერისთვის:

რით განსხვავდება თქვენ მიერ გაკეთებული მთარგმელის „ტვინი” გუგლის მთარგმნელისგან?

Google Translate-ი, თქვენ იცით, დაგროვების და დამახსოვრების პრინციპით არის შექმნილი: ნახა ქართული ტექსტი, ნახა ინგლისური ტექსტი და იქ რა შესაბამისობებიც ნახა, იმის მიხედვით გააკეთა სხვა ანალოგი. მაგალითად, 2009 წელს “opposition”-ის [ოპოზიცია - რ.თ] თარგმნა თუ გინდოდა, [Google Translate] ქართულ შესატყვისად „გრეჩიხას” თარგმნიდა, იმიტომ რომ მაშინ რეალობაში შესატყვისობა ასეთი იყო.

დაგროვების პრინციპი ძალიან მნიშვნელოვანია, მაგრამ მას აუცილებლად სჭირდება ენის ბუნების, მისი ლინგვისტური კანონზომიერების, მათ შორის, ერთი ენიდან მეორე ენაზე თარგმნის კანონზომიერების მიხედვით შედგენილი მთარგმნელი. ჩვენს მთარგმნელს საფუძვლად უდევს ძალიან გამოცდილი მეცნიერების ჯგუფის ცოდნა და კომპეტენცია, ვინც ალბათ ყველაზე კარგად იცის შესატყვისობების კანონზომიერებები, მათ შორის - ლინგვისტური.

მხოლოდ ილიას უნივერსიტეტში არის მონაცემთა ცენტრი, სადაც ერთმანეთის გვერდით გროვდება [თავის] ტვინის მაგნიტურ-რეზონანსული კვლევების შედეგები, ასტროფიზიკაში ციურ სხეულებზე დაკვირვების ძალიან მრავალშრიანი მონაცემები, ქართული ენის მორფოლოგიური ანალიზატორის მონაცემები - ეს არის ერთიანი ციფრული სისტემა.

ჩვენი მთარგმნელის პროგრამაც სწორედ ამ მონაცემთა ცენტრის ბაზაზე ხორციელდება. აქ არის ქართველური ენების სხვადასხვა ციფრულ რესურსზე მომუშავე ძალიან ბევრი კვალიფიციური ჯგუფი და ეს აადვილებს ამ შრომას. ეს ჯგუფები ერთად ქმნიან ციფრულ ეკოსისტემას. ციფრული ჰუმანიტარიის პროექტები და ენის დამუშავების პროექტები არის ყველაზე გუნდური პროექტები, რომელიც მუშაობს შემდეგი პრინციპით: მე მაშინ გავაკეთებ ბევრს, თუ შენ გააკეთებ ბევრს.

წარმოიდგინეთ, საუკუნეების განმავლობაში ამ ენაზე ჯერ ზეპირი, მერე ხელნაწერი და მერე ბეჭდური მემკვიდრეობის მთლიანად თანამედროვე მეთოდოლოგიური სტანდარტებით ჩაწერა და დიდ მონაცემთა ბაზებად ქცევა, მერე ამ ენის ბუნების, პრინციპების დამუშავება და მისი მანქანური დასწავლისთვის მომზადება - ეს არის ათწლეულების და დიდი ინსტიტუციების საქმე.

Your browser doesn’t support HTML5

რა გამოწვევები აქვს ქართულ ენას დღეს - ინტერვიუ ნინო დობორჯგინიძესთან

თუმცა სისტემურად და უწყვეტად ამ მიმართულებით არც ისე ბევრი ინსტიტუცია მუშაობს. რამდენად არსებობს თუნდაც სხვადასხვა ინსტიტუციაში მომუშავე პროფესიონალებს შორის შეთანხმება ერთიან პრინციპებზე, გრძელ და მოკლევადიან გეგმებზე, პრიორიტეტებზე. მგონია, რომ რაც არ უნდა ეფექტური იყოს ერთი უნივერსიტეტის მუშაობა, მაინც უფრო წერტილოვანი ეფექტი ექნება, ვიდრე კოორდინირებულ მუშაობას მთელი პროფესიული თემის.

სამწუხაროდ, ეს არ არის ძალიან კოორდინირებული. სტანდარტებზეც კი არ ვართ შეთანხმებული. ჩვენ ვცდილობთ, რომ საერთაშორისო სტანდარტების მიხედვით ვიმუშაოთ. 2010 წლიდან გვქონდა მცდელობა, რომ იმაზე მაინც შევთანხმებულიყავით, რომ ერთი და იგივე საქმე სხვადასხვა ჯგუფებს არ გაეკეთებინათ, ესეც ვერ მოხერხდა.

2021 წლის დეკემბერში მიიღეს ოფიციალურად სახელმწიფო ენის პროგრამა - მე არ ვიცი, ეს თუნდაც ფინანსურად რამდენად დაეხმარება სხვადასხვა ჯგუფებს. მაგრამ, წესით, ამ პროგრამამ უნდა გაუწიოს კოორდინირება ამ პროცესს.

თქვენს პროექტებში სხვადასხვა პროფესიის და ინტერესების მქონე ადამიანები როგორ ახერხებენ საერთო ენის გამონახვას?

თავიდან, მართლაც ძალიან რთული იყო პროგრამისტებთან საერთო ენის გამონახვა: გვეკითხებოდნენ, გვითხარით, რა გინდათ და გავაკეთებთ იმას. ჩვენ ვეუბნებოდით, რომ მხოლოდ ის კი არ უნდა გააკეთოთ, რაც გვინდა, ისე უნდა გაკეთდეს, როგორც ამას საერთაშორისო სტანდარტი მოითხოვს. დღეს ილიას უნივერსიტეტი საქართველოში ერთადერთი ადგილია, სადაც ენათმეცნიერებს პითონს ვასწავლით, იმისთვის რომ თვითონ შეძლონ პროგრამირება.

ჩვენი პროექტები სტუდენტების ძალიან დიდი ძალისხმევით შედგენილი ჯგუფური პროექტებია. ეს არის პროექტები, რომელშიც თანამედროვე მკვლევრები იბადებიან და მათ გაცილებით დიდი შესაძლებლობა ექნებათ.

მაგალითად, მეცხრამეტე საუკუნეში, ფუნქციური ტექსტები რომ იბეჭდებოდა, მაგალითად, ბარბარე ჯორჯაძის რეცეპტები, იმის დოკუმენტირება ცალკე ხდება; პერიოდიკაში, ჟურნალ-გაზეთებში გრაფიკული გაფორმებები რომ აქვს ტექსტს, ის როგორ უნდა წაიკითხოს და აქციოს ტექსტად OCR-ის ლინგვისტურ-ლექსიკური ნაწილის ამომცნობმა, მაგაზე ცალკე ჯგუფი მუშაობს.

ლექსიკოგრაფიის ჯგუფი ძალიან აქტიურად მუშაობს ოქსფორდის ჯგუფთან ერთად არა მხოლოდ ინგლისურ-ქართულ ლექსიკონზე, ერთიან დიდ სისტემაზე, რომელშიც ჩართულები არიან გერმანულზე, იტალიურზე, ფრანგულზე მომუშავე ჯგუფები. თუ გვინდა, რომ ქართული არ იქცეს თანამედროვე სამყაროში უფუნქციო ენად, ღირებული ინფორმაციის მიმოცვლისთვის აუცილებელია ენის ტექნოლოგიზება.

ვინ არიან იმ პლატფორმების მომხმარებლები, რომლებსაც თქვენ ქმნით? ვიწრო პროფესიული წრეები?

ვერ გეტყვით, მაგალითად, პროსოპოგრაფიული ბაზა*** ძალიან პოპულარულია. ფეისბუკზეც არსებობს ქართველთა შორის წერა-კითხვის გამავრცელებელთა პროსოპოგრაფიული ბაზის გვერდი და მას ძალიან ბევრი მომხმარებელი და მნახველი ჰყავს.

როცა პროსოპოგრაფიაზე დავიწყეთ მუშაობა, მინდოდა წერა-კითხვის გამავრცელებელი საზოგადოების გახსნილი ბიბლიოთეკების კარტოთეკების აღდგენა, მაგრამ აღმოჩნდა, რომ უმეტესობა გადაყრილია. დღეს სამტრედიელმა ან ხონელმა უნდა იცოდეს, რა წიგნს კითხულობდა მისი წინაპარი. ხონის ბიბლიოთეკა რომ ითხოვდა დაბეჭდილ "ვეფხისტყაოსანს" და გორგაძის ნათარგმნ არისტოტელეს, ეგეც გამოგვიგზავნეთო, მისმა შთამომავალმა უნდა იცოდეს ეს ამბავი, უნდა იცოდეს, ვინ იყო მისი ბაბუა, მასთან უწყვეტი მემკვიდრეობითი კავშირი უნდა დაამყაროს და ეს კავშირი აღიაროს ღირებულებად. ესაა ტექნოლოგიების ძალა, თორემ მეზობლების ბავშვების ფოტოების მოწონებით დიდი არაფერი შეიქმნება.

პროსოპოგრაფიის რუკით ჩვენ სწორედ ის ვაჩვენეთ, რომ საერთო პასუხისმგებლობის აღება გვიჭირს, მაგრამ პრეცედენტების ქვეყანა ნამდვილად ვართ. მეცხრე საუკუნეში, როცა ქართლი იყო გაოხრებული და გავერანებული, ვერავინ წარმოიდგენდა, რომ ქართლიდან სამცხეში წასული სამი ბერის, რომლებსაც სამშენებლო იარაღებიც კი არ ჰქონდათ, მშენებლობებიდან, გაჩნდებოდა ერთიანი საქართველოს იდეა, რომელიც მანამდე არ გვქონდა - გრიგოლ ხანძთელსა და მის ძმებზე ვსაუბრობ.

ასე ვერ წარმოიდგენდა, რომ მეცხრამეტე საუკუნეში პარასკევა ბოძაშვილი რომ ჩამოდიოდა კვირაში ერთელ თელავის ბაზარში და ყიდდა თუშურ წინდებს, იქიდან ორი წინდა წერა-კითხვის გამავრცელებელი საზოგადოებისთვის ჰქონდა გადადებული და იმის ყულაბაში დებდა იმ წინდების ფულს, რომ კახეთიდან ევროპაში გაგზავნილ მოწაფეებს ფული ჰქონოდათ.

ეს პრეცედენტები უნდა ვაქციოთ მეხსიერების ადგილებად, რასთანაც ბმა ყველას გვექნება.

* Yandex - მულტიპროფილური ტექნოლოგიური კომპანია, რომელიც ძირითადად რუსეთისა და რუსულენოვანი აუდიტორისთვის ქმნის ისეთ პროდუქტებს, როგორიცაა საძიებო სისტემები, სარეკლამო პლატფორმები, სატრანსპორტო სერვისები, მობილური აპლიკაციები, ონლაინლექსიკონები და რუკები.

* The Volkswagen Foundation-ი - ჰანოვერში დაარსებული დამოუკიდებელი ფონდია, რომელიც სამეცნიერო პროექტების მხარდამჭერი ყველაზე დიდი კერძო ფონდია გერმანიაში. 1962 წლის შემდეგ მას 5 მილიარდზე მეტის ღირებულების 33 000 პროექტი აქვს დაფინანსებული გერმანიაში და მის საზღვრებს გარეთ. მასთან თანამშრომლობის პრაქტიკა აქვთ ქართულ უნივერსიტეტებს და რუსთაველის სამეცნიერო ფონდს.

*** პროსოპოგრაფიული ბაზა - ადამიანების შესახებ სხვადასხვა წყაროში (საარქივო დოკუმენტებში, პრესაში) დაცული მონაცემების იმგვარად დალაგება, რომ ხილული გახდეს ისტორიული სოციალური ჯგუფების აქამდე უხილავი კავშირები. პროსოპოგრაფია ცალკეული პიროვნებების ბიოგრაფიების საფუძველზე შეისწავლის ისტორიული ჯგუფის საერთო მახასიათებლებს.