Мэдээлэл технологи, даяаршлын өнөөгийн эрин үед мэдээллийн аюулгүй байдал, цахим орчин дахь улс үндэстнүүдийн дархлаа гэх зүйл нэн чухал асуудал болжээ. Үндэсний аюулгүй байдлын хэмжээнд хүртэл тавигдах учиртай энэ салбарт өнөөдөр хараа хяналт, төрийн бодлого Монгол Улсын хувьд дутмаг байна.
Тэгвэл монгол залуус маань зуун хувийн дотоодын нөөц бололцоогоороо хиймэл оюун ухааныг түшиглэн олон төрлийн асуудлыг шийдвэрлэх суурь технологийг бүтээжээ. Тухайлбал 2008 оноос цахим хэл шинжлэлийн чиглэлээр тасралтгүй ажиллаж буй мэдээллийн технологийн Болорсофт компани монгол хэлээр ярьсан өгүүлбэрийг сонсоод текст хэлбэрт шилжүүлдэг “Чимэгэ” системийг өнгөрөгч даваа гаригт танилцуулсан юм.
Ном, толь бичиг бол байгалийн жамаар л хэзээ нэгэн цагт үгүйрдэг. Харин цахим хэлбэрт орсон хэл, өв соёл бол хүн төрөлхтний санах ойд үүрд үлдэх юм. Даяаршил дунд Монгол хэлний дархлааг хадгалж буй тус компанийн гүйцэтгэх захирал Ч.Мөнхнарантай танилцаж, “Чимэгэ” систем болон хиймэл оюун ухааны талаар ярилцлаа.
-Сайн байна уу. Монгол залуус маань өөрсдийн зуун хувийн нөөц бололцоогоо ашиглан бидэнд нэн хэрэгтэй байсан технологийг бүтээж, хэрэглээнд нэвтрүүлэх төвшинд аваачсан явдалд баяр хүргэе. Хоёулаа ярилцлагаа “Чимэгэ” системийг танилцуулахаас эхэлбэл ямар вэ?
-Баярлалаа, Бололгүй яах вэ. Юун түрүүнд уг системийн нэр нь гоёл чимэг бус монгол бичгийн чимээ буюу “Чимэгэ” гэх галигаар нэрлэсэн. Манай компанийн хувьд үүсгэн байгуулагдсан цагаасаа эхлэн цахим хэл шинжлэлийн чиглэлээр дагнан үйл ажиллагаа явуулж ирсэн. Үүнтэйгээ холбоотойгоор цахим хэл шинжлэлийн нэг чиглэл болох хүний дуу авиаг боловсруулах “Чимэгэ” системийг нэг жилийн турш хөгжүүлж, танилцуулаад байна.
Товчхондоо уг систем нь “Call Center”-ын автоматжуулалт, хурлын автомат протокол хөтлөлт, сэтгүүлчдийн ярилцлагыг хүний оролцоогүй шууд текст хэлбэрт буулгах гэх мэт дуу авиаг бичвэр болгох шаардлагатай бүх шийдлүүдийн суурь технологи юм.
Манай хамт олон “Чимэгэ” системийг бүтээхийн тулд монгол хэлний авиа, ярианы онцлог, олон үндэстэн ястны өөр өөр хэллэгүүд гэх мэт нарийн зүйлсийг судалгаанд суурилж, олон мянган хүний ярианы датаг цуглуулах байдлаар хийсэн. Одоогоор энэхүү систем нь монгол хэлийг програмчлалын төвшинд 86 хувьтай таньж байгаа.
Бүтцийн хувьд хиймэл оюун ухааны “Deep-learning”-д суурилсан гэдэг утгаараа цуглуулсан датагаа түшиглэн монгол хэлээр ярьсан яриаг боловсруулаад текст хэлбэрт хөрвүүлэх юм. Бид энэ бүхнийг зуун хувь өөрсдөө гардаж хийсэн. Хиймэл оюун ухааныг хөгжүүлэх ажлыг олон жилийн турш бидэнтэй хамтран ажиллаж байгаа, Германы Берлиний их сургуулийн судлаач Төгөлдөр гэж хүн гардан хийсэн байгаа. Ерөнхийдөө энэ хүний хиймэл оюун ухааны чиглэлээр хийсэн судалгаа, мэдлэг, туршлага дээрээс үндэслэн гарч ирсэн шийдэл юм. Мөн Болорсофт компанийн програм хангамжийн архитектор инженер Бадрал гэж хүний удирдлага доор манай инженерийн баг системийг бүтээн байгуулах ажлыг хийсэн.
-Яг яаж ажилладаг технологи вэ, бага зэрэг тодруулж өгөөч?
-Үндсэндээ эхлээд бид хиймэл оюун ухаанд монгол хэлийг зааж өгч байгаа юм. Дата цуглуулах гэдэг нь тэр юм. Хиймэл оюун ухаан маань аудио датаг сонсоод боловсруулалт хийгээд, тухайн хүн бүр дээр энэ үгийг ингэж хэлж байна гээд санаад явдаг. Үүний дараа өгүүлбэрийн бүтэц гэдэг маш чухал. Хүн угаас нэг нэг үгээр бус, өгүүлбэрт хамаатуулж ойлголцдог учир “language model” буюу хэлний загвараар дамжиж гарч ирээд энэ хүн ийм үг хэлсэн байх магадлалтай. Тэр магадлал нь 86 хувь шүү гэж гаргаж ирж байгаа юм.
-Тэгэхээр түрүүн хэлсэн 86 хувь бол системийн гүйцэтгэл бус хэр нарийвчлалтай таньж байгаа тухай байжээ.
-Тийм, “Чимэгэ” системийн таних чадвар одоогоор 86 хувь. Цаашид бидэнд судалгаанд суурилж сайжруулах зүйлс их байгаа. Судалгааны үр дүнгүүдээр дутуу зүйлс нь ил болоод ирнэ. Үүндээ дүн шинжилгээ хийгээд ахиад хиймэл оюун ухаанд сургалт хийгээд явна. Энэ бол эхний буюу демо хувилбар. Гэхдээ зуун хувь бол таньж хэзээ ч чадахгүй. Аль болох 99,99 хувь болтол нь хөгжүүлэх болно. Ер нь сайжруулах процесс үргэлж хийгдсээр л байна. Угаас технологийн салбарын онцлог нь шинэчлэл бас дахин шинэчлэл шүү дээ. Амьдрал дээр ч өдөр бүр шинэ тренд үг гарч ирж байдаг. Тэр бүрийг л таниад явахгүй л бол болохгүй.
-Уг системтэй ижил төрлийн гэж хэлж болох “Google Voice Search” болон “Apple”-ын “Siri” гээд системүүд дэлхий дахинд хамгийн алдартай байдаг. Одоо Монголчууд өөрсдийн гэсэн ийм төрлийн системийг бий болгох суурьтай болжээ гэж ойлгож болох нь байна, тийм үү?
-Үндсэндээ монгол хүн, эх хэлээрээ компьютерт команд өгөх боломж үүссэн гэж ойлгож болно. Жишээ нь Англи хэлтэй хүмүүс “Siri”-г нээгээд тэр хүн рүү залга, өнөөдрийн цаг агаар, валютын ханш, цаг үеийн мэдээг харуул гээд команд өгдөг. Монгол хэлний хувьд энэ зүйл хязгаарлагдмал байсан. Учир нь хэн ч өмнө нь үүнийг хийж байгаагүй. Барууны өндөр хөгжилтэй орны компаниуд хийж өгөхгүй нь ойлгомжтой. Яагаад гэвэл тэдэнд монгол хэл тийм ч чухал биш. Монгол хэлтэй, монгол хүн л энэ системийг хийхгүй бол өөр хэн ч хийж өгөхгүй шүү дээ, бас чадахгүй. Тиймээс л бид хийсэн.
-Болорсофт компани монгол хэлний дүрмийн алдаа шалгагч, монгол бичгийг юникод болгож цахим орчинд ашиглах бололцоог олгосон зэргээр олонд танигддаг. Энэ удаад монгол хэлний дуу авиаг текст хэлбэрт хөрвүүлдэг болгожээ. Дээрээс нь энэ систем цаашлаад өшөө олон шийдлүүдийн суурь болж байгаа. Интернэтэд монгол хэл дээрх мэдээлэл тийм их байдаггүй. Манайхан тэр дундаа залуус маань ихэвчлэн англи хэл дээр эх сурвалжаа авч байгаа харагддаг. Цахим орчинд монгол хэл дээрх дата хомстолтой байдаг нь нэг талдаа ийм төрлийн технологийг огт хөгжүүлээгүй байсантай холбоотой байх. Тэгэхээр их эх оронч бүтээлүүд байна шүү, ач холбогдлынх нь тухай ярьж өгөөч?
Манай программ хангамжийн салбарт суурь судалгаа, суурь технологи хомсдолтой байдаг. Янз бүрийн гадаадад хийсэн зүйлсийг дуурайх нь элбэг. Тийм ээ, энэ бол суурь технологи.
Маш олон зүйлийн эхлэл болно гэдэгт итгэлтэй байна. Тиймээс манай бизнесийн загвар бол хөгжүүлэгчдэд зориулсан API гаргаж, цааш хамтран ажиллах нь боломжийг илүү олон хүнд хүртээнэ гэж харж байна.
Нөгөөтээгүүр даяаршиж буй нийгэмд өөрсдийн хэл, соёлоо хадгалан авч үлдэх гэдэг ямар ч улсын иргэн бүрийн хувьд чухал байх нь ойлгомжтой. Манай хэл соёл гэдэг бол дэлхийн л нэг өв шүү дээ. Үүнийг монгол хүмүүс нь л түгээж, сайжруулж цааш авч явна. Тэгэхгүй бол замхраад, уусаад л алга болохыг үгүйсгэхгүй.
Жишээ нь Холливүүдийн “Iron Man” гээд кинонд гардаг террорист бүлэглэл нь билэг тэмдэгтээ монгол бичгийг ашиглаад биччихсэн байдаг. Тэнд хэрэглээ нь байхгүй учир монгол бичиг гэдгийг нь мэдэхгүй л өнгөрч байгаа. Араб юм уу ямар хэл юм л гэж харна. Утга нь муухай байсан ч мэдэхгүй гэсэн үг. Ингээд бодохоор манай бүтээгдэхүүнүүд соёлоо түгээж, орчин үеийн технологийг ашиглан зөв сурталчилж байгаа нэг хэлбэр гэж харж болох юм.
Өөрийн тань хэлдэг шиг интернэтэд монгол хэл дээрх дата маш хомс байгаа нь яалт ч үгүй үнэн. Дээрээс нь их эмх цэгцгүй, баталгаагүй эх сурвалжтай байдаг. Бидний хийж байгаа технологи ч гэсэн олон улсад аль хэдийн нэвтэрчихсэн байгаа гэдгийг түрүүн ярилаа. Хэрэв бид бүгд Англи хэлтэй байсан бол бүх юмыг л их хялбар мэдээд, сураад, хийх гээд байна шүү дээ. Нэг талдаа залуус энэ хэрэгцээгээ дагаад гаднын хэл соёлыг ихээр суралцаж байна. Үгүй бол бид дэлхийгээс хоцрогдоод байна шүү дээ. Харин “Чимэгэ” системийн хувьд монгол хэлтэй, монгол туургатан хүмүүсийн цахим орчин дахь хэрэгцээ, шаардлагыг хангах зорилготой.
-Манайх шиг хүн ам цөөнтэй, дээрээс нь ихэнх нь оффисын төвшний ажил хийх эрмэлзэлтэй байдаг оронд “Чимэгэ” систем хүмүүсийн ажлын ачааллыг хөнгөвчилж өгч байгаа нь сайн хэрэг. Суурь технологи гэдэг утгаараа цаашид өөр олон шийдлүүдийн эхлэл болж үнэхээр ямар нэгэн цогц зүйлийн эхлэл болж чадах болов уу, Оюуны бүтээл гэдэг утгаараа ч бизнес байх ёстой шүү дээ, цаашид ер нь ямар төвшинд хүргэнэ гэсэн зорилттой байгаа вэ?
-Тийм ээ, энэ бол суурь технологи. Үүнээс тулгуурлаад ямар шийдлийн дагуу, ямар үр өгөөжтэй, ямар бүтээгдэхүүн гаргах вэ гэдэг нь цаашдаа бизнес төлөвлөгөө бодоод явна. Ер нь бол цахим орчинд аудио дата маш их байдаг. Бид өнөөдөр аудио датаг текст дата болгож байгаа бол текст дата нь анализ хийхэд хамгийн хялбар дата. Цаашлаад дэлхий дээр өнөөдөр видео датаг текст болгох шийдлүүд явж байна. Энэ нь хүний хэлж байгаа өнгө аяс, хэлэмж, биеийн хөдөлгөөн, сэтгэл хөдлөл, нүдний харцыг хүртэл боловсруулдаг. Бид ч гэсэн үүний төлөө зүтгэнэ.
-Бид юм болгонд нэн ялангуяа мэдээлэл технологи, хиймэл оюун ухааны салбарт дэлхий нийтээс хол хоцорчихоод байлаа. Гэтэл манай залуус өөрсдөө үүнийг хийж чаддаг гэдгээ харуулсаар байна. Та бүхэнд үүнийг хийхэд ямар саад хамгийн ихээр тулгарч байна вэ. Ер нь цаашид энэ салбарыг хөгжүүлэхэд хамгийн бэрхшээлтэй зүйлс нь юу байна вэ. Би хувьдаа ерөнхийдөө Монголын мэдээлэл технологийн салбарт боловсон хүчин, санхүү тутагддаг гэж ойлгодог, өөр ямар нарийн зүйлс гарч ирдэг вэ?
-Манай мэдээлэл технологийн салбар өөрөө төрийн зохицуулалт талаасаа яаманд биш агентлагт харьяалагдаж явдаг. Мэдээж санхүү, боловсон хүчний хомстол бол маш их байгаа. Ер нь дэлхий дахинд “IT”-ын боловсон хүчний хомстолтой байгаа, нэн эрэлттэй мэргэжил бүхий салбар юм.
“Чимэгэ” системийг бүтээхийн хувьд нэн тэргүүнд хүмүүсээр текст уншуулж дата цуглуулах шаардлага гардаг учир зохион байгуулах ажил хүндрэлтэй байсан. Хүн мэдээж заримдаа тухайн үгийг алдаж уншина. Зарим нь санаатай, санаандгүй алдаж уншина. Ийм дата огт хэрэг болдоггүй. Цагийн гарз л болдог. Мөн олон төрлийн аялгатай хүмүүс нэг үгийг арав, хорин янзаар хэлдэг байх жишээтэй. Тэрийг нь нэг үг гэж танддаг болгохын тулд ажиллах хэрэг болно. Энэ мэт хүндрэлүүд тулгарч байсан. Манай компани цахим хэл шинжлэлийн чиглэлээр мэргэшээд явдгийн хувьд өмнөх туршлагаас шалтгаалаад техникийн саатлуудтай бол харьцангүй бага тулгарч байсан.
Цахим хэл шинжлэл гэдэг нь өөрөө хиймэл оюун ухааны суурь салбар гэж явдаг. Учир нь хиймэл оюун ухаан буюу роботыг хөгжүүлэхийн тулд тэдэнтэй ойлголцох, ярилцах шаардлага гарч ирсэн. Мэдээж ойлголцохын тулд хэл ашиглана. Ер нь дэлхийн аль ч туршлагад хиймэл оюун ухааныг хөгжүүлэхийн тулд цахим хэл шинжлэл дээр их цаг хугацааг алдаж, удаашруулсан байдаг.
Монголд технологийн хоцрогдлын хажуугаар хэл шинжлэл, монгол хэлний цэгцрээгүй байгаа байдал зэрэг нь өөрөө их ойлгомжгүй байдлыг үүсгэдэг. Хэлний хувьд ч, бичгийн хувьд ч ойлгомжгүй зүйлс их. Жишээ нь зарим үг, зөв бичгийн дүрмийг өөрчлөөд ямар ч их цэгцгүй, замбараагүй болгоод байдаг. Үүн дээрээ төр засгаас тогтсон бодлого, хяналт дутмаг яваад байдаг. Үүнээс болж хиймэл оюун ухааны салбар манайд хөгжихгүй удаад байгаа гэж би үздэг.
Хүмүүс хиймэл оюун ухааныг хөгжүүлэхэд яг юу хэрэгтэй вэ, юунд анхаарах вэ, ямар хэмжээний зардал шаардагддаг вэ гэдэг зүйлийг их асуудаг. Энэ бүрд хариултууд нь тодорхой байдаг. Мэдээж тодорхой хэмжээний дата цуглуулах хэрэгтэй, судалгаа байх ёстой, зөв технологиудыг ашиглах хэрэгтэй, сайн хүний нөөц, боловсон хүчинтэй байх шаардлагатай гээд нарийвчилж яривал өөр зүйлс ч их байгаа. Асуулт нь ойлгомжтой, хариулт нь ч гэсэн ойлгомжтой. Харамсалтай нь тэр хариултыг хийх шийдэл дээр очоод гацчихдаг. Үүнийг төр засаг анхаарахгүй байгаатай л шууд холбож тайлбарлах хэрэгтэй байх.
Жишээ нь АНУ-д “Boot camp” гэж зүйлс их байдаг. Товчхондоо бол зургаан сарын хугацаатай мэдээллийн технологийн чиглэлээр мэргэшүүлдэг газрууд юм. Нөгөө алдарт цахиурын хөндийд ийм төрлийн сургалтын төвүүд олон байдаг болсон. Манай залуус ч их бага хэмжээгээр тэнд суралцаж байна. Нэг талдаа ийм тусгай сургалтад хамрагдсан залуус дөрвөн жил мэдээллийн технологиор суралцсан залуустай шууд зэрэгцээд ажиллаж чадаж байна. Нөгөө талдаа улс болон томоохон компаниуд нь хямд өртгөөр шаардлагатай, мэргэжлийн боловсон хүчнээ хангаад байгаа юм. Миний хувьд манайд ч гэсэн ийм зүйл байгаасаа гэж их хүсдэг.
Зориглоод ороод ирэхэд хиймэл оюун ухааны салбар огт боломжгүй зүйл биш
-Өнөөгийн технологийн чиг хандлагыг харахад хиймэл оюун ухааны салбар бол ирээдүй байх нь тодорхой байна. Бид үүнтэй зайлшгүй хөл нийлүүлэн алхахаас өөр аргагүй байна. Та салбараа төлөөлөөд залуучуудад хандаж хиймэл оюун ухааны салбарт яагаад орох шаардлагатай тулаар хэлж өгөөч. Магадгүй мэргэжил сонголтод нь тус дэм болж мэднэ шүү дээ?
- Салбартаа бид сайжруулалт, хөгжүүлэлт хийгээд яваад байхад дэлхийн хөгжлөөс хоцрохгүй гэж би бодож байна. Дэлхийн хөгжил гэдэг бол заавал ямар нэгэн юмыг дагах гэсэн үг биш. Хүн болгон, улс бүр өөрсдийн гэсэн соёлтой. Түүнээсээ хамаараад өөрсдийн онцлогт тохирсон ялгаатай цахим шийдлүүдийг гаргаж ирж байна. Тэгэхээр өнөөдөр хүн заавал тийм олон хэл сурах шаардлагагүйгээр бусадтай зуун хувь ойлголцох бололцоо бүрэн байна. Өөрийгөө бусдад бүрэн ойлгуулж байж л амжилт олдог. Газраа ухаад биш. Хамгийн гол зүйл бол амьд харилцаа буюу хүнтэй хийх харилцаа шүү дээ. Хараад байхад Монголоос гарч ирж буй “start-up” бизнесүүдийн дийлэнх нь гаднын зах зээл рүү явъя гэхэд олон улсын харилцаан дээр очоод шууд гацдаг.
Жишээ нь монгол хүнд цахим орчинд монгол хэл шаардлагатай байсан учир “Чимэгэ” систем буюу суурь технологи нь гараад ирлээ. Үүнийг ашиглаад шууд орчуулга хийдэг технологиуд хөгжүүлж болно. Тэгэхээр энэ салбар бизнес, улсын эдийн засагтай шууд холбоотой. Нэг ёсондоо заавал “Чимэгэ” гэхгүй. Өөр технологиуд гарч ирээд оюуны экспортууд хийх бүрэн боломжтой.
Хиймэл оюун ухааны хувьд бол энэ салбар үсрэнгүй хөгжлүүдийг хийж байгаа. Тэр ч утгаараа дэлхий дахин энэ чиглэл рүү шуурч байна. Үүнийг хүмүүс их хэцүү, програмчлал, мэдээлэл технологийн салбарт суралцах шаардлагатай, математик суурь гээд шаардлагууд хэрэгтэй гэж ойлгодог. Мэдээж математик суурь сайтай хүн бол давуу талтай. Гэхдээ зориглоод ороод ирэхэд энэ бол огт боломжгүй салбар биш гэдгийг хэлмээр байна.
Энэ зууны гол хөдөлгүүр нь хиймэл оюун тул залуус хүссэн хүсээгүй энэ салбарт орж ирж байж санаа зовохгүй ажилтай, амьдралтай байх болов уу. Эс бөгөөс хүмүүс хүссэн хүсээгүй маш их ажлын байраа хиймэл оюунд алдана.
Барууны орнуудад хамгийн өндөр эрэлттэй мэргэжил бол программ хангамжийн инженерүүд байдаг. Цалингийн хувьд ч хамгийн өндөр. Мөн мэргэжлийн онцлогоосоо шалтгаалаад өөрийгөө хөгжүүлэх, өөрт болон гэр бүлдээ зарцуулах цаг зав ихтэй байдаг. Дээрээс нь хаанаас ч ажлаа хийх боломжтой.
Монголд программ хангамжийн инженерүүд маш их дутагдалтай байна. Тиймээс энэ салбарт дунджаас дээгүүр цалинтай. Дээрээс нь Монголчуудын сэтгэхүйд их тохирсон мэргэжил шиг надад санагддаг. Манайхан чинь юмыг их амарчилж, хялбар болгохдоо сайн шүү дээ. Гол нь манай залуус шантралгүй, тууштай энэ салбарт хүчээ үзээрэй.
-Ярилцлагын төгсгөлд, өмнө нь хүмүүс програмист гэхээр инженер биш компьютер форматалдаг, засаж янзалдаг хүмүүс л гэж ойлгодог байлаа. Одоо ч гэсэн тийм ойлголттой хүмүүс мэр сэр байдаг юм билээ. Гэтэл манай залуучууд өөрсдийн цэвэр нөөц бололцоогоороо маш олон зүйлийг хийж болох суурь технологийг хиймэл оюун ухаан ашиглаад бүтээчихлээ гэж дүгнэмээр байна. Зөв үү?
-Тийм, ер нь энэ бол оюуны хөдөлмөр. Хүмүүс оюуны хөдөлмөрийг үнэлж байгаасай гэж энэ дашрамд хэлмээр байна. Үүнийг бүтээхийн тулд маш их хөдөлмөр зарцуулдаг. Бүтээгдэхүүн гэж хэлэгдэх төвшинд хүртлээ маш олон зүйлийг туулдаг. Энд дан ганц програмистууд бус дизайнер, бизнес төлөвлөлт, маркетинг, хөрөнгө оруулалт гээд өөр олон зүйлс цогцоороо явж байдаг. Зүгээр нэг товчлуурыг хүртэл хэрэглэгчийн сэтгэлд тааруулахын тулд сэтгэл зүйч, дизайнер хоёр ажиллах шаардлагатай болдог. Том байх уу, жижиг байх уу, ямар дүрстэй байх уу, хэд орчим насны, ямар хүйстэй хүнд зориулагдах юм гэх мэт маш их судалгаа хийгдэнэ. Түүнийгээ төлөвлөөд бүтээн байгуулалтад оруулаад бүх төрлийн платформууд дээр гаргах шаардлагатай. Гар утас, компьютер, ухаалаг төхөөрөмжүүд гээд. Тэр бүр нь бас дотроо өөр өөрөөр үйлдлийн системүүдтэй. Тэгээд эцэст нь үргэлж сайжруулалт, арчилгаа хийж явах хэрэгтэй байдаг. Тиймээс оюуны өмч, оюуны бүтээлд хүндэтгэлтэй хандаж байгаарай гэж хүсмээр байна.
- Баярлалаа та бүхний нөр их хөдөлмөрт амжилт хүсье.
"Чимэгэ" системийг туршиж үзэх: Энэ холбоос дээр дарна уу.