ЗАМОНАВИЙ ЛИНГВИСТИК КОРПУСЛАРНИНГ КОМПЬЮТЕР МОДЕЛЛАРИ
Abstract
Сўнгги вақтларда матн корпуслари дунё компьютер лингвистикаси (NLP) ва тилшуносликнинг турли соҳалари учун энг муҳим ўрганиш объектига айланиб бормоқда. Бироқ ўзбек тилшунослигида корпус билан боғлиқ жиддий амалий тадқиқотлар амалга оширилган эмас. Шу боис ушбу мақолада корпуснинг компьютер моделларини яратишга доир изланишларни таҳлил қилиш ва улардан унумли фойдаланиш учун эришилган натижаларни қиёсий ўрганишга эътибор қаратилган. Мақолада ўрганиш объектининг ўзига хос хусусиятлари ва фойдаланувчиларнинг турли мақсадларидан келиб чиқиб, электрон корпусларнинг шакллантириш босқичлари бир нечта корпусларнинг қиёсий таҳлили асосида ўрганилди. Таҳлил натижалари шуни кўрсатадики, матнга доир метамаълумотларнинг берилиши, лингвистик жиҳатдан аннотациялаш ва жанрлар таснифини мувофиқлаштириш барча корпуслар учун умумий жиҳатларидан биридир. Компьютер лингвистикасида корпус яратиш меъёрлари ва мезонларини аниқлаш кейинги тадқиқотлар учун муҳим лингвистик ресурс бўлиб хизмат қилади. Тадқиқотнинг натижалари асосида қуйидаги хулосага келинди: корпуснинг морфологик, синтактик ва семантик аннотациялари ёрдамида компьютер лингвистикасининг турли илмий йўналишларида дастурий таъминотлар (маълумотларни классификациялаш, маълумотларни қайта ишлаш, машина таржимаси, сентимент анализ) яратиш учун муҳим манба ҳисобланади.
Not yet translated