2

Language data produced by learners of foreign languages is called a learner's corpus. Among these, if the target of learning is Korean, it is referred to as a Korean learner’s corpus. A notable feature of the Korean learner’s corpus is that it is developed and provided by the government. This corpus is made available in its entirety with resolved copyright issues, and it also offers a web-based search tool that supports researchers. However, if there is no understanding of how the corpus was constructed, there is a critical risk that the research outcomes may lack credibility. Therefore, this study outlines precautions when using the Korean learner’s corpus. First, it is necessary to check the guidelines in the published report from when the corpus was created; second, it is important to identify features that are not stated in the report by using the search function of the corpus; and third, it is emphasized that users must make personal efforts to understand the characteristics of the corpus they are using.

  • Read count 2
  • Date of publication 09-05-2025
  • Main LanguageIngliz
  • Pages9-19
English

Language data produced by learners of foreign languages is called a learner's corpus. Among these, if the target of learning is Korean, it is referred to as a Korean learner’s corpus. A notable feature of the Korean learner’s corpus is that it is developed and provided by the government. This corpus is made available in its entirety with resolved copyright issues, and it also offers a web-based search tool that supports researchers. However, if there is no understanding of how the corpus was constructed, there is a critical risk that the research outcomes may lack credibility. Therefore, this study outlines precautions when using the Korean learner’s corpus. First, it is necessary to check the guidelines in the published report from when the corpus was created; second, it is important to identify features that are not stated in the report by using the search function of the corpus; and third, it is emphasized that users must make personal efforts to understand the characteristics of the corpus they are using.

Ўзбек

Chet tillarini o‘rganuvchi o‘quvchilar tomonidan yaratilgan til ma'lumotlari “o‘quvchi korpusi” (learner’s corpus) deb ataladi. Ulardan o‘rganish maqsadi koreys tili bo‘lganlari “koreys tili o‘quvchi korpusi” deyiladi. Koreys tili o‘quvchi korpusining xususiyati shundaki, u davlat (hukumat) tomonidan yaratilgan va taqdim etilgan. Ushbu korpus mualliflik huquqlari hal qilingan holda to‘liq ma’lumotlarni taqdim etadi va veb orqali izlash vositasi (Search Tool) bilan ta’minlangan bo‘lib, tadqiqotchilarga yordam beradi. Biroq, agar korpus qanday yaratilgani haqida “tushuncha” bo‘lmasa, tadqiqot natijalarining ishonchliligiga jiddiy shubhalar tug‘ilishi mumkin. Shu sababli, ushbu tadqiqotda koreys tili o‘quvchi korpusidan foydalanishda e’tibor berilishi lozim bo‘lgan jihatlar ko‘rsatib o‘tilgan. Birinchidan, korpus yaratilganida chop etilgan hisobotdagi “yo‘riqnomalar”ni tekshirish zarur; ikkinchidan, korpusni “izlash” orqali hisobotda ko‘rsatilmagan "xususiyatlar"ni aniqlash kerak; uchinchidan, foydalanuvchining korpus xususiyatlarini tushunishga bo‘lgan shaxsiy harakati muhimligi ta’kidlangan.

Русский

외국어를 배우는 학습자들이 생산한 언어데이터를 학습자말뭉치(learner’s corpus)라고 한다. 그중에서 학습의 목표가 한국어인 것을 한국어학습자말뭉치라고 하는데, 한국어학습자말뭉치는국가(정부)’에서 만들어서 제공하고 있다는 특징이 있다. 말뭉치는 저작권이 해결하여 전체 데이터를 제공하고 있으며, 웹으로 검색 도구(Search Tool) 제공하고 있어 연구자들에게 도움을 주고 있다. 그러나 말뭉치가 어떻게 만들어졌는지에 대한이해 없다면, 연구 결과가 신뢰를 받지 못하는 치명적인 문자가 발생할 수도 있다. 따라서 연구에서는 한국어학습자말뭉치를 활용할 때의 유의점에 대해서 제시하였다. 첫째, 말뭉치를 만들 발간된 보고서의지침확인이 필요하고, 둘째 말뭉치검색 통해서 보고서의 나타나 있지 않은특징 확인하는 것이 필요하며, 셋째 활용 말뭉치의 특성을 파악하기 위한 사용자 스스로의 노력이 필요하다는 것을 언급하였다.

Author name position Name of organisation
1 Choi Jeong D.. professor Koreya Respublikasi Keimyung universiteti
Name of reference
1 1. 국립국어원(1997), 『21세기 세종계획』, 국립국어원.
2 2. 국립국어원(1999), 『(21세기 세종계획)국어 기초자료 구축』, 국립국어원.
3 3. 국립국어원(2000), 『(21세기 세종계획)국어 기초자료 구축 분과 특수자료구축 소분과』, 국립국어원.
4 4. 국립국어원(2015), 『2015년 한국어 학습자 말뭉치 구축 지원 도구 개발 연구』, 국립국어원.
5 5. 국립국어원(2015), 『2015년 한국어 학습자 말뭉치 기초 연구 및 구축 사업』, 국립국어원.
6 6. 국립국어원(2016), 『2016년 한국어 학습자 말뭉치 기초 연구 및 구축 사업』, 국립국어원.
7 7. 국립국어원(2017), 『2017년 한국어 학습자 말뭉치 기초 연구 및 구축 사업』, 국립국어원.
8 8. 국립국어원(2018), 『2018년 한국어 학습자 말뭉치 기초 연구 및 구축 사업』, 국립국어원.
9 9. 국립국어원(2019), 『2019년 한국어 학습자 말뭉치 기초 연구 및 구축 사업』, 국립국어원.
10 10. 국립국어원(2019), 『형태 분석 말뭉치 구축』, 국립국어원.
11 11. 국립국어원(2020), 『2020년 한국어 학습자 말뭉치 기초 연구 및 구축 사업』, 국립국어원.
12 12. 국립국어원(2021), 『2021년 한국어 학습자 말뭉치 기초 연구 및 구축 사업』, 국립국어원.
13 13. 김한샘·최정도(2020), 『연구용말뭉치구축의기초』, 경진(도서출판).
Waiting