연구성과물검색
유형별/분류별 연구성과물 검색
HOME ICON HOME > 연구과제 검색 > 연구과제 상세정보

연구과제 상세정보

한국어 어종에 대한 음운론적 제약
The phonological constraints on Korean lexical subclasses
  • 연구자가 한국연구재단 연구지원시스템에 직접 입력한 정보입니다.
사업명 (B유형) 인문사회학술연구교수
연구과제번호 2021S1A5B5A17047632
선정년도 2021 년
연구기간 1 년 (2021년 09월 01일 ~ 2022년 08월 31일)
연구책임자 박나영
연구수행기관 서울대학교
과제진행현황 종료
과제신청시 연구개요
  • 연구목표
  • 본 연구의 목적은 한국어 화자가 어종을 판별할 수 있는 음운론적 제약을 찾고 그 심리적 실체를 구체적으로 밝히는 것이다.
    한국어 화자들은 고유어처럼 느껴지는 소리 연쇄, 한자어처럼 느껴지는 소리 연쇄, 외래어처럼 느껴지는 소리 연쇄에 대해 어느 정도 인식하고 있다. 다수의 연구에서도 한국어의 고유어, 한자어, 그리고 외래어가 음운론적으로 차이가 있다고 지적하였다. 일부 연구자(송기중 1992, 권인한 1997, 신지영 2009, 안소진 2009, 박나영 2015, 마야 아타예바 2016)는 고유어와 한자어의 구성 음소 분포를 기술하거나 한자어 특유의 음절 및 음운 규칙과 관련 음소배열제약을 밝혔다. 그리고 외래어까지 포함하여 한국어 어휘부에 대한 계층 구조도 제안되었다(채서영 1999, 이주희 2005, 박선우·홍성훈·변군혁 2013, 남성현·김선회 2018).
    다른 한편으로 한국어 화자가 어종 인식이 실재한다는 점도 조사되었다. 이광오(2003)는 한국어 화자가 어휘 판단 과제를 이용해 어종에 따라 단어 인지 수행 능력이 다룰 수 있다는 점을 밝혔다. 그리고 안소진(2014)은 범주판단과제와 어휘판단과제를 이용하여, 고유어 특유의 음운론적 특성에 더하여 의미의 ‘추상성/전문성’이 한자어 판단 기준으로 작용한다고 보았다.
    그러나 한국어 화자가 어종별 음운론적 제약을 습득하고 인식하고 있는지에 대해서는 충분하게 조사되지 않았다. 선행 조사(이광오 2003, 안소진 2014)는 실제 단어를 대상으로 진행되었기 때문에, 음운론적 특성의 영향을 알아보기 어려웠다. 더구나 선행 연구에서 밝힌 음운론적 특성도 개별 어종별로 기술되었을 뿐, 그 특성의 변별력 자체가 충분하게 조사된 것은 아니었다.
    이러한 배경에서 본 연구는 고유어, 한자어, 외래어의 음운론적 제약을 통계적 기법을 이용하여 총체적으로 밝히고, 음운론적 제약을 고려한 비단어를 생성하여 어종 판단 조사를 진행하고자 한다. 이를 바탕으로, 어종별 음운론적 인식에 대한 문법 학습 모델을 구현해 보고자 한다.
  • 기대효과
  • 전통적인 음운론 연구에서는 어종에 대한 음운론적 인식이 부수적인 것만으로 여겨졌다. 그러나 본 연구를 통해 어종에 대한 음운론적인 인식을 체계적인 문법으로 밝힘으로써, 한국어 화자의 음운론적 문법을 종합적으로 밝힐 수 있다. 나아가 일반 언어학적으로도 형태론적 정보가 관여된 음운론적 정보를 예외가 아닌 습득할 수 있는 문법으로 이해할 수 있도록 기여할 것이다.
    더불어, 본 연구 결과는 한국어 교육에도 활용될 수 있을 것이다. 일부 선행 연구(플리롱 2014, 이박문 외 2019 등)는 한국어 어휘 학습시 어종 정보를 인식하는 것이 필요하다는 것을 논의하였다. 본 연구의 결과는 제 2언어 학습자에게 어종 정보가 별도로 외워야할 것이 아니라, 단어 사용에서 충분히 알아차릴 수 있는 단서가 있다는 점을 시사할 것이다. 이를 바탕으로 제 2언어 학습자가 어휘 학습을 수월하게 할 수 있도록 기여할 것이다.
  • 연구요약
  • 본 연구는 (1) 고유어·한자어·외래어의 음운론적 제약 탐색, (2) 고유어· 한자어·외래어 판단 조사, (3) 어종 판단 인식에 대한 통계적 문법 학습 모델 구현으로 진행한다.

    -1단계: 고유어·한자어·외래어의 음운론적 제약 탐색
    [표준국어대사전](2020년 9월)에 실린 명사를 대상으로, 고유어, 한자어, 외래어의 음운론적 제약을 탐색하고자 한다.
    먼저, 고유어·한자어·외래어에서 두드러지는 음절구조를 탐색한다. 선행연구(안소진 2009, 마야 아타예바 2016, 배성봉·이광오 2019) 등에 따르면, 어종에 따라 단어를 구성하는 음절수와 음절구조가 상이하다는 것을 지적하였다. 이를 참고하여, 개별 어종의 음절수와 음절구조 유형을 조사한다. 그리고 이러한 음절 정보가 어종 간 변별에 얼마나 영향을 미칠 수 있을지를 통계적으로 예측해 보고자 한다.
    다음으로 개별 어종에 따라 음소배열제약을 탐색한다. 가장 널리 쓰이는 Hayes & Wilson (2008) 모델을 기준 모델로 삼아, 각 어휘부에서 회피되는 연쇄를 제약으로 포착한다. 이 Hayes & Wilson (2008) 모델은 음운론적 위배 형태에 비적형성 정도를 수치로 부여하는 모델로, 문법을 구성하는 제약 및 가중치는 어휘부로부터 귀납적으로 학습된다.
    그리고 학습된 제약이 고유어·한자어·외래어 판단에 얼마나 변별력이 있는지를 살펴본다. 예를 들어, 고유어 어휘부에서만 [모음] 연쇄를 회피하는 제약이 학습되었다고 가정하자. 이 때, [모음] 연쇄 제약이 고유어와 다른 어종의 변별에 영향을 주는지를 판단하기 위해서는 한자어와 외래어의 [모음] 연쇄가 고유어 어휘부에 비해서 얼마나 더 많은지를 파악할 필요가 있다. 본 연구는 자료 분류에 쓰이는 통계적 기법(예: 로지스틱 회귀분석, 의사결정나무 모델)을 이용하여, 개별 어휘부 제약의 변별력을 부여한다.
    한편, 어종을 미리 정하지 않고 소리 연쇄의 차이를 바탕으로 어종을 찾아가는 분류 방식도 시도할 예정이다. 만약, 어종에 대한 체계적인 문법이 실재한다면 언어 습득자는 의식적인 교육이 없이도 어종에 대한 단서를 찾아갈 수 있어야 한다. 이러한 문제 의식을 바탕으로 일부 연구(Shih 2017, Morita 2018, Morita & O’Donnell 2020)는 군집화 기법(예: 계층적 군집화, 베이지안 학습)을 도입하여, 소리 연쇄의 특징을 기준으로 어종을 나누었다. 이와 같은 연구 방법을 본 연구에 적용하여, 선제적으로 탐색한 음운론적 제약을 보완하고자 한다.

    -2단계: 고유어·한자어·외래어의 판단 조사
    한국어 화자가 [고유어]와 [외래어], [고유어]와 [한자어], [한자어]와 [외래어] 부류를 판단하는 조사를 각각 수행한다. 조사 참가자는 한자어의 학습 시작 시기와 학습 기간을 고려하여 10대, 20-30대, 50-60대로 나누어 구성할 예정이다.
    실험 자극은 (1) 음절수 및 음절구조 조건과 (2) 제약 위배[비위배형, 고유어 제약, 한자어 제약, 외래어 제약]를 조합하여 구성한다. 실험 절차는 참가자가 실험 자극을 듣고 단어의 어종을 양자택일한 후, 비단어가 해당 어종에 부합하는 정도를 1-7점 점수로 매기도록 한다. 이러한 절차는 온라인 인지 실험 프로그램인 ‘jsPsych’으로 구현할 예정이다.
    비단어에 대한 어종 판단 비율과 점수를 분석하고, 어종 변별력이 큰 제약과 약한 제약을 밝힌다. 그리고 이 결과가 1단계에서 사전을 대상으로 진행한 조사 결과와 어떤 점이 같고, 어떤 점이 다른지를 밝힌다.

    -3단계: 어종 판단 인식에 대한 통계적 문법 학습 모델 구현
    조사한 어종 판단 인식을 통계적 문법 학습 모델로 형식화하고자 한다. 이를 위해, ‘하위 어휘부 음소배열제약 모델(Sublexical Phonotactic Model; Becker & Allen 2015, Gouskova et al. 2015, Becker & Gouskova 2016)’부터 검토할 예정이다. 이 모델은 어휘 종류별 음소배열제약을 학습하는 방식을 제안하였으며, 본 연구가 추구하는 바와 일치한다. 그러나 해당 모델은 러시아어 등의 일부 굴절어의 활용에 대해서만 제한적으로 점검되었다. 본 연구는 ‘하위 어휘부 음소배열제약 모델’의 원리를 바탕으로, 한국어 어종 판단에 필요한 학습 기제를 탐색하고 적절한 음소배열제약 학습 모델을 제안하고자 한다.
결과보고시 연구요약문
  • 국문
  • 본 연구의 목적은 한국어 화자가 어종을 판별할 수 있는 음운론적 제약을 찾고 그 심리적 실체를 구체적으로 밝히는 것이다. 한국어 화자들은 고유어처럼 느껴지는 소리 연쇄, 한자어처럼 느껴지는 소리 연쇄, 외래어처럼 느껴지는 소리 연쇄에 대해 어느 정도 인식하고 있다. 이러한 문법 인식을 밝히기 위해 음소배열제약을 포함하여 어종의 특성을 다각도로 파악하였다. 각 어종의 음절 구조와 음소배열제약 변별성을 파악하고 어휘부 모델 중 하나인 ‘비교 음소배열제약’ 모델을 적용하였다. 자료는 『표준국어대사전』에서 용언(형용사, 동사)을 제외한 불변어, 그 중에서도 단일어로 삼았다. 그리고 실제 심리적 실재를 조사하기에 앞서, 선행 판단 조사 결과를 가지고 제약의 변별성을 일부 확인하였다. 더불어, 보다 적절한 판단 조사를 설계하기 위해 ‘상호 정보량(mutual information, Goldsmith 2002, 2011)’을 추가적으로 탐색하였다. 이를 바탕으로, 제약으로만 포착되지 않는 바를 파악하여 비단어(nonce word)를 생성하고 실험을 설계하였다. 이를 통해 고유어와 한자어뿐만 아니라 외래어까지 포함하여, 제약의 변별성을 총체적으로 조사할 수 있었다.
  • 영문
  • The purpose of this study is to find phonological constraints that Korean speakers distinguish between native words, Sino-Korean words, and loan words. Korean speakers are somewhat aware of segmental sequences that native words have, segmental sequences that Sino-Korean words have, and segmental sequences that loan words have. In order to explore this grammatical knowledge, lexical statistics , including phonotactics, are explored. The syllable structure and phonotactics on each lexical class are captured based on monomorphemic words in Korean Dictionary (National Institute of Korean Language 2020. 09, excluding verb and adjective). The constraints are formalized as ‘Comparative Phonotactic Model (Hayes 2016)’. In addition, the constraints are tested with the previous judgment survey. As a result, some of phonotactics are confirmed as distinctive constraints. To design a more appropriate judgment survey, 'mutual information (Goldsmith 2002, 2011)' was additionally explored. Based on this, nonce words are manipulated. Through these results, it is possible to comprehensively investigate the distinctiveness of constraints, including loan words as well as native words and Sino-Korean words.
연구결과보고서
  • 초록
  • 본 연구의 목적은 한국어 화자가 어종을 판별할 수 있는 음운론적 제약을 찾고 그 심리적 실체를 구체적으로 밝히는 것이다. 한국어 화자들은 고유어처럼 느껴지는 소리 연쇄, 한자어처럼 느껴지는 소리 연쇄, 외래어처럼 느껴지는 소리 연쇄에 대해 어느 정도 인식하고 있다. 이러한 문법 인식을 밝히기 위해 음소배열제약을 포함하여 어종의 특성을 다각도로 파악하였다. 각 어종의 음절 구조와 음소배열제약 변별성을 파악하고 어휘부 모델 중 하나인 ‘비교 음소배열제약’ 모델을 적용하였다. 자료는 『표준국어대사전』에서 용언(형용사, 동사)을 제외한 불변어, 그 중에서도 단일어로 삼았다. 그리고 실제 심리적 실재를 조사하기에 앞서, 선행 판단 조사 결과를 가지고 제약의 변별성을 일부 확인하였다. 더불어, 보다 적절한 판단 조사를 설계하기 위해 ‘상호 정보량(mutual information, Goldsmith 2002, 2011)’을 추가적으로 탐색하였다. 이를 바탕으로, 제약으로만 포착되지 않는 바를 파악하여 비단어(nonce word)를 생성하고 실험을 설계하였다. 이를 통해 고유어와 한자어뿐만 아니라 외래어까지 포함하여, 제약의 변별성을 총체적으로 조사할 수 있었다.
  • 연구결과 및 활용방안
  • 실제 연구는 음소배열제약을 포함하여 어종의 특성을 다각도로 파악하는 것에 초점을 두었다. 당초 계획에 따라, 각 어종의 음절 구조와 음소배열제약 변별성을 파악하고 어휘부 모델 중 하나인 ‘비교 음소배열제약’ 모델을 적용하였다. 그리고 실제 심리적 실재를 조사하기에 앞서, 선행 판단 조사 결과를 가지고 제약의 변별성을 일부 확인하였다. 더불어, 보다 적절한 판단 조사를 설계하기 위해 ‘상호 정보량(mutual information, Goldsmith 2002, 2011)’을 추가적으로 탐색하였다. 이를 바탕으로, 제약으로만 포착되지 않는 바를 파악하여 비단어(nonce word)를 생성한다. 어종의 특성은 『표준국어대사전』에서 용언(형용사, 동사)을 제외한 불변어, 그 중에서도 단일어를 중심으로 살펴 보았다. 이는 한국어에서 어종의 차이를 모두 확인할 수 있는 부류가 불변어이기 때문이며, 음소배열제약 지식은 기본적으로 단일어를 통해 정의되었기 때문이다.
    먼저, 단어를 구성하는 음절수와 음절구조를 파악하였다. 각 어휘부에서 두드러지는 특징을 통해, 음절수와 음절구조가 어휘부 변별에 기여할 가능성을 검토해 보았다.
    단어의 음절수별로 빈번한 구성만을 살펴보았을 때, 어종별 음절의 구성이 크게 다르지 않다. 이음절어에서는 ‘[음절두음][모음][음절말음].[음절두음][모음][음절말음]’, ‘[음절두음][모음].[음절두음][모음][음절말음]’, ‘[음절두음][모음][음절말음][음절두음][모음]’.‘[음절두음][모음].[음절두음][모음]’이 빈번하게 나타났다. 삼음절어에 대해서는 세 어휘부 모두 ‘[음절두음][모음].[음절두음][모음].[음절두음][모음]’ 구성이 많았다. 그 다음으로 후보 제약군 106개 중 단계적 로지스틱 회귀분석을 통해, 고유어와 한자어 변별 제약 86개, 고유어와 외래어 변별 제약 76개, 한자어와 외래어를 변별 제약 82개를 선별하였다.
    해당 제약을 살펴보면, 각 어휘부에서 모두 회피되더라도, 변별력을 띠는 제약도 포착되었다. 이를테면, 고유어와 한자어에서 연쇄 ‘[양순음][w]’가 모두 회피되지만, 변별력을 조사한 결과 고유어에서 보다 더 강하게 회피되는 것으로 예측되었다. 또한 다른 두 어휘부보다 상대적으로 선호되는 제약도 포착되었다. 본 연구는 기본적으로 각 어휘부에서 회피되는 제약을 중심으로 변별 제약을 탐구하였음에도, 이러한 제약이 포착되었다는 점이 흥미롭다.
    이상의 연구 결과를 바탕으로, 제약의 변별성을 직접적으로 반영할 수 있는 ‘비교 음소배열제약(Hayes 2016)’ 모델을 적용했다. 어휘부의 다수를 차지하는 한자어를 제외하고 어종의 예측 확률이 높지는 않은 편이었다. 그러나 각 어휘부 각각의 적형성을 고려한 모델보다는 높은 확률이 나타났다. 이러한 검토를 바탕으로 본 연구의 어종 판단 조사는 ‘비교 음소배열제약 모델’의 예측을 중심으로 설계하였다.
    어종 판단 조사에 들어가기에 앞서, 조사에 고려할 사항을 파악하기 위해, 선행 어종 판단 조사 자료(고유어와 한자어 판단)를 대상으로 제약의 변별성을 점검하였다. 위의 조사 결과를 살펴보면, 일부 변별 제약이 심리적으로 실재한다는 점을 알 수 있다. 그러나 인식 조사의 결과와 학습 제약의 결과가 일치하지 않는 경우도 있다.
    이와 같이, 사전과 실제 인식의 불일치는 관련 제약의 부재를 의미할 수도 있지만, 실험 단어에 포함된 선호 연쇄의 영향을 고려하지 못했기 때문일 수도 있다. 회피 제약으로 포착하기 어려운 어휘부 특징을 잡고자, 어휘부별로 연쇄의 ‘상호 정보량(mutual information, Goldsmith 2002, 2011)’을 추가적으로 조사하였다.
    이상 음절구조 정보, 상호 정보량, 그리고 음소배열제약을 종합적으로 고려하여 비단어를 설계하였다. 본 연구는 고유어와 한자어뿐만 아니라 외래어까지 포함하여, 제약의 변별성을 총체적으로 조사하였다. 이 과정에서 각 어휘부에서 모두 회피되는 연쇄더라도, 어휘부 간의 비교를 통해 특정 어휘부 변별 제약으로 설정될 수 있음을 살펴 보았다. 이러한 제약들은 ‘고유어, 한자어, 외래어’ 자체를 학습하는 단서가 될 수 있다. 최근 ‘일본어 어종에 대한 비지도 학습 모델(Morita 2018, Morita & O’Donnell 2022)’이 제안되었는데, 본 연구의 결과를 바탕으로 ‘한국어 어종에 대한 비지도 학습 모델’을 설계해 볼 수 있다.
  • 색인어
  • 어휘부, 어종, 고유어, 한자어, 외래어, 음소배열제약
  • 연구성과물 목록
데이터를 로딩중 입니다.
데이터 이용 만족도
자료이용후 의견
입력