연구성과물검색
유형별/분류별 연구성과물 검색
HOME ICON HOME > 연구성과물 유형별 검색 > 보고서 상세정보

보고서 상세정보

https://www.krm.or.kr/krmts/link.html?dbGubun=SD&m201_id=10005260&local_id=10005730
한국어 분석프로그램(K-LIWC)개발과 신뢰도, 타당도 검증
이 보고서는 한국연구재단(NRF, National Research Foundation of Korea)이 지원한 연구과제( 한국어 분석프로그램& #40;K-LIWC& #41;개발과 신뢰도, 타당도 검증 | 2003 년 신청요강 다운로드 PDF다운로드 | 이창환(부산대학교) ) 연구결과물 로 제출된 자료입니다.
한국연구재단 인문사회연구지원사업을 통해 연구비를 지원받은 연구자는 연구기간 종료 후 6개월 이내에 결과보고서를 제출하여야 합니다.(*사업유형에 따라 결과보고서 제출 시기가 다를 수 있음.)
  • 연구자가 한국연구재단 연구지원시스템에 직접 입력한 정보입니다.
연구과제번호 H00007
선정년도 2003 년
과제진행현황 종료
제출상태 재단승인
등록완료일 2005년 03월 19일
연차구분 결과보고
결과보고년도 2005년
결과보고시 연구요약문
  • 국문
  • 영어권 국가에서 1990년대 중반에 개발되어 널리 사용되기 시작한 LIWC(Linguistic Inquiry and Word Count)라는 컴퓨터 프로그램은 사람들이 쓴 글을 72개의 언어관련 목록의 비율에 따라 분석하는 프로그램이다. 글분석 프로그램은 제한된 장면(예: 심리치료)에서 단어가 어떤 의미를 가지고 있는 내용단어(Content Word)를 중심으로 언어를 분석하였다. 예를 들어, 감정적인 단어의 비율이나 욕구 및 성취관련 단어의 비율을 계산하는데 초점을 맞추었다. 또한, 일부 기존 언어 분석은 글에 대한 주관적인 해석에 의존하였다. 이에 비하여 LIWC는 일상생활에서 자주 쓰는 3000 여 개의 단어들을 바탕으로 다양한 내용 단어 변인을 포함하였을 뿐만 아니라, 단어길이, 관사, 전치사, 문장 당 단어 수와 같은 언어학적(Linguistic) 변인들과 일인칭, 이인칭, 삼인칭 단/복수 대명사를 포함하는 대명사 관련 변인들을 중심변인으로 설정하였다. 또한 컴퓨터의 단어계산에 의해 각 변인에 해당된 단어의 비율이 정확하고 신속하게 산출이 되어 측정의 효율성이 극대화되었고 측정치의 객관성이 있다. 이러한 LIWC를 사용한 연구 결과, 언어학적 변인이나 대명사 변인에서 다양한 심리학 분야의 변인들이 유의미하게 반영되었으나 기존 연구와 같이 내용단어에서는 심리학적 변인들이 제한되게 반영되었다. 한국어 분석프로그램을 개발하는 과정은 이러한 영어권 분석프로그램을 단순히 차용하는 방식으로 이루어질 수 없고 선행되어야 할 연구내용이 방대하다. 첫째, 영어와 한국어 간 언어적 이질성을 고려하여 분석에 사용할 언어변인들을 선정하여야 한다. 영어권 프로그램에서 중요한 언어적 변인으로 고려하는 요소는 이른바 기능어(Functional word)인데 하나의 형태소가 독립된 어휘로 나타나는 비율이 높은 영어와는 달리 한국어는 여러개의 형태소가 교착하여 한 어절을 구성한다. 과거나 미래를 표현하는 선어말 어미, 격조사, 양태(modality) 표현, 부정 표현, 접속어 등이 모두 어간에 붙어 음절이나 음소 단위로 나타난다. 영어와 한국어 간 형태·통사적 이질성 이외에도 사회언어학적 차이도 존재한다. 예를 들어 LIWC에서 중요한 역할을 하는 대명사의 경우, 한국어에도 존재하나 존칭 어법에서는 2, 3인칭 대명사의 사용이 극히 억제되며 명사구의 반복이나 논항의 삭제가 빈번하다. 또한 한국어에는 1개 어간이 갖는 활용형의 수가 매우 많으므로 어절 단위에서 나타나는 동형이의형의 비율이 아주 높다. 따라서 한국어 분석 프로그램에서는 LIWC에 비해 매우 정교한 형태소 분석이 필요하다. 둘째, 영어와 한국어의 어휘가 사용하는 의미장이나 함의(connotation)가 다르므로 LIWC의 심리학적 변인으로 사용하는 어휘에 일 대 일로 대응하는 한국어 어휘를 찾기 어렵다. 심리학적 변인으로 사용할 수 있는 한국어 어휘 리스트에 대한 선행연구가 거의 수행되지 않았으므로 본 연구에서 도출할 어휘 리스트가 신뢰성을 가지려면, 영어와 한국어 간 어휘의 의미장에 관한 언어학적 연구 성과를 이용해야 한다. 셋째, LIWC 프로그램을 이용한 연구 성과는 눈에 띄나 소프트웨어 개발 관점에서 LIWC는 여러 가지 문제점을 가진다. 우선 자료의 갱신이 자주 이루어져야 하고, 다양한 자료 간 상호 관계가 복잡하게 연결되어 있는데 이를 제어 및 관리할 개발자용 프로그램이 없다. 또한 단순 사용자용 프로그램 역시 관계형 DB를 이용한 자료의 one-stop통제를 하지 못하고 일일이 사전 갱신 등과 관계 표현을 수동으로 해주어야 한다. 또한 StandAlone 기반으로 이루어진 프로그램이므로 여러 지역 간 공동 작업 등이 불가능하다. 따라서 한국어 분석 프로그램은 LIWC의 이러한 단점을 보완하는데 그치지 않고 더욱 지능적인 프로그램으로 설계하여야 한다. 이러한 과정은 추후 연구에서 언어분석을 통해 심리학 분야의 주요 변인을 연구하기 위한 전초적인 과정이며 영어권 결과와의 문화적, 언어적 비교를 수행할 수 토대를 마련하였다. 이와 같이 개발된 프로그램을 바탕으로 신뢰도와 타당도 분석은 2차년도에서 이루어질 예정이다.
  • 영문
  • LIWC is the computer language analysis program which was developed around mid-1990 at U.S.A.. Previous langauge analysis program focused on content words in limited situation(e.g., psychotherapy), calculating emotional words, need and achievment words. In contrast, LIWC focused on linguistic variables such as word length, articles, preposition, words per sentence based on about 3000 words that was used in daily life. In addtion, LIWC produce results exactly and very fast by computer word calculation. The previous research using this program suggest that only linguistic variables reflect various psychological variables but not content word variables. The process of developing Korean language analysis program can not be done just by borrowing English program, but there should be various consideration: First, Korean is concatenative langauge in which various morphemes are combined in a word. We should consider this kind of linguistic variation between two langauges. Also, there are various social and cultural differences between two languages except morphemic, syntactic differences. For example, Korean do not use first, second, and third pronouns often in a sentence, but delete them. Thus we should decide whether the program will recover them. Lastly, there are many homographs in various phrases, making us to analyze words more cautiously. Second, it is difficult to find Korean words corresponding one to one in English because semantic field and connotation are not same between two languages. Thus we should conduct research on semantic field and connotation in order to assign reliability on the variables. Third. LIWC is a very crude program in terms of its organization of software. Thus we developed a manager program that can connect various data, renewing existing data, and control its algorithm. Also we made the KLIWC as the public software that is installed on webspace, which can be accessed by any researcher simultaneously and fast. These processes provided basic stage for studing various psychological variables by langauge analysis, and provided basis to conduct research comparing cultural and linguistic factors between two langauges. The statistical reliability and validity test for this 1st version of KLIWC will be done in 2nd year of this project.
연구결과보고서
  • 초록
  • 심리학을 연구하기 위해서는 관련 변인의 조작에 따른 어떠한 형태의 인간의 반응이 있어야 한다. 주요 심리학 분야에서는 이러한 반응에 대응되는 종속측정치를 얻어내기 위하여 각종 검사나 면접을 실시하기도 하고 실험상황에서 반응시간이나 오류율을 측정하는 방법을 사용한다. 그렇다면 우리가 일상 생활에서 거의 끈임 없이 사용하는 언어의 방식이나 내용, 또는 언어적 처리는 그 광범위한 양이나 자연스러운 인간의 입력과 반응에 대응된다는 측면에서 심리학의 새로운 종속변인으로 사용될 수 있을지 의문이다.
    최근 심리학 연구에서 LIWC(Linguistic Inquiry and Word Count)라는 영어분석프로그램을 사용하여 사람들이 사용하는 언어적 양식을 종속측정치로 사용한 연구들은 괄목할만한 성과를 거두었다. 본 연구는 이러한 영어분석 프로그램을 원형으로 한국어의 특성과 문화를 반영한 한국어 분석프로그램(KLIWC)을 개발하기 위하여 실시되었다. 이러한 한국어 분석프로그램의 개발과정과 특성도 고찰하였고 프로그램의 추후 개선방향에 대하여 논의하였다.
  • 연구결과 및 활용방안
  • 한국어 글분석 프로그램의 개발과 신뢰성/타당성 검증은 단어사용과 같은 언어행동을 새로운 심리학 연구의 종속변인으로 사용할 수 있는지의 여부를 알고자 함이다. 다양한 심리 검사법이나 면접과 같은 기존의 연구 도구는 검사를 받는 사람의 왜곡된 보고와 검사자의 주관적인 해석이 가미될 수 밖에 없는 한계점을 가지고 있다. 그에 반하여 글분석은 글쓴이가 통제할 수 없는 무의식적인 글의 방식을 반영할 수 있으며 방대한 양의 글에 대한 측정치를 효율적이고 신속하게 얻어낼 수 있다. 그러므로 심리학 연구에서의 K-LIWC와 같은 언어분석 기법이 사용될 수 있는 근거가 제공된다면 언어분석은 주요 심리학 연구에서 기존 연구도구와 함께 수렴적인 심리 측정치를 제공하는데 광범위하게 사용되는 성과가 기대된다. 이러한 K-LIWC 개발의 거시적인 목적 외에 우리의 문자언어, 음성언어, 대화의 인지적 처리과정과 표상 체계를 밝히는 학문적인 목적이 있다. 실용적인 목적으로 간과할 수 없는 것은 임상장면에서의 진단, 상담 장면에서의 상담의 질 평가, 언어훈련프로그램개발, 영역별 인터넷 공간에서의 언어사용 양상, 범죄 수사 장면에서의 용의자 자술서 진위여부 분석(예 : 언어지문검사[Linguistic Finger Printing])을 비롯하여 글쓰기와 관련된 학교 상황에서의 교육적인 진단의 목적이 있다. 세계적으로 영어권 및 유럽의 다수 국가에서 학문 및 상업적 필요로 인해 언어분석 컴퓨터 프로그램 연구 및 모형 개발과 이의 응용이 상당한 수준으로 이루어지고 있음에도 불구하고, 한국어를 대상으로 한 심리학적 언어분석 프로그램이 국내에 전무하다는 현실은 이러한 연구의 의의를 보다 분명히 한다고 볼 수 있다. 중장기적으로 언어사용과 심리학 변인간의 관계성을 증명하는 현상 발견의 차원을 넘어서 축적된 본인의 연구와 영어권 자료를 바탕으로 주요 심리학 변인과 언어변인이 대응되는 심리 언어학적 모형(Psycho-Linguistic Model)을 제시할 계획이다. 이를 통하여 언어사용 방식이 어떤 심리적 기제에 의하여 작동되는지를 밝힐 수 있을 뿐만 아니라 언어사용을 심리학 연구의 종속변인으로 사용할 수 있는 범 언어적인 이론적 토대를 제공할 것으로 기대된다. 또한, 심리학 분야를 벗어나서 글이나 말을 분석대상으로 하여 쟁점이 되는 연구문제를 해결하거나 실용적인 정보를 제공할 수 있는 신문 방송학, 정치학, 사회학, 문헌정보학 등 다양한 사회과학 분야의 연구자들과의 교류를 통하여 공동연구를 추진이 기대되며 국어교육이나 영어를 포함한 이중언어 연구자들과의 K-LIWC나 LIWC를 활용한 교육프로그램개발이 기대된다.
  • 색인어
  • 한국어 분석 프로그램, 변인 선정, 심리학 단어 사전, 신뢰도, 타당도, 영어 분석 프로그램
  • 이 보고서에 대한 디지털 콘텐츠 목록
데이터를 로딩중 입니다.
  • 본 자료는 원작자를 표시해야 하며 영리목적의 저작물 이용을 허락하지 않습니다.
  • 또한 저작물의 변경 또는 2차 저작을 허락하지 않습니다.
데이터 이용 만족도
자료이용후 의견
입력