1.중점 연구내용
본 연구의 목적인 인공지능 심리상담에 대한 기초자료 구축을 달성하고자 중점 연구내용으로 인공지능 심리상담에 관한 소셜 미디어 빅데이터 분석과 텍스트 질적 연구를 수행하고자 한다. 이를 통해 한국사회에서 심리상담 챗봇에 관한 대중 인식의 주 ...
1.중점 연구내용
본 연구의 목적인 인공지능 심리상담에 대한 기초자료 구축을 달성하고자 중점 연구내용으로 인공지능 심리상담에 관한 소셜 미디어 빅데이터 분석과 텍스트 질적 연구를 수행하고자 한다. 이를 통해 한국사회에서 심리상담 챗봇에 관한 대중 인식의 주개념, 질적 의미 , 소셜 네트워크를 밝힘으로서 4차산업시대에 등장한 상담의 새 유형인 인공지능 심리상담에 대한 통합적 논의로 이끌고자 한다.
연구의 이론적 민감성을 위한 전략으로는 첫째, 4차산업혁명의 학술적, 비학술적 담론을 검토하되 긍정적, 부정적 측면 을 아울러 살펴본다. 둘째, 연구학회와 챗봇 체험의 현장 조사를 진행하여 실천적, 질적 민감성을 유지한다.
2. 연구방법
본 연구는 1차년도 연구이며, 두 가지 방법론을 사용할 것이다. 첫째는 텍스트 마이닝을 통한 소셜 미디어 빅데이터 분석이다. 두 번째는 미디어텍스트 질적 분석방법이다.
1) 텍스트 마이닝을 통한 소셜 미디어 빅데이터 분석
(1)분석 도구와 연구 사례
자료 수집 및 분석을 위한 빅데이터 분석 도구로 한국어에 최적화된 ‘텍스톰’(textom)을 활용할 것이다. 텍스톰은 자연언어 처리 기술을 활용하여 소셜 미디어 상의 광범위한 비정형 텍스트 데이터를 수집, 분석, 정제를 통해 정형화하고, 특징을 추출하여 의미 있는 정보를 발견하도록 하는 텍스트 마이닝과 네트워크 매트릭스를 생성하여 분석을 돕는 빅데이터 분석 프로그램이다. 분석을 위해 대중적 인지도와 높은 사용율을 참고하여 테라피 챗봇인 워봇(Woebot)과 헬로우봇(hellobot)을 연구 사례로 선정할 것이다. 그 다음 선정된 인공지능 챗봇과 관련하여 페이스북, 블로그, 카페, 트위터에 생성된 텍스트들을 분석의 대상으로 삼아 텍스톰(textom)을 이용하여 빅데이터 분석을 하게 된다.
(2)분석방법 및 절차
1단계는 데이터 수집(Collecting)의 단계이다. 2017년 12월 31일부터 2018년 12월 31일까지 1년 동안 네이버와 다음에서 제공하는 블로그, 카페, 트위터 및 페이스북에서 ‘챗봇’, ‘chatbot’, ‘워봇’, ‘woebot’, ‘심리상담 챗봇’ ‘헬로우봇’, ‘hellobot’ 키워드로 텍스트 원자료(Raw date)를 수집한다.
2단계로 텍스트 마이닝(Text Mining)을 통해 관련 핵심단어 빈도분석을 하게 된다.
3단계에서는 단어와 관련 단어 간의 동시 출현 빈도와 단어 위치에 따라 방향성을 부여하는 방법인 N-gram분석을 할 것이다.
4단계로 감성분석(Sentiment analysis)에서는 도출된 주요 단어들에 대해 대중들이 갖고 있는 기쁨, 분노, 슬픔, 두려움 등의 보편적인 감성과 긍정적 혹은 부정적인 평가를 확인할 수 있게 된다.
5단계에서는 소셜 네트워크 분석을 위하여 연구자가 선택한 주요 정제된 단어 간의 공출현 빈도수로 작성된 유사도 계수의 매트릭스(Matrix)를 추출하여 소셜 네트워크의 정확한 수학적 수치를 확인하게 된다.
6단계는 중요 키워드의 시각화(Visualization)이다. 핵심단어들을 선택하고 워드 클라우드, 막대그래프, 에고네트워크를 작성하여 핵심 단어의 빈도수를 시각화하게 될 것이다.
7단계는 소셜 네트워크의 시각화(Visualization)이다. 동시출현 단어 간 연결정도
와 중심성을 분석하여 굵기와 화살표로 단어의 빈도와 흐름을 나타내는 네트워크 그래프와 네트워크 워드트리를 추출하게 된다.
8단계는 빅데이터 분석 결과에 대하여 이론적 민감성으로 해석하여 연구결과를 제시하게 된다.
2) 미디어 텍스트 질적 분석방법
이 단계는 미디어 수용자 분석방법(조항제, 2015)으로 인공지능심리상담에 대한 대중 인식의 주관적 의미를 이해하는 단계이다. 이를 통해 빅 데이터 분석결과가 미처 담아내지 못하는 질적 의미를 밝혀서 빅데이터 분석결과의 타당도를 높이고 텍스트를 생산하는 주체들이 현상에 어떤 의미를 부여하고 있고 공유하고 있는지에 대한 이해도를 높이고자 한다.
구체적으로 1단계는 소셜 미디어 빅데이터 수집 과정에서 각 채널의 세션별( 블로그, 카페, 페이스북, 트위터)로 수집된 원자료 데이터를 A4용지로 출력한다. 2단계에서는 출력한 원자료를 이론적 민감성을 유지하면서 직설적(literary), 해석적(interpretive), 성찰적(reflexive)으로 여러 번 읽는다. 3단계에서는 자료를 범주화(categorizing&coding) 하면서 주제별로 묶는다. 4단계에서는 각 범주에 대한 해석 및 설명을 한다.
3. 연구의 평가
첫째, 다양한 자료의 원천을 활용하는 삼각 검증법(triangulation)으로 신뢰성을 검증할 것이다(Strauss,A.,&Corbin J.,1988). 연구결과에 대하여는 ‘감시자’(Guba&Lincoln,1981) 평가로 비슷한 연구를 수행한 연구자 2명에게 자문을 받을 것이다. 둘째, 빅데이터 분석 결과와 질적 텍스트 분석 결과를 교차검증하면서 내용타당도를 확인할 것이다.