연구성과물검색
유형별/분류별 연구성과물 검색
HOME ICON HOME > 연구과제 검색 > 연구과제 상세정보

연구과제 상세정보

인문사회 분야 연구성과물의 지식지도 형성을 위한 구조적 용어사전 지식베이스 구축
인문사회 및 복합학 분야 연구성과물의 지식지도 형성을 위한 구조적 용어 사전 지식베이스 구축
  • 연구자가 한국연구재단 연구지원시스템에 직접 입력한 정보입니다.
사업명 인문사회연구분야 토대기초연구지원 [지원년도 신청 요강 보기 지원년도 신청요강 한글파일 지원년도 신청요강 PDF파일 ]
연구과제번호 2012S1A5B4A01035131
선정년도 2012 년
연구기간 3 년 (2012년 09월 01일 ~ 2015년 08월 31일)
연구책임자 고영만
연구수행기관 성균관대학교
과제진행현황 진행중
공동연구원 현황 김비연(성균관대학교)
심원식(성균관대학교)
과제신청시 연구개요
  • 연구목표
  • 어떤 분야의 연구성과물을 체계적으로 분류하고 연구성과물 간의 연관 관계를 파악하기 위해서는 연구성과물의 주제 용어들을 추출하여 개념의 범주별로 분류하고, 추출한 용어의 내포적, 외연적 의미를 확장하기 위한 범주별 속성을 설정한 다음, 범주별 속성의 구조에 따라 해당 주제 용어 하나하나의 의미를 분석하여 정의한 이른바 ‘구조적 용어사전’의 구축이 필요하다. 더 나아가 구조적 사전을 토대로 범주별 속성 간에 나타나는 연관 관계를 부여하면 각각의 주제 용어가 속해 있는 연구성과물 간의 연관 관계를 네트워크 형식으로 조직하는 것이 가능하게 되고, 이렇게 규정된 여러 연관 관계로부터 공리를 찾아내고 추론규칙을 생성시킬 경우 의미적 연관 검색이 가능한 지식베이스가 만들어진다.

    연구문헌의 수가 빠른 속도로 증가하고 연구 주제 또한 복잡하고 다양해짐에 따라, 유사하거나 동일한 연구주제의 연구성과물 사이에 나타나는 의미적 연관관계를 파악하는 것은 오늘날 연구자들이 연구 수행에 앞서 반드시 해결해야 할 정보문제가 되었다. 연구성과물의 개념을 반영하는 용어 간의 의미적 연관성을 보여줄 수 있도록 구조적으로 학술용어가 정의되고 또 이를 토대로 연구성과물 간의 연관 관계가 체계적으로 조직되어 이를 파악하는 것이 용이하게 된다면, 연구자는 이러한 지식조직체계의 도움으로 까다로웠던 정보문제를 보다 쉽게 해결할 수 있을 것이다.

    그러나 지금까지 구축된 대부분의 인문사회 분야 용어사전은 해당 학문 분야의 전문용어를 단순하게 정의하는 형식을 취하고 있으며, 용어 간의 관계를 보다 상세하게 정의하기 위해 구축한 시소러스 역시 상위개념, 하위개념, 연관개념 만을 정의하는 조직체계 상의 한계를 지니고 있어, 학술용어가 지니는 풍부한 내포적, 외연적 의미를 수용하는 것이 불가능하다. 오늘날의 연구자들이 해결해야 할 정보문제인 해당 연구 분야의 학술적 이해형성을 지원하기 위해서는 단순한 구조를 가지고 있는 용어사전이나 시소러스와 같은 기존 지식조직체계의 한계를 극복하는 새로운 형식의 지식조직체계 즉 새로운 형식의 구조화된 용어사전이 필요하다.

    따라서 본연구는 인문사회(예술, 체육 포함) 분야의 학술용어를 범주별로 구조화된 속성에 따라 의미를 정의하는 구조적 용어사전 데이터베이스를 구축하고, 관련성이 있는 속성들에 대한 연관관계 설정, 용어간 관계술어의 상세화, 공리와 추론규칙 생성을 통해 연구성과물 간의 지식지도를 형성시킬 수 있는 지식베이스로 발전시키는 것을 목적으로 한다.

    연구의 목적을 이루기 위한 세부적 연구 목표는 다음과 같다 :

    첫째, 용어 정의의 구조화: 인문사회 분야의 용어를 수집, 분석하여 최상위 범주, 중위 범주, 하위 범주 등으로 분류한 다음, 각 범주의 속성을 설정하고 명세화 함으로써 용어 정의의 구조적 체계를 수립한다.

    둘째, 사전 구축기 개발: 인문사회 학술용어를 해당 범주별로 구조화된 속성에 따라 입력하고, 범주와 속성 및 관계의 확장 생성이 가능하며, 공동 작업을 할 수 있는 인터페이스를 갖춘 용어사전 구축기를 자체적으로 개발한다.

    셋째, 용어사전 데이터베이스 구축: 인문사회(예술, 체육 포함) 분야의 약 5.5만여 학술용어에 대하여 1개 용어 당 약 15-20 항목의 속성 값을 입력하는 구조적 용어사전 데이터베이스를 구축한다.

    넷째, 개념과 용어의 연관 관계 상세화 및 추론 규칙 생성: 범주별 속성 사이의 관 관계를 찾아내고, 학술용어 간의 의미적 연관관계를 표현하는 관계술어를 상세화하며, 용어의 의미관계 술어를 토대로 용어 간의 추론 규칙을 생성시켜 의미기반 검색의 토대가 되는 지식베이스로 발전시킨다.
  • 기대효과
  • 본 연구는 단편적으로 진행되어온 지식의 조직 체계에 관한 선행 연구의 시사점을 토대로 인문사회(예술, 체육 포함) 분야의 학술용어를 개념의 범주에 따라 구조화된 속성 값을 입력하는, 이른바 구조적 용어사전 데이터베이스를 구축하는 것이다. 그리고 범주의 속성들에 대한 연관관계 설정과 용어 간 관계술어의 추출 및 추론규칙의 생성을 통해 연구성과물 간의 지식지도를 형성시킬 수 있는 지식베이스로 발전시키는 것이 연구의 범위에 포함되어 있다. 본 연구의 결과가 학문적, 사회적으로 기여하는 바는 다음과 같다.

    1) 학문적 기여도

    ⟶ 본 연구를 통해 인문사회(예술, 체육 포함) 분야의 용어사전 지식베이스가 구축되면 무엇보다 이 분야 연구자들이 연구하고자 하는 주제와 관련된 연구성과물의 지식지도를 파악할 수 있게 된다. 이를 통해 연구자는 유사하거나 동일한 연구성과물 사이의 의미적 연관관계를 이해하는 것이 용이해지고, 연구하고자 하는 분야에 대한 학술적 이해 형성이 신속해질 것이며, 이는 결국 국내 인문사회 분야의 연구력 증진에 직접적 영향을 미칠 것이다.

    ⟶ 본 연구는 20여만 개에 달하는 용어의 수집과 주요 용어 추출, 사전의 용어 정의 체계 구조화, 용어사전 데이터베이스의 구축, 개념과 용어 간의 연관 관계 분석 등 논리적 분석과 체계화 및 데이터베이스 구축에 소요되는 시간과 노력, 비용 등의 한계로 인하여 용이하게 시도될 수 있는 연구과제가 아니다. 따라서 지금까지의 의미기반 검색 분야의 연구는 대부분 소규모의 테스트 용 지식베이스를 구축하여 검증한 결과이거나 아니면 시범적 시스템의 개발에 머물렀다. 본 연구의 종료 후 연구결과물인 용어사전 지식베이스가 공개될 경우 의미기반 검색 분야에서 실제적 연구를 할 수 있는 토대가 될 것이며, 창의적이고 실용적인 후속 연구가 획기적으로 활성화 될 것이다.

    ⟶ 본 연구는 연구자의 학술적 이해형성을 지원하기 위한 구조적 학술용어 사전 구축에 관한 새로운 방법론을 제시하는 것이다. 또한 인문사회 분야의 구조적 학술용어 사전 데이터베이스를 구축하고 이를 의미 검색이 가능한 지식베이스로 발전시키는 본 연구의 진행 절차 및 사전의 구조화 방법론은 다른 학문 분야에서도 거의 유사하게 적용될 수 있다. 따라서 본 연구의 결과는 새로운 지식조직체계에 관심 있는 연구자들이 관련 연구에 쉽게 적용할 수 있게 되는 촉매 기능을 할 것이며, 타 분야에서의 연구와 구축 작업에 드는 노력과 시간 및 비용의 절감에 많은 기여를 할 수 있을 것이다.

    2) 사회적 기여도

    ⟶ 본 연구의 결과로 구축될 인문사회(예술, 체육 포함) 분야 구조적 용어사전 지식베이스는 공공성을 지니는 모든 기관에 공개될 것이다. 인문사회 분야의 연구 기관 및 학술정보서비스 기관에서는 본 연구에서 구축된 용어사전 데이터베이스를 해당 기관의 목적에 따라 응용해서 사용함으로써 보다 향상된 서비스를 제공할 수 있을 것이며, 더 나아가 본 연구는 중복 노력의 감소와 표준화 촉진의 기반으로 작용할 것이다.

    ⟶ 본 연구결과는 새로운 개념의 학술정보서비스 인프라 구축의 기초자료로 활용될 수 있을 것이다. 현재 제공되고 있는 국내 학술 정보 서비스의 대부분은 2000년대 초반의 사회적, 기술적 토대에서 구축된 것으로, 오늘날의 연구자들이 필요로 하는 해당 연구 분야 연구성과물 간의 연관관계 파악을 지원하지 못하고 있다. 본 연구 결과는 오늘날의 연구자들이 필요로 하는 연구 분야의 학술적 이해 형성과 관련 연구의 지식지도 형성을 지원하는 시스템 개발의 기반이 될 것이다.

    3) 연구 결과 활용 방안

    ⟶ 본 연구의 결과물인 용어사전 데이터베이스는 한국연구재단이 일관성 있는 결과물 관리를 위해 요구하는 제출 기준에 따라 Well-Formed 유니코드 형태의 XML 데이터 원본을 용어사전의 기본 데이터로 제출한다. 또한 XML 구조를 참조하여 조회할 수 있는 XML 스키마 및 데이터 구조의 참조를 위한 RDBMS의 데이터베이스 원형도 ERD와 함께 제출할 것이다. 한국연구재단은 기초학문자료센터(KRM), 한국학술지인용색인(KCI), 한국연구업적통합관리시스템(KRI)에 본 연구 결과로 산출되는 구조적 용어사전 지식베이스를 접목시켜 시스템 고도화에 활용할 수 있다.

    ⟶ 본 연구는 또한 OpenAPI를 통한 XML 형태의 데이터서비스를 제공함으로써 구축된 용어사전 지식베이스를 일반에 공개할 예정이다. 이럴 경우 인문사회(예술, 체육 포함) 연구기관 및 관련 학술정보서비스 기관에서는 이 지식베이스에 추론 검색엔진 등을 장착하여 해당 기관의 서비스 시스템에 활용할 수 있게 된다. 다만 안정적인 OpenAPI 연계 서비스를 위하여 기본적 관리 기능을 통해 인증된 연구기관 및 개인에게 서비스를 제공하는 것을 원칙으로 한다.
  • 연구요약
  • 인문사회(예술, 체육 포함) 분야의 구조적 용어사전 데이터베이스를 구축하기 위한 본 연구는 크게 사전의 구조 설계, 사전 데이터베이스 구축, 지식베이스 구축의 세 단계로 나누어진다.

    1) 첫 번째 단계의 사전 구조 설계는 수집된 학술용어의 개념을 범주화하고 각 범주의 속성을 도출하여 용어를 구조적으로 정의할 수 있는 틀을 만드는 것이다.

    ⟶ 학술용어의 수집: 한국학술지인용색인(KCI) 논문 키워드, 경제인문사회연구회 소속 연구기관의 연구보고서 키워드, 한국역사용어 시소러스, 국회도서관 표준시소러스, 법원도서관 시소러스로부터 용어를 수집한다. 최초 수집한 약 22만 용어에서 중복 용어를 제외한 약 8만에서 10만 용어부터 최종적으로 사전 구축 대상 5.5만 여 중요 어휘를 추출한다.

    ⟶ 학술용어의 개념 추출: 분류이론과 선행연구에서 제시된 지식체계를 이용하여 최상위 수준의 개념을 설정하고, 이를 인문사회 분야의 기본개념 범주(또는 패싯)로 삼아 중하위 개념을 추출한다.

    ⟶ 학술용어 개념의 범주화: 개념의 체계를 정립하고 하위개념을 범주화하며, 개념 속성을 도출하고 명세화한다.

    2) 두 번째 단계의 사전 구축은 범주화된 개념과 그 속성을 토대로 사전 구축기를 개발하고 사전 데이터베이스를 구축하는 것이다.

    ⟶ 학술용어의 범주별 분류: 중복 용어를 제외하고 용어의 정제 과정을 거쳐 추출된 사전 구축 대상 5.5만 여개의 용어를 범주별로 분류하며, 분류 결과에 대하여 최종적으로 전공별 자문 교수의 검증을 받는다.

    ⟶ 사전 구축기 개발: 사전의 구조에 대한 분석을 통해 웹상에서 공동 작업이 가능한 사전 구축기를 개발한다. 이때 개념 범주의 속성에 대한 관리가 용이하고 외부 반출이 가능하도록 사전 구축기를 설계한다. 연구보조원들은 사전 구축기가 제시하는 입력화면의 학술용어의 범주별 속성에 따라 용어 하나하나에 대한 속성 값을 입력함으로써 사전 데이터베이스를 구축해 나간다.

    ⟶ 용어 사전 데이터베이스 구축: 용어 사전 데이터베이스의 구축은 ‘용어선정->용어기술->동등관계설정->주제분야설정->범주설정->개념속성구축->검수’의 순서로 진행하는 것을 원칙으로 한다. 그러나 학술용어의 개념은 용어 간 관계 추가, 용어 자체의 개념 변화, 새로 생성되는 학술용어의 추가, 연구성과물과의 관계 추가 등에 따라 그 범위와 상태가 계속 변화한다. 따라서 전체적인 용어 품질 및 사전의 논리적 일관성을 유지하기 위하여 용어선정에서 검수에 이르는 일련의 순환 과정을 지속적으로 반복한다. 그리고 본 연구에서는 개념속성구축 과정에서 한국연구재단의 연구지원 사업을 통해 제작된 용어사전을 저작권 침해가 이루어지지 않는 범위 내에서 참조한다.

    3) 세 번째 단계는 개념과 용어의 관계 유형을 상세화하고 이를 토대로 공리와 추론 규칙을 생성함으로써 데이터베이스를 지식베이스로 발전 시키는 것이다.

    ⟶ 개념 범주와 범주의 속성 간 연관관계 상세화: 특정 범주의 속성과 다른 범주의 속성을 연결하는 연관관계를 분석하여 그 유형을 상세화한다.

    ⟶ 용어의 계층관계 상세화: 용어의 계층관계는 특정 용어의 문자열이 다른 용어의 문자열에 완전히 포함될 때 이를 계층관계로 규정하는 조어적 기준과 용어가 갖는 의미로 판단하는 의미적 기준에 따라 규정할 수 있다. 본 연구에서는 의미적 기준에 따라 계층관계를 규정하는 것을 원칙으로 하며, 시소러스의 계층관계에서 적용하는 세 가지 유형의 의미적 계층관계, 즉 종속관계, 전체/부분 관계, 특정개념의 사례 관계를 토대로 다음과 같은 형식으로 상세화한다: [종속관계 -> "공권 includesSpecific/isA 형벌권"], [전체-부분관계 -> "피 containsSubstance 혈청"], [사례관계 -> "해(海) hasInstance 발틱해[--海]"]

    ⟶ 용어의 연관 관계 상세화: 2개 이상의 용어가 동등관계나 계층관계는 아니지만 개념적으로 서로 관련을 맺고 있을 경우가 있다. 시소러스나 온톨로지에 관한 선행연구에서 제시되는 용어의 연관관계 유형은 대체로 개념적, 물리적, 기능적, 공간적, 시간적 연관관계로 구성되며, 이는 랑가나단의 패싯(특성, 재료, 기능, 공간, 시간)에서 기인하는 것이다. 본 연구에서는 다섯 가지 유형의 연관관계를 기준으로 상세하게 명세화 함으로써, 의미 관계의 추론에 필요한 풍부한 관련성을 제공한다.

    ⟶ 공리 및 추론규칙 생성: 구조적 용어 사전 데이터베이스에 구축된 인문사회(체육, 예술 포함) 분야 학술용어 간에 부여된 계층관계와 연관관계의 술어를 토대로 가능한 공리를 도출하고 추론 규칙을 생성한다. 이 과정에서 관계 유형의 확장 가능성을 검토하고 또 필요가 있을 경우 보완하도록 한다.
  • 연구성과물 목록
데이터를 로딩중 입니다.
데이터 이용 만족도
자료이용후 의견
입력