연속기획   “99년 연구회 체제”를 넘어 - 데이터 공유와 활용

데이터 기반 정책 연구의 시작은 인식 전환

진대용한국환경연구원  환경데이터전략센터 센터장 2023 여름호

최근 10년 동안 다양한 분야에서 데이터가 폭발적으로 증가하고, 지속해서 수집·저장·공유가 활발하게 이루어지고 있다. 시간이 지날수록 데이터가 축적되고 가치가 높아짐에 따라 활용의 중요성이 더욱 주목받고 있다. 정부는 국정과제로 ‘모든 데이터가 연결되는 ‘디지털 플랫폼’’을 제시하였다. 이는 단기적으로는 통합된 플랫폼 위에서 데이터 공유 및 개방을 통해 다양한 가치 창출을 도모하고, 중장기적으로는 데이터 중심의 미래 사회변화 대응을 위한 기반을 확보하기 위한 노력으로 판단된다. 일상생활 속에서도 다양한 형태의 데이터가 생산됨에 따라 초기 코로나19 대응 과정에서처럼 그 범위는 지속해서 확장되고 있다. 이런 큰 변화의 흐름에 맞춰 연구기관에서도 데이터에 기반하여 도출한 사실, 통계, 경향 등을 제시하는 등 투명하고 객관적인 의사결정 근거 확보의 중요성이 강화되고 있다. 최근처럼 불확실성이 증대되는 상황 속에서는 유연한 대응이 필요하며, 이를 위해서는 데이터 중심의 객관적인 정책 기반 확보가 필수적이다.

연구데이터 수집과 공유에 대한 논의

데이터는 의사결정에 필요한 근거를 제공하여 객관적인 판단을 가능하게 한다. 특히 정책연구에서는 정책 제안과 수립 근거 마련에 필수적인 요소이다. 하지만 데이터 구축에 많은 시간이 소요되고 문제 해결에 적합한 데이터를 찾기는 매우 어려운 실정이다. 따라서 데이터 공유 활성화를 통해 효율성 개선을 도모할 필요가 있다. 데이터 중심의 협업을 장려하고 더욱 투명하고 객관적이며 포괄적인 정책 결정을 촉진하는 등 연구 수행을 위한 기반 마련이 필요하다. 하지만 대부분 연구기관에서는 데이터에 대한 중요성은 인지하고 있지만 데이터 공유 및 개방의 필요성은 거의 논의되지 않고 있다. 특히 경제·인문사회 분야 연구기관에서는 더욱 그렇다. 많은 연구가 문헌 분석 중심의 연구로 이루어지고 연구자가 실제 측정기기를 통해 데이터 생산을 하지 않기 때문에 ‘우리 기관은 데이터 생산기관이 아니고 이용(수요)기관이기 때문에 데이터가 없다’는 인식을 가진 경우가 많다. 그러나 최근 설문조사, 패널 데이터, 공간정보 가공 데이터, 그 외 단순 그림·표까지 데이터 형태로 공개하는 사례가 늘고 있다. 또한 해외 주요 기관인 OECD에서 발간한 보고서에서도 그래프 및 입력 데이터에 대해 데이터 인용 인덱스인 DOI(Digital Object Identifier)를 부여해 상세 내용을 확인하고 필요에 따라 활용할 수 있도록 구성하고 있다. 이와 유사하게 한국과학기술정보연구원(KISTI)에서 구축한 국가연구데이터플랫폼인 DataOn(http://dataon.kisti.re.kr)에서는 연구과제별로 생산·활용한 데이터셋(Dataset), 그림·표를 공개하고 있다. 시간이 지날수록 데이터의 범위는 다변화하고 있고 데이터와 정보의 경계 또한 약화하고 있다. 이런 흐름에 맞춰 연구기관에서도 데이터의 범위를 제한하지 않고 다양한 형태로 구성된 데이터를 수집 및 공유하는 것이 필요하다.

데이터 공유, 어렵지만 시작해야

연구데이터를 수집 및 관리하기 위한 효과적인 방법 중 하나는 ‘연구데이터 관리 계획(Data Management Plan, 이하 DMP)’을 활용하는 것이다. DMP에는 데이터 이름, 설명, 데이터 형태, 공유계획 등에 대한 정보를 기술한다. 관리체계가 정립되지 않은 초기 단계에서는 연구데이터 범위가 명확하지 않은 경우가 많다. 그렇기 때문에 연구자의 중요성에 입각해 데이터 범위를 설정하여 수집·관리할 필요가 있다. 데이터 품질도 중요하지만 우선 데이터 수집에 초점을 맞춰야 한다. DMP는 연구에서 어떤 데이터를 활용하고 어떤 성과물을 산출할 것인지에 관해 연구 제안단계에서 미리 생각해보는 데 의의가 있다. 데이터의 사전 설계를 통해 보다 질 높은 연구가 이루어질 수 있도록 하고, 연구종료 시에 DMP에 근거한 연구데이터 산출물을 제출(업로드)하는 과정의 이행을 거치며 ‘데이터 수집’을 수행하는 것이다.

<그림> DMP 중심 데이터 관리 체계 주요 절차

원칙적으로는 정부 예산으로 수행한 모든 연구 데이터는 공공재로서 공개해야 하지만 현실적으로는 어려운 부분이 있다. 연구자는 데이터를 공유하기 위해 정리하는 등 많은 시간과 노력이 필요하며, 자신의 연구 노하우가 공개되어 학문적인 우위가 없어지는 부분에 대해 거부감이 있다. 또한 자신의 연구데이터가 검증대에 올라 신뢰도를 떨어뜨릴 수 있는 부분 등에 대해 못마땅하게 생각하여 형식적인 제출에 그치는 경우가 많다. 이런 연구자들의 인식으로 인해 질 높은 연구데이터의 공유는 쉽지 않다. 이런 문제를 해소하기 위해서는 데이터 생산 및 공유에 대한 연구보고서 등에 못지않은 충분한 한 개의 성과로 인정할 필요가 있다. 장기적으로는 연구기관 차원, 더 나아가서는 국가 차원에서 인력, 예산, 데이터 성과 인정 등 다양한 형태의 인센티브가 필요하다.

인식 전환 및 공유 문화의 정착이 필요

대부분 데이터의 수집 및 공유의 중요성은 인지하고 있으나 적극적으로 대응하고 있지 않은 상황이다. 하지만 미래사회 대응 및 시대 흐름에 맞춰 연구기관도 변화가 필요하다. 특히 국가 예산을 받아서 수행하는 연구에서 발생하는 모든 데이터는 공공재로 인식하고 공유하기 위한 노력이 필요하다. 질 높은 데이터의 생산 및 공유로 이어지도록 인식 전환 유도 및 문화 정착이 필요하다. 질 높은 연구데이터 축적은 적재적소의 정책 대응을 위한 기반으로 이어질 것이다.

초기 단계에서는 연구기관 내부 활용을 중심으로 시작하되 정착한 이후에는 대국민 대상으로 데이터를 개방하는 방향으로 체계 구축이 필요하다. 더 나아가서는 다양한 형태의 데이터 연계 서비스를 구축하는 등 수요자가 쉽게 참여할 수 있는 생태계를 구축해야 한다. 지식 창출 및 협업을 확산하는 데에 국책 연구기관으로서 역할과 책임을 다할 필요가 있다.

기사는 어떠셨나요?
이 기사에 공감하신다면 ‘공감’버튼으로 응원해주세요!

독자 여러분께 더 나은 읽을거리를 제공하는데 도움이 됩니다.

‘공감’으로 응원하기2