본문 바로가기
  • 노마드 인생
정보나라

암 빅데이터 구축 활용 연구

by 리뷰하는 김과장 2021. 11. 30.

Ⅰ. 연구 과제 개요

 

1. 사업 추진 배경

 

1) 사업 배경 및 필요성

 

전 세계적으로 다양한 영역에서의 빅데이터 활용 요구 및 시도 증대 - 정보화 사회로의 진입에 따른 데이터의 폭발적 증가, 데이터 구축과 분석을 위한 IT 기술 발달, 빅데이터 구축 및 활용 요구 증대 등으로 빅데이터가 미래가치 창출의 화두로 급부상 - 전 세계적으로 환경, 경제, 노동, 정책, 산업 및 기술 등 다양한 영역에서 빅데이터를 구축하여 사회문제 해결, 미래가치 창출, 위기관리, 경쟁력 확보 등을 성공적으로 실행한 사례가 있음 - 우리나라의 경우도 높은 IT기술 수준과 정부 3.0 구현 방침에 입각하여 다양한 영역에서의 빅데이터 구축 필요성이 검토되고 있으며, 일부 영역에서 빅데이터를 활용 사례가 제시되고 있음 질병 예방 및 관리를 위한 빅데이터 구축과 활용 사례 희박 - 빅데이터 활용 용이성 대비 잠재가치 분석 결과를 보면 보건의료 부문 빅데이터는 활용 용이성이 높고 경제적 측면에서 차지하는 비중이 커 활용에 따른 기대효과가 클 것으로 예측 - 국내의 경우 빅데이터 활용한 스마트 정부 구현안 에 따라 보건의료분야의 경우 건강한 사회 구현을 목표로 빅데이터를 활용하여 평생 질병예측 및 건강관리 프로그램 제공 추진 - 그러나, 실제적으로는 공공 데이터의 접근성이 떨어지고 데이터 간 융합이 어려워 활용에 한계가 있으며, 질병 예방 및 관리를 위한 빅데이터 구축과 활용의 실질적 사례 부족 질환 예방 및 관리를 위한 빅데이터 선도 사례 필요 - 민감 정보로 데이터 공개 비활성화, 데이터 유형 및 내용의 다양성, 비정형 데이터 추출 및 활용, 융합을 위한 데이터 표준화 문제 등으로 국내외에서 질환 예방 및 관리에 초점을 둔 빅데이터 구축과 활용 사례는 미비 - 질환의 중요도, 질환 정의 및 발생 유무의 명확성, 관리 체계 및 전략의 구체성, 구축 및 보유 자료의 포괄성 등으로 암은 만성질환 예방 및 관리의 모델 질환으로 자리매김 - 암 빅데이터 구축은 다른 질환의 빅데이터 구축을 견인할 수 있는 원동력 제공은 물론, 질환 중심 빅데이터 구축과 제공의 프레임워크에 대한 구체적 모델 제공 가능 암 질환 중요성 증대와 관련 정보 및 지식 축적에 따른 암 빅데이터 활용 요구 증대

 

- 국제암연구소(IARC) 보고에 따르면 2012년 대비 2035년 암환자는 70%증가한 2,400만 명, 2030년 암 사망자는 59% 증가한 1,300만 명으로 급격한 증가 추세를 보이며, 이에 따른 암의 질환 부담은 더욱 증가할 것으로 예측됨 - 암질환의 중요성에 따른 국민적 관심 증대, 질환 극복을 위한 기초, 임상, 역학 관리적 연구와 사업을 통한 데이터의 축적, 관리를 위한 정책적 판단을 위한 근거에 대한 요구 등은 암 관련 정형화 데이터 및 근거 지식의 산출과 누적 촉진 - 암 예방 및 관리에 있어, 빅데이터 구축 및 활용을 통하여 개인 맞춤형 서비스 제공, 미래 이슈에 대한 선제적 정책 대응, 신기술 및 신지식 기반 마련 및 활용, 잠재 가치 창출 및 경제성 향상 등을 현실화하고자 하는 기대 팽배 사회문제로서 암 인식 및 국가단위 해결 방안 제시 필요 - 전 세계 빅데이터 활용의 현황을 보면 단순한 의사결정과 비즈니스 영역 외에 현대사회가 직면한 사회 문제 해결에 주목하고 있으며, 건강문제는 가장 관심받은 사회문제의 하나로, 빅데이터의 활용을 통해 건강 관련 사회문제에 대한 해결책 제시뿐만 아니라 보건의료분야의 국가경쟁력 제고에 기여 - 개인 및 사회적 차원에서 암 예방, 진단, 치료, 재활 등 전 영역에 걸친 불확실성과 알려져 있지 않은 위험에 대한 보다 포괄적인 통찰 및 대응 방안 마련 필요성 제기 - 암은 개인뿐 아니라 사회 차원의 문제로 인식하고 포괄적인 해결 방안을 찾고자 하는 국민적 요구가 증대되고 정책적 입장이 강화되고 있는 시점에서 빅데이터를 활용한 암질환 극복 방안의 제시 절실 2) 관련 국내외 동향 가. 국내외 빅데이터 구축 및 활용의 사례 국내외 빅데이터 구축 및 활용 사례를 살펴보면 사회문제 해결, 미래가치 창출, 위기관리, 경쟁력 확보 등 다양한 영역에서 빅데이터 활용의 필요성을 인식하고 실질적인 활용을 통헤 직면한 사회 문제 해결은 물론 예방 시스템 구축에 이르는 성공사례들이 제시되고 있음

 

 

나. 국내외 보건의료 분야 빅데이터 구축 및 활용

 

국내

 

소셜 빅데이터를 활용하여 자살과 관련된 커뮤니케이션의 증감추이를 분석하고, 자살 검색에 대한 예측모형을 개발 암 발생 위험 및 예후에 대한 예측모형은 있으나, 암종별 암 발생 위험 및 예후 예측모형은 아직 부족한 실정이며, 개인 맞춤별 예측모형 및 진단, 치료, 재활 등에 대한 모형은 없는 실정임

 

미국

 

미국은 빅데이터 R&D 이니셔티브 를 통해 빅데이터 산업 전반의 활성화를 기하는 한편, 보건 의료분야 특히 질병 예방 및 관리 경우 국립보건원(NIH) 산하 연구소들을 통하여 다양한 빅데 이터 구축 및 활용 프로젝트 진행 중

 

미국 암등록연계 데이터베이스 (Cancer registry linked database) -SEER-Medicare linked database는 Medicare 보험자 중 암환자에 대한 자세한 정보를 제공하는 두 개의 대규모 데이터를 연결한 데이터베이스로 암환자에 대한 임상적, 사회 인구학적, 암 사망원인에 대한 정보를 수집하는 암 등록 프로그램인 SEER의 데이터와 Medicare에 등록되어 사망할 때까지 의료 이용정보를 포함하는 청구 데이터인 Medicare의 자료를 포함하고 있어 암 관련 연구와 정책 지원 자료로의 활용이 활발히 이루어지고 있음 -National Longitudinal Mortality Study (NLMS) and Linked SEER-NLMS databases 역시 사망 원인 정보와 미국 인구통계 총조사를 통해 수집된 사회 인구학적 데이터가 결합된 데이터베이스로 약 4백만 명에 대한 정보와 450,000건 이상의 사망원인 정보를 포함하고 있어 빅데이터로서의 활용성이 큼

 

다. 사업 추진 기반 여건

 

자료 연계 및 활용을 위한 법적 제도적 지원 가능성

 

개인정보보호 대상 자료의 통계적 학술적 이용 및 제공의 융통성 -1980년 회원국들에 의해 만장일치로 채택된 「OECD 프라이버시 가이드라인」의 프라이버시와 개인 정보 보호에 관한 국제적인 표준 8원칙과 우리나라 개인정보보호 원칙을 비교한 결과는 다음과 같음

 

 

OECD 표준지침 중 통계처리 및 학술연구 등을 목적으로 개인정보를 처리할 때에는 개인정보를 익명화 하여 이용 또는 제공하도록 하고 있으나, 익명성을 너무 엄격하게 요구하는 것은 바람직 스럽지 못하며, 연구자가 원본 데이터에 접근하지 못하도록 되어 있다면, 정보주체의 이름, 번지수 등만 제거해도 식별성이 없는 것으로 보아 통계처리 및 학술연구를 위한 이용을 허용하도록 하고 있음 「EU 개인정보 보호지침」도 역사적, 통계적, 과학적 목적을 위한 개인정보 처리는 국내법에 별 도의 적절한 보호조치가 마련되어 있는 한 당초에 고지하거나 수집한 목적과 달리 이용하더라 도 원래의 목적과 모순되지 아니한 것으로 간주하여야 한다고 규정하고 있음 국내 암 빅데이터 구축을 위한 법적 제도적 현황 현행 암관리법 등에는 자료의 연계를 위한 빅데이터 구축의 근거 및 구축 이후의 활용에 관한 세부 근거 내용이 직접적으로 명시되어 있지 않음 국제법 및 표준지침과 국내 전문가 자문의견에 따르면 국가 암 통계사업을 위한 자료 산출을 위하 여 암 등록 통계자료와 국가 암관리사업 자료를 병합하는 경우 병합을 위해 활용될 고유 식별정보만 을 연계하여 DB를 구축하고 이후 고유 식별정보를 삭제한다면 필요한 범위에서 최소한의 개인정 보만을 적법하고 정당하게 수집 처리하는 것(개인정보보호법 제3조 등)으로 판단됨 이는 향후 암 관련 빅데이터 구축과 활용 시 이해상충 관계가 없고 고유 식별정보의 익명화 작업을 수행할 수 있는 제3의 전문기관이 설립되고 각종 자료 연계 후 고유 식별 정보를 삭제하여 제공하는 체계

 

 

라. 암관련 연구 및 국가 암관리 정책 지원의 노하우 보유한 전문기관 암 관련 데이터 축적 및 데이터 생산 기반을 보유하고, 암 빅데이터 구축 시 물리적 융합 플랫폼으로써 역할 수행이 가능한 전문기관(국립암센터) 존재 국립암센터에는 다양한 분야의 암 전문 인력, 한국 중앙암등록자료를 비롯한 각종 암 연구 및 사업을 통한 대규모 데이터 축적, 데이터 관리와 공유 기반 확보, 생체시료로부터 유전체, 단백체, 대사체 등 정보 추출과 분석을 담당함으로써 새로운 데이터의 생산을 가능하게 할 코어 실험실 운영 등 빅데이터 구축에 용이한 인프라와 기술 보유 국립암센터 내 연구소, 병원, 국가 암관리사업본부를 두고 암 관련 연구, 임상, 정책 지원을 수행하고 있어 빅데이터 구축, 활용, 공개 등을 위한 기획과 관리에 있어 조화와 융합 및 효율성 달 - 8 - 성 가능 암 빅데이터 활용성 증대와 활용 확산의 핵심 요소인 인체유래물 관련 데이터 리소스가 될 수 있는 암중 심의 코호트와 종양은행 구축과 활용을 진행하고 있어, 향후 암 빅데이터 중장기 사업의 기 획과 추진에 중추적 역할 수행 가능 암 빅데이터 구축 기획 및 추진을 위한 자체 임시 조직을 구성하여 운영 중이며, 암 빅데이터 구 축 기획과 효율적 활용 방안 마련을 위한 시범사업적 성격의 연구 및 사업을 수행 중으로 빅데 이터 구축의 실질적 노하우 누적 중

 

 

마. 암 빅데이터 구축 타당성 점검 사업 수행

 

국립암센터 기관고유연구사업으로 암 성과 연구 수행 중 암 관련 정책에 대한 객관적 평가를 시행하고 이를 기반으로 수용성 높은 제도개선 방안을 도출하고자 함 국립암센터-국민건강보험공단-통계청 자료를 연계한 대규모 암 종합정보 DB 구축을 통해 정책 지 원에 필요한 다양한 기초자료 생성 암 관련 성과 연구 수행을 위한 자료의 연계와 활용

 

 

2. 사업 목적 및 범위

 

1) 사업 추진 배경 및 필요성에 따른 추진 목표

 

 

2) 중점 사업 범위 암 빅데이터 센터 설립 및 운영

 

암 빅데이터 효율적 운용 및 제공을 위한 센터 설립 및 역량 강화 시스템 및 인터페이스 고도화를 위한 연구개발과 적용 암 빅데이터 정보전산 인프라 및 프로그램 개발과 운영 하둡 기반의 유연성과 확장성 갖춘 데이터베이스과 운영 설루션 도입 비용효과성과 안정성 고려한 데이터 망 및 네트워크 확보와 개발 데이터베이스 수집, 융합, 공개 알고리즘 및 플랫폼 개발과 제공 암 빅데이터 활용 중점 추진과제 발굴과 수행 중점 추진과제의 발굴 또는 기획과 우선순위 설정 중점 추진과제의 수행 및 결과 환류를 통한 정책지원, 연구 및 진료 역량 강화, 개인 맞춤정보 제공 등 우리 사회 요구 대응과 문제 해결에 활용

 

 

3. 주요 사업 내용 및 방법

 

1) 사업 추진의 기본 방향 주요 선진국의 암관련 빅데이터 추진 전략 고찰을 토대로 미래 기술 개발 및 신지식 생산을 담 보하고, 빅데이터 활용 결과의 환류를 통한 새로운 데이터의 확보와 공유가 가능한 정보에 초점 공개 및 비공개 자료의 활용, 공공 및 민간자료의 연계, 개인정보 이용 등을 가능하게 할 수 있는 법적 제도적 기술적 지원 방안 마련 암 빅데이터의 체계적 구축 및 안정적 활용 지원, 관리 및 운용 효율화, 활용 이해 상충의 조정 등이 가능하도록 암빅 데이터 센터(가칭) 설립 및 운영 암 빅데이터 활용 목표 및 방향성과 구축 단계별 활용범위를 고려하여 관련 정보 인프라 구축 및 프로그램 개발이 유연하게 이루어질 수 있는 DB 및 시스템 환경 마련 접근성, 활용성, 지속성을 갖춘 공공 보유 정형화 데이터 우선 확보 및 활용, 이후 민간 보유 및 비정형 데이터 연계 활용 추진 질환 중심 빅데이터 특성과 활용성 극대화 방안으로 혈액 및 조직 등 생체시료 유래 정보인 유 전체 및 단백체 데이터 등과 연계형 빅데이터 구축 수행 암 분야에 있어 신지식 및 가치 재생산, 정책적 의사 결정, 국민, 의료기관, 의료산업, R&D 등 암 정보 수요 충족 우선 의과학 분야 미래 핵심 과학 기술 개발, 효율적 의사 결정을 통한 암 관련 문제의 해결, 일반 국 민에게 신뢰성 높은 스마트 정보 제공 가능한 영역의 데이터를 우선 선별하여 구축 및 활용 암 빅데이터로의 구축을 원칙으로 하되, 다른 보건 의료 분야 및 질환 관리에 활용 가능하도록 수집 데이터의 포괄성 및 공개의 융통성을 가지도록 구축

 

2) 중장기 추진 전략 및 내용

 

3단계 5년간의 단기 계획과 이후 각 5년간의 중장기 계획을 수립하여 지속적 연구과제 발굴과 지원이 가능한 빅데이터 구축과 운용 방안 마련 5년간의 초기 사업 수행 결과를 토대로 중장기 계획 추진방향의 타당성 점검 및 실행 계획을 구 체화하고, 중장기 사업을 통해 보완 및 확대를 통한 활용성 극대화 노력 수행 중장기 사업 수행을 통하여 공공 및 민간의 2차자료 활용체계 구축은 물론, 비정형 데이터의 수 집과 활용 방안 모색, 인체유래물 분석 결과 기반의 바이오 데이터를 포함하는 포괄적 암 빅데이 터 구축 추진 -암 연구 및 진료 정보, 각종 조사 모니터링 정보 등 정형화되어 있는 대규모 자료들의 연계와 비정형 정보의 탐색 및 추출 통한 확장 데이터 구축 추진 -국내 코호트 및 생체시료은행 보유 인체유래물 분석 결과 환류를 통한 암 유전체 등 오믹스 연구 기반이 될 데이터 구축과 활용 확산 추진 최종적으로 국내 다양한 빅데이터 또는 국외 유사 빅데이터와의 연계 활용을 통하여 보다 광범 위한 리소스를 확보 및 활용 목적 달성 암 빅데이터 구축을 위한 중장기 사업 추진 방향 및 내용의 영역별 기간별 예측은 다음과 같음

 


댓글