- (04427) 서울특별시 용산구 이촌로 46길 37, 4층 대한의학학술지편집인협의회
- +82-2-794-4146 +82-2-794-3146 office@kamje.or.kr
XML (Extensible Markup Language) 파일이 왜 학술지 출판에서 소중한가?
허선(한림의대 기생충학)
최근 학회와 특정 업체 사이에 XML (Extensible Markup Language) 저작재산권 문제로 다툼이 있고, 과거 학회가 지불한 경비로 XML 파일을 제작한 업체가 돌려 주지 않아서 소송을 고려하는 단체회원도 있다. 의편협에서도 이 XML 파일 저작재산권을 반드시 학회가 소유하는 것을 권장한다. XML 파일이 있어야 다양한 다른 양식 XML로 쉽게 변환되고, 앞으로 학술지 누리집에서 지금은 생각하지 못한 기능이 도입될 때 활용할 수 있기 때문이다.
과거 총회 석상에서 “Synapse XML은 그것을 제작한 업체 소유이고 그래서 결국 Synapse가 회사 것”라고 언급하며, 또한 “Synapse XML에 영업비밀이 있다”고 하였다. 이런 논리를 과거 일정기간 의편협 집행부에서 그대로 인정하였다. 그러나 이런 상황을 바로잡기를 많은 회원단체 편집인이 원하였다. 그러므로 제 9대 집행부는 특정 업체에 독점을 주는 것이 아니라 모든 회원단체를 위하여 과거 관행을 바로잡는 것을 사명으로 일하고 있다. 왜 이런 일이 과거에 벌어지고 오랜 기간 바로 잡지 못하였을까? 그것은 우리 의편협 임원진이나 편집인이 XML을 직접 작업하여 보고 그 의미를 생각하는 기회가 적어 대응 논리를 대지 못하여서라고 여긴다. 물론 이런 작업은 편집인이 직접할 것은 아니고 당연히 업체가 맡아서 한다. XML에 대한 간단한 이해를 한다면 이런 과거의 논리에 대응할 수 있었을 것이다.
XML이란 무엇인가?
https://ko.wikipedia.org/wiki/XML에 설명이 있으나, 조금 더 쉽게 설명하면 우리가 일상으로 보는 꽃나무가 있다고 하자.
벚꽃나무이고 꽃이 하얗게 또는 분홍빛이라는 것을 알 수 있다. 그런데 이 벚꽃이 원산지가 어디이고, 수령이 얼마이며, 뿌리는 얼마나 길게 나있는지는 눈으로 보아서 바로 알기는 어렵다. 우리는 이렇게 일상생활에서 보이는 것 이외 그 뒤에 속성이 있음을 알 수 있다.
길거리에서 늘 마주치는 사람이 있다. 관찰하면 남성이고 키는 대략 170-180 cm 사이이고, 양복은 회색을 입었고, 운동화는 흰색이라는 알 수 있다. 그런데 이 사람이 직업이 교원이고, 어느 학교에 근무하고, 고향이 어디이고, 어느 헬스장에 가서 운동하고, 어떤 음식을 선호하는지는 이 사람의 “속성”으로 눈으로 보기만 하여서는 알 수 없다.
우리가 컴퓨터 화면에서 늘 보는 문자는 HTML (hypertext markup language)이라는 형식의 문법으로 글자 크기, 색, 위치 등을 보여 준다. 그런데 논문을 읽을 때 문자를 읽지만 그 내용이 저자인지, 초록인지, 서론인지, 참고문헌인지, 참고문헌 중 잡지인지 단행본인지는 화면에서는 지정하여 표기하지 않는다. 즉 이런 것은 “속성”이다.
그러므로 XML에서는 보이는 것뿐 아니라, 보이지 않는 속성까지 표기한다는 장점이 있다. 또한 이런 표기 문법은 국제 표준을 따라 작성하므로 다른 형태 XML로 변환이 매우 쉽다.
HTML에서는 <font size=“10”> What is the XML?</font> 이렇게 크기 표시를 해 준다면 XML에서는
이렇게 속성을 나타내어 앞으로 다양한 데이터베이스에 검색을 쉽게 하고 활용할 수 있다는 장점과 더불어 일정한 문법에 따라 작성하므로 다른 형태의 XML에서 활용할 수 있기에 현재 web 전자 문서의 표준이 되었다. 데이터베이스에서 제목에서만 찾을 때가 있고 저자만 검색할 때가 있는데, 이 경우 XML 파일에서는 속성이 지정되어 데이터베이스에 입력도 편하고 데이터베이스에 입력하지 않아도 검색의 효율이 높다. 또한 호환성이 훌륭하여 Crossref XML, DOAJ XML, PubMed XML 등을 제작할 때 JATS XML에서 간단한 필터링 프로그램 (filtering program)을 사용하여 변환 가능하므로 이중 작업이 필요없다.
특히 과학 문헌에서는 Journal article tag suite (JATS) XML이라는 문법이 ISO 표준이 되어 학술지에서는 이 JATS XML로 제작하여 학술 논문 전문을 제공하는 것이 전세계 출판사의 표준이다. 이미 국내 학술지에서도 90% 이상은 이 JATS XML 제작하여 서비스하고 있다.
이 JATS XML을 만들어 서버에 올리며 CSS에 따라 우리 화면에는 다양한 형태로 보인다. 어떻게 보이게 하느냐는 CSS에 달려 있다. 또한 JATS XML 내에는 표준 tag 이외 사용자마다 자체적인 tag를 넣을 수 있다. 예를 들어 JATS XML 내에 다양한 XML tag을 같이 넣어서 보여 줄 수 있다. 즉, 확장성이 뛰어나다. tag는
우리나라 의학 학술지는 약 250종에서 JATS XML을 제작한다. 이미 이것은 학술지 누리집에서 표준이 되었기 때문이고, 국내 모든 회사가 이 제작 수준에 차이가 없다. 왜냐하면 이미 표준화된 문법이 있어 거기에 따르고 validation test (유의성 검정)를 거쳐 문법에 맞지 않으면 오류가 나기 때문이다. PMC XML이 발전하여 JATS XML이 되어서 같은 내용이다. ISO에서 PMC XML을 기반으로 JATS XML을 표준으로 설정하였다.
샘플 파일은 https://www.ncbi.nlm.nih.gov/pmc/pmcdoc/tagging-guidelines/article/style.html#samples에 있고, validation test는 https://www.ncbi.nlm.nih.gov/pmc/tools/xmlchecker/에서 할 수 있다. https://www.ncbi.nlm.nih.gov/pmc/tools/stylechecker/에서 조금 더 자세한 사항을 점검할 수 있다.
그러므로 학술지 웹사이트에서 전문 제공한다는 것은 어느 회사도 HTML 제작이 아니라 JATS XML 제작이며, 이 제작물은 모두 학회나 협회 등에서 경비를 제공하여 회사가 제작하여 학술지 홈페이지에서 보이도록 구현하는 것이다.
전문 JATS XML (PMC XML)을 우리나라 학술지 출판에 도입한 역사
2001-2002년도에 연구년으로 미국에 거주하면서 NCBI에서 2000년도부터 PMC 사업을 벌이는 것을 알았고, 초기 2종으로 시작하여 매년 100종씩 증가함을 관찰하였다. 귀국하자마자 이 PMC XML을 제작하고 싶었는데, 그때는 어느 업체에서 작업하는지 찾기도 어려웠고, 국내 업체도 찾을 수 없을 때였다. 지금 생각하면 등재된 학술지 편집인에게 편지를 보내어 어느 업체에 의뢰하는지 문의하였으면 간단하였을 것이다. 2005년부터 편집을 맡은 Journal of educational evaluation for health professions를 국내 투고가 워낙 적어서 연간 1 호 내는 것도 쉽지 않았다. 과감하게 2006년부터 영문으로 전환하고 어떻게 해서든지 PMC 등재시키는 것을 목표로 하였다. 2006년도 여름 방학이 시작하는 7월 모든 일을 미루고 오로지 PMC XML을 공부하여 일주일 만에 102개 tag를 이용하여 전문 PMC XML을 제작하고, 그때 변환 프로그램을 이용하여 HTML로 변환하고, 학술지 누리집에 띄어서 제작에 성공하였다. 이 내용을 우리 학술지만 적용시킬 필요는 없고, 국내 모든 영문지에 적용시켜 PMC 등재를 시켜야겠다고 마음먹고 당시 의편협 직원과 아르바이트생을 훈련시켰다. 물론 간단한 원리를 이해하면 전공자가 더 잘하는 법이다. 문외한인 의사도 제작하는 것을 full-time 작업하면 못할 리가 없다. 이후 DOI를 도입하여 2007년 8월호 대한안과학회지에서 처음으로 Crossref에 Crossref XML을 제작하여 DOI 기탁하고 2007년 11월 KoreaMed Synapse를 선보였다. 2008년 11월에는 국내 학술지 가운데 Journal of Korean Medical Sciences가 최초로 PMC 등재되었다. 이후 Korean Journal of Parasitology가 등재되고, 12월에는 MEDLINE 미등재 학술지로 Journal of Korean Neurosurgical Society가 최초로 등재되었다. Journal of Educational Evaluation for Health Professions는 2009년 2월 등재되어 이후 해외 투고 수가 늘어 발행을 유지할 수 있었다. 그 당시 우리나라 의학 학술지가 100종이 PMC 등재될 것이라고 언급하였는데, 지금은 120종 이상 등재되어 상업출판사 발행이 아닌 비영리 학회지만 따진 종수로는 우리나라가 PMC에서 일등 국가가 되었다. 지금도 국내 의학 분야 영문지는 모두 PMC 등재를 신청하여 등재 여부 결정을 기다리고 있거나 아니면 준비 중이다. 곧 150 종으로 늘어날 것을 기대한다.
맺는말
JATS XML은 학술지 출판에서 ISO 표준이 되었다. 이 XML은 그 효용도가 얼마든지 확장 가능하고, 새 서비스가 등장할 때 바로 적용시킬 수 있다는 장점이 있으므로 우리 회원단체는 모두 전문 JATS XML을 제작하여 학술지 누리집을 꾸미고 또한 Synapse에 참여하기 바란다. 이렇게 하여 전 세계에서 우리나라 문헌을 쉽게 찾아 인류 건강 증진에 기여할 수 있기 바란다. 또한 영문지인 경우 꾸준히 PMC 등재 노력을 하기 바란다. 이렇게 중요한 JATS XML 파일의 저작재산권을 학회가 소유하여야 함은 강조하고 강조하고 또 강조하므로 어느 업체와 작업하더라도 꼭 소유권을 명시하여 추후 누가 학회 대표나 편집인을 맡더라도 더 이상 손해 보는 일이 없어야 한다.