정보를 체계적으로 잘 정리해서 컴퓨터가 읽어낼 수 있는 형식으로 담아둔(축적해둔) 것을 데이타베이스라고 한다. 필자 는 쓸모가 있는 데이타베이스를 만들어 컴퓨터로 척척 찾아내는 시스템을 만들어 보고 싶었다. 1969년의 일이었다. 처음으로 알게 된 데이타베이스는 의학분야의 MEDLARS란 이름을 가진, 미국 국립의학도서관이 만들기 시작한 것이었다.
1970년경이던가, 미국 국립의 학도서관에 어느 동료가 편지를 보냈지만, 한국의 의학정보 사정을 보아 아직도 과학정보를 컴퓨터에 축적하는 것은 고려할 수 없다는 답변을 받고 자존심이 무척 상했다는 이야기를 들었다. 사실 당시만 해도 국내에서 생산되는 의학 분야의 논문은 '어떻게 하면 다른 일반 사람이 읽을 수 없게 어렵게 쓸 것인가?'를 연구해서 쓴 것처럼, 아무도 이해할 수 없는 눈문집만 겨우 몇 가지 발행되었다.
나중에 안 사실이지만, 세계적인 데이타베이스라고 할 수 있는 화학초록{Chemical Abstr- acts)은 1970년부터 축적하기 시작하였다고 하며, 이 해보다 한두해 전에 의학정보가 축적되기 시작하였다고 한다.
미국 연방정부가 돈 들여서 만든 데이타베이스 Medlars의 상업적인 온라인 서비스는 한국에서는 성공적으로 이용되지 않았다. 그러나 화학초록지인 Ch- emical Abstracts는 비교적 국내에서 이용될 조짐이 보였으며 이용도가 훨씬 높았다. 그런데 웬만한 학술단체들은 이 무렵부터 데이타베이스 제작에 유행처럼 달려들기 시작하였다.
한편, 정보검색 시스템이라는 소프트웨어를 만들어서 각종의 데이타베이스를 수집, 축적해서 상업적인 온라인 정보검색 서비스를 개시하였다. 당시에는 록히드(Lockheed)비행기 회사에서 미국방성의 정보시스템 개발 용역을 받아서 운영하던 시스템을 그대로 상용화하기 시작하였다. 거의 동시에 미국의 유명한 싱크탱크(Think Tank)였던 랜드(RAND)회사가 개발했던 ORBIT란 이름의 정보검색 시스템을 운영하기 시작하였다. 몇년 후에는 IBM이 개발한 STAIRS란 이름의 시스템을 개선하여 운영하기 시작한 조그만한 BR S라는 회사가 미국의 동부에 있는 뉴욕주의 자그마한 도시에서 서비스를 개시하였다.
이상의 3개 시스템은 모두가 ‘문헌정보 검색시스템’으로서 서로가 경합 상태에 들어가 있었다. 동부의 BRS는 서부의 2대 경쟁회사보다 짭짤하게 이용한 이유는 동부에 있는 이용자가 장거리전화로 서부까지 연결하기가 부담이 된다는 이유로 동부의 대학 교수들 거의 모두가 동부의 것을 사용하였기 때문이다. 곧 이어서 Telenet, Tymnet 등과 같은 공중데이타망(PDN)이 생겨서 그러한 부담이 없어지게 되었다.
이때부터 국가 데이타뱅크를 만들어야 한다는 의견을 제시하였으나 좀처럼 이루어지지 않았다. 국내에는 컴퓨터다운 컴퓨터도 별로 없던 시대였다.
이때부터 고민에 빠졌다. 먼저 어느 것부터 착수할 것인가 였다. 전세계의 정보 소스를 확보하는 길로 나아갈 것인가? 아니면 국내의 정보를 전자화해서 축적할 것인가? 두 마리의 토끼이다. 이때 미국의 Chemical Abstracts 데이타베이스를 시험삼아 구입해서 그 내용을 분석하여 보기로 하였다. 분석하여 본 결과 저자명,제목,서지 사항, 초록 등등 모든 데이타 요소가 표준규격화되어 있었다.
1974년의 일이었다. 국제원자력기구{IAEA)가 주관하는 국제 원자력정보시스템(INIS) 세미나의 초청장이 왔다. 장소는 룩셈 부르크. 세미나의 내용은 원자력 분야 연구논문의 데이타베이스를 만드는 방법, 이것의 온라인 정보검색방법 등을 교육하는 과정어었다. 바로 이 과정이 나의 인생 항로를 바꾸어버린 대단히 효과적인 교육이었다.
이 세미나가 끝나자마자,바로 영국으로 갔다. 여기서 영국에서도 훌륭한 데이타베이스가 이미 상당수 만들어져 있다는 것을 알았다. INIS의 상당 부분도 영국에서 만들어지고 있었으며, 가장 마음을 끈 데이타베 이스는 INSPEC이라는 물리전기전자 데이타베이스였다. 또한 ISMEC이라고 하는 기계금속 분야 데이타베이스, Derwent 출판사가 제작하고 있던 세계특허 데이타베이스.
당시, 근무하던 한국과학기술 정보센터 (KORSTIC)의 예산으로서는 도무지 한두가지도 구입 할 수 없었다. 이들 데이타베이스를 어떻게 입수할까? 당시 영국 방문 성과는 데이타베이스를 구입하고 싶다는 욕심을 충동한 것밖에 없었다. 귀국하기 전에 다시 오스트리아 빈에 있는 국제원자력기구의 본부를 방문하였다. 여기에서 나름대로 성과를 거두었다.
“지금까지 INIS 데이타베이스가 자기테이프로 몇 권(릴)이나 됩니까?'
'1200BPI짜리 자기테이프로서 모두 50개 릴이나 됩니다.”
“그걸 모두 복제하려면 돈이 얼마나 소요됩니까?'
“그냥 일반인에게는 복제해 드릴 수 없어요. 한국이 국제원자력기구의 회원국이므로 당사국 대사의 공식적인 요구가 있으면 복제를 해드릴 수 있지만 복제 실비는 내야 합니다.”
“공식적인 요구를 할 터이니 복제 실비가 얼마나 들 것인지 알려 주십시오. '
“공테이프값이 20불이므로 모두 1,000불쯤 됩니다.”
당장에 비엔나주재 한국대사관에 가서 한표욱 대사를 만나 사정 이야기를 했다. 과학담당관을 불러서 협조를 하도록 지시가 있었다. 공식요구를 서신으로 보내는 것을 보면서 귀국하였다. 그러니까 적어도 1,000불쯤 소장의 허가도 없이 빚을 지고 돌아온 셈이다.
귀국하고 나서 몇달쯤 되었을까? 대사관에서 요구하는 소요 경비, 이에 덧붙여서 운송비 약 1,000불쯤을 추가해서 요청하여 왔다. 그리고 자기테이프 50릴과 함께. 그런데 지금도 아주 섭섭하게 생각하고 있는 것은 주위의 많은 사람들에게 들은 말이다.
“해외출장 갔으면 구경이나 하고 돌아올 것이지, 왜 시키지도 않은 일을 해와가지구선. 쯧 쯧” 이라고 핀잔 들었올 때였다. 그러나 이 데이타베이스는 지금도 한국원자력연구소에서 잘 운영되고 있다.
다음해 구입하기 시작한 INSPEC 데이타베이스는 한국전자통신연구소의 데이타베이스 구축의 기초자료가 되었으며, 또한 한국전력의 데이타베이스 구축의 기초가 되었다. ISMEC 데이타베이스는 포항제철의 데이 타베이스 구축에도 도움이 되었다.
자기테이프가 해마다 누적되어 갔다. 그러나 컴퓨터는 없다. 컴퓨터가 있어야 온라인 정보검색 시스템이 만들어지는데, 내 년에도 컴퓨터를 도입할 수가 없다. 당시에는 KIST(한국과학 기술연구소)에 대형 CDC컴퓨 터가 가동되고 있었는데, 바로 이 컴퓨터로 정보검색을 하는 기관을 찾았다. 다행스럽게 동일 기종으로 Chemical Abstra- cts를 검색서비스하는 기관을 찾았다. 바로 호주의 CSIRO라는 국립과학연구기관이다.
호주에서 손님이 왔다. 워커힐의 쇼까지 보여주면서 알랑거렸다. 검색 프로그램만 주면 대단히 고맙겠다,그러나 지불할 돈은 없다, 구걸이었다. 이 사람들에게 감동을 준 모양이었다. 외원계획에 의하여 파견하는 형식으로 호주에 오라는 초청장이 왔다. 당장에 갔다. 여기서 여러가지 대화 끝에 호주 쪽 전문가를 찾아서 한국에 오도록 초청하였다. 프로그램이 담긴 자기테이프를 들고 한국에 왔다. 1975년 겨울이었다. 두어달 동안, KIST 컴퓨터와 씨름을 하더니 드디어 가동하기 시작했다.
1976년부터 CA컴퓨터 정보 검색 시스템이 가동되기 시작하였다. 그러나 이것은 배치(Batc- h)검색으로 온라인검색은 아니었다. 그러나 당시로서는 최첨단의 정보 서비스였다. 미국에서 도입한 테이프로 매월 검색 하여 프린트한 다음 기업에 나누어주는 서비스였다.
이 서비스의 이용자가 한때 600개 기업체나 되었지만, 1.영어정보를 제대로 해석하는 기술자가 이용기업체에 없다는 점, 2.우리나라 정보가 누락되어 있다는 점,3. 즉시검색이 안되고 등록된 주제에 관해 정기적으로 서비스를 해야 한다는 점, 4. KiST 컴퓨터의 사용료가 지나치게 비싸다는 점 등이 어려움으로 등장하였다.
국내 데이타베이스의 제작 필요성,단독의 온라인 즉시검색 시스템의 가동 필요성을 절실히 느끼게 되었다. 이때가 1976년의 일이었다.