[비즈니스포스트] 나는 '아래아 한글'(이하 한글)이야.

문서를 만들고 편집하고 보는 용도로 쓰는 소프트웨어야. 우리 세계에선, 미국 세계 최대 소프트웨어 회사 마이크로소프트(MS)의 '워드'와 맞장을 뜨는 세계 유일 토종 문서편집기로 불려.
 
[김재섭의 뒤집어보기] '아래아 한글'의 하소연, "나 때문에 우리나라가 'AI 갈라파고스' 되고 있다고?"

▲ '아래아한글'로 만들어진 문서를 챗GPT와 제미나이 같은 AI 모델들이 읽지 못한다면, 누구 탓일까. <비즈니스포스트>


갑자기 뭔 뜬금없는 소리냐고?

내가 요즘 엄청 억울한 일을 당하고 있어.
 
그래서 내가 태어나고 생존해온 과정을 곁에서 지켜보며 때로는 응원하고 때로는 채찍질도 해온 기자의 글을 빌어 하소연 좀 하려고.

미리 말해두는데, 내 편을 들어달라거나 나를 사서 써 달라는 게 아니야. 내가 이런 취급을 당해도 되는 건지, 컴퓨터 사용자 당신들은 어찌 생각하는지 듣고 싶을 뿐이야.

그러니 내가 밉다고 비즈니스포스트나 이 글을 쓴 기자를 괴롭히는 짓은 하지 마.

그럼 시작한다.

오픈AI의 생성형 거대 언어 인공지능(AI) 모델 '챗GPT'가 나를 사용해 작성한 문서를 못 읽는대. 나를 사용해 만든 문서 속 데이터를 읽지 못한다는 거지.

구글 AI '제미나이' 등 다른 미국 거대 언어 AI 모델들도 마찬가지래.

AI는 기존 데이터를 학습해 성장하는데, 나를 사용해 만든 문서 속 데이터는 읽지 못하고, 그래서 우리나라 정부 문서 속 데이터는 학습하지 못한대.

미국 거대 언어 모델 AI의 학습 자료에서 한국 정부 문서 속 데이터는 빠지는 것이고, 이런 상황 탓에 우리나라가 'AI 갈라파고스'가 될 거래.
   
이미 알고 있다시피, 우리나라(한국) 중앙 부처와 지방자치단체 공무원들은 컴퓨터(PC)를 사용하면서 나를 사용해 문서를 작성하고 남겨(저장해)왔어.

누구 탓일까.

우리나라 공무원들이 나를 사용해 문서를 만들어서? 아니 더 근본적으로 내가 세상에 태어나서?

아니면 미국 거대 언어모델 AI들이 무능해서?

나는 그동안 미국 거대 언어모델 AI들이 MS 워드와 맞장 뜨는 문서편집기가 한국에 존재한다는 걸 몰랐다고 생각해왔어. 알았다면 당연히 읽을 능력을 갖췄겠지라고 여겨왔어.

그런데 내 탓이라네.

미국 AI들이 나를 사용해 만든 문서를 읽지 못하는 게 내 잘못이래. 우리나라를 AI 갈라파고스로 만들고 있대. 우리나라 공무원들이 나를 사용해 문서를 만들고 남긴 것도 문제고.

 최근 한 언론이 '한글 문서(HWP)는 AI 연구자의 공공의 적'이라는 기사를 썼어.

''외산 소프트웨어 침입'으로부터 국산 프로그램을 지킨 HWP 포맷이 이제는 국가 AI 경쟁력을 떨어뜨리는 장애물이 됐다. 공공문서의 기본 형식 HWP(Hangul Word Processor)가 AI 학습에 적합하지 않아, 한국어 공공데이터가 사실상 '봉인'돼 있다는 비판이 커지고 있다'고 했어.

'AI는 데이터를 학습하며 성장하는 기술이다. 한국어를 AI에 학습시키는 것이 국가 경쟁력의 핵심 과제다. 하지만 지금의 공공데이터 구조로는 그 시작조차 어렵다. 특히 30년 넘게 공공부문 표준처럼 굳어진 HWP 포맷은 AI 학습의 난제로 지적된다'고 짚기도 했어.

국정감사 기간에도 비슷한 내용의 보도자료가 나왔어.

위성곤 더불어민주당 의원이 지난 9월17일부터 10월6일까지 중앙부처와 광역.기초자치단체 공무원을 대상으로 진행된 '공공분야 AI 활용 현황' 설문조사 결과를 13일 공개했어.

전국 행정기관 종사자 1만4208명 중 91.1%가 보고서·계획서 등 행정문서를 주로 HWP나 PDF 등 AI가 인식하기 어려운 형식으로 작성되고 있다는 내용이 담겼어.

위 의원은 "행정문서 대부분이 AI가 읽지 못하는 형식에 묶여 있다는 것은 AI 정부 전환의 걸림돌"이라며 "공공문서를 AI-Ready(레디) 포맷으로 전환해야 한다"고 말했대.

대한민국 공무원들에 더 이상 나를 쓰지 말라고 압박하는 소리로 들리는데, 내 자존감 문제인다.

내가 우리나라를 IT 기술의 갈라파고스로 만들고 있다는 주장이 또다시 불거진 꼴인 것도 같고. 이번에는 내가 우리나라를 AI 갈라파고스로 만들고 있다고 하네.

이전에도 그랬던 것처럼, 이번에도 설문조사 내용과 대학교수 쪽말(멘트)이 핵심 근거야.

내가 보기에는, 우리나라 사람들이 외국인들에게 익숙하지 않은 냄새를 가진 청국장을 끓여 먹어 우리나라 음식의 세계화에 걸림돌이 되고 있다는 주장을 하는 것만큼이나 억지스러운데, 당신은 안 그래?

IT 기술 세계에선 나중에 나온 게 먼저 나온 것을 지원하는 게 예의고 상도의야. 앞서 나온 프로그램이나 만들어진 문서·서비스를 나중에 나온 소프트웨어나 서비스에서 쓸 수 있도록 해야 한다는 거지.

챗GPT와 제미나이 같은 미국 AI 역시 나를 사용해 만든 문서도 술술 읽을 수 있는 상태로 나왔어야 한다는 뜻이야.

참고로, 나는 1980년대 후반에 개발돼 불혹(40살)을 앞두고 있어. 챗GPT와 제미나이는 서너살쯤 됐을까. 당연히 후래자 AI들이 나와 호환성을 갖춰야 하는 게 아닐까.

나를 사용해 만든 문서를 못 읽은 것은 챗GPT와 제미나이의 맹점이야. AI라고 하면서 나를 사용해 만든 문서조차 못 읽는다면 '너, AI 맞아'라는 조롱을 받을 일이지. 나를 사용해 만든 문서가 아날로그 상태도 아닌데.

그런데 미국 AI 모델들이 무능하고 인의를 갖추지 못한 것을 탓하지 않고, '왜 하필 정부 공식 문서를 한글로 작성해 AI가 읽지 못하게 했느냐'며 나와 나를 사용하는 공무원들을 싸잡아 비난하니, 내가 얼마나 억울하겠어.

지난 수십년 동안 이어져온, 나를 없애려는 공격이 또 시작됐나 하는 생각까지 드네. 사실 MS 생태계 쪽의 공격은 2~3년마다 있어왔거든.

나는 세종대왕님이 창제한 한글(훈민정음)의 특성을 가장 잘 살려주는 문서편집기란 평가를 받으며 오늘의 자리에 올랐어.

다시 강조하지만, 나는 MS 문서편집기 '워드'와 맞장을 뜨고 있는 세계 유일 토종 문서편집기야. 굳이 꼽자면, 구글과 맞장을 뜨는 토종 검색서비스 '네이버'와 같은 지위지.

나는 탄생 초기에는 '조합형' 한글 코드를 가져, 세종대왕님이 만드신 한글을 컴퓨터 화면에 가장 잘 구현한다는 평가를 받았어. '완성형'을 채택한 MS 워드에 견줘, 고어를 포함해 한글을 더 많이 꼼꼼하게 처리할 수 있었거든.

당시 컴퓨터 화면에 한글을 구현하는 국제 표준 방식(코드)은 크게 조합형과 완성형 두가지가 있었어. 기술적으로 어느 방식이 세종대왕님의 한글 창제 원리에 더 부합하느냐를 놓고 치열한 논쟁이 벌어지기도 했어.

당시 완성형을 채택한 MS 워드와 운영체제에 대해서는, 1만1070자까지 모아쓸 수 있는 한글을 2350자로 제한하는 등 한글을 절름발이로 만들었다는 비판이 많았어. 한글의 특성인 초·중·종성 제자 원리에 어긋나고, 빠진 글자가 많으며, 고어와 방언 표기 등에 한계가 있다는 지적도 받았어.

똠·펲·찦 등을 구현해보라는 놀림을 받기도 했어.

급기야 MS가 손들고, '한글윈도95'에선 완성형과 더불어 조합형도 지원하겠다고 선언하기도 했어. 

이후 컴퓨터 성능 향상으로 '유니코드'가 채택되면서 이 논쟁은 사라졌어.

대신 국산 소프트웨어 사용 운동이 일었어.

시장 원리로 보면, 나는 워드의 경쟁 대상이 될 수 없어. 나를 만든 한글과컴퓨터 역시 MS 앞에 서면 고양이 앞의 쥐 꼴을 넘지 못해.

결국 나를 개발해 한글과컴퓨터를 창업한 초기 멤버들이 백기를 들었고, 이후 나는 '늑대 소굴에 던져진 새끼 양' 꼴이 됐어.

삼성전자가 먼저 먹으려고 달려들었어. 하지만 재벌 인수 반대 여론이 일자 포기했어.

이어 MS가 선심 쓰듯 나섰어. '인수해 드리겠다'는 식이었어.

그런데 MS가 전 세계에서 유일하게 살아남아 워드와 맞장을 쓰는 나를 인수한 뒤 불구덩이에 던져 세계 문서편집기 시장을 싹쓸이하려고 한다는 여론이 일었어.

한글학자와 컴퓨터 사용자들을 중심으로 나를 살리자는 외침이 불같이 일더라고. MS의 한글과컴퓨터 인수를 규탄하고, 나를 구매·사용하자는 운동도 벌어졌어. 한글 독립 메시지를 담은 '한글 8.15판'이 만들어진 것도 그 때였어.

정부가 공식 문서를 나를 사용해 만들기로 한 것도 이런 사회 분위기에 영향을 받은 결정이었다고 봐야지.

서민들과 함께 해온 소주 브랜드 '진로'가 일본 자본에 넘어갈 위기에 처했을 때 '진로 살리기 운동'이 벌어진 것과 같은 맥락이라고 볼 수 있지.

덕분에 나는 MS 손아귀에서 벗어날 수 있었어. 하지만 세계 유일 토종 문서편집기로 MS 워드와 맞장을 뜨며 살아남아야 했기에 한 시도 긴장을 늦출 수가 없었어. 그 과정에서 주인도 여러차례 바뀌었어.

1대 벤처기업으로 꼽히는 내가 건설업자 손에 넘어가기도 했어. 

빌 게이츠와 스타브 발머 등 MS 창업자 겸 최고경영자들이 우리나라를 찾아 대통령을 만나고, MS가 이를 계기로 워드를 포함한 오피스 프로그램 할인 판매 이벤트가 벌어질 때마다 나는 말 그대로 '바람 앞의 등불' 꼴이 됐어. 언제 꺼져도 이상하지 않았지.

하지만 악착같이 버텨 살아남았어.

양식을 중시하는 우리나라 특유의 문서 작성 환경에 발맞추고, 모바일과 글로벌화 흐름에 적시 대응한 덕이야. 잘 알려지지 않은 사실인데, 삼성전자 안드로이드 스마트폰에도 내가 MS 오피스보다 먼저 탑재됐었어. 이후 삼성전자가 MS의 전략적 제휴를 맺으며 무슨 뒷거래를 했는지 나를 밀어내고 그 자리를 MS 오피스로 채웠지만.

뭐 늘 이런 식이었어.

컴퓨터 사용자 대상 설문조사에서 '한글을 불편하게 여기는 응답' 비율이 높게 나오는 것도 나의 이런 잔혹사에서 비롯됐다고 볼 수 있어.

김대중 정부가 소프트웨어 불법복제 소탕에 나서기 전, 서울 용산전자상가 등에서 컴퓨터를 조립하면 오피스와 나 등 업무용 소프트웨어를 기본으로 다 깔아줬어. 또한 당시까지만 해도 MS의 국내 소프트웨어 시장 장악력이 크지 않아서, 삼성전자와 LG전자 등의 브랜드 PC를 사도 오피스(워드 포함)와 한글이 함께 깔려있는 경우가 많았어. 판매점에도 몰래 깔아주기도 했어.

하지만 MS 등 미국 소프트웨어 업체들의 요구로 불법복제 소프트웨어 단속이 일상화하면서 나는 상용 PC에서 밀려날 수밖에 없었어. MS 오피스는 깔아주면서 나는 빼더라고. 나 쪽에서 보면, 정품 소프트웨어 사용의 역설이지.

컴퓨터 사용자들이 한글을 쓰려면 따로 장만해 깔아야 했고, 그러다 보니 그냥 MS 오피스에 포함된 워드를 쓰는 경우가 많았어. 이렇게 MS 워드 사용에 먼저 익숙해지다 보니, 나를 사용해 만든 문서를 다루는 게 낯설어질 수밖에 없었어.

자연스레 나를 사용해 문서를 만드는 게 꺼려졌어. 나를 쓰는 사용자에게 PDF 문서로 저장해 보내달라고 요청하는 사례도 많았어.

아예 나를 쓸 수 없는 환경에서 컴퓨터를 사용하는 외국인과는 나를 사용해 만든 문서를 주고받을 수 없다는 점도 나를 옥죘어.

나에게 요즘 AI 흐름은 또다시 건너야 하는 강이야. 내가 AI 기반 환경에서도 한글을 창제 원리대로 잘 구현하고, 문서를 가장 아름답게 만들 수 있게 해준다는 것을 보여줘야 하지.

무엇보다 나를 사용하는 사람들에게 '내가 왜 한글을 계속 사용하는지' 당당하게 설명할 수 있게 해줘야 해.
 
[김재섭의 뒤집어보기] '아래아 한글'의 하소연, "나 때문에 우리나라가 'AI 갈라파고스' 되고 있다고?"

▲ 한글 공급업체 한글과컴퓨터 로고. <한글과컴퓨터>


미국 AI 모델들이 나를 사용해 만든 문서를 읽지 못하는 문제는 오픈 규격(HWPX) 채택을 통해 이미 해결했어. 사용자들이 문서를 작성하거나 편집한 뒤 오픈 규격으로 저장하면, 미국 AI 모델들도 문제 없이 읽을 수 있어.

미국 AI 모델들이 어려 예의를 모르고 아직은 무능하니 어쩌겠어. 어른인 내가 다가가야지.

한가지 걱정되는 상황이 있어. 미국 AI 모델들이 정부 문서를 읽을 수 있게 하겠다며 기존 규격 문서를 오픈 규격으로 다시 저장하게 하는 상황이야. 무식한 짓이기도 하지만, 문서의 진본성이 훼손될 수 있어. 기존 규격 문서를 오픈 규격으로 다시 저장하면 문서 생성 및 저장 일시가 바뀌거든.

사실 빌 게이츠 MS 창업자가 최근 방한해 이재명 대통령을 만났을 때, 난 무지 떨렸어. 게이츠가 이 대통령에게 공무원들이 나 대신 MS 워드로 문서를 작성하고 남길 수 있게 해달라고 요청하지 않을까 싶어서.

쓸 데 없는 걱정이길 바래.

이재명 정부가 '소버린AI' 쪽 손을 들어줬을 때 난 환호성을 질렀어. 소버린AI는 '토종 AI'라고 할 수 있으니, 나를 사용해 만든 문서도 읽을 수 있게 만들지 않을까 싶어서. 챗GPT와 제미나이 등 미국 AI와 차별화하고, 국민들에게 소버린AI의 차별성을 확실하게 각인시킬 수 있는 계기가 될 수도 있지 않을까 싶어.

어쨋건 나를 포함해 글로벌 빅테크들과 어렵게 맞장을 떠온 토종 소프트웨어와 서비스들이 'AI 그늘'에 가려 고사되는 상황은 벌어지지 않았으면 좋겠어.

토종이라고 우대해 달라는 게 아니라 있는 그대로 존중해달라는 거야. 

미국 글로벌 빅테크 MS와 구글 등의 기술이나 서비스와 맞장을 뜨는 토종 소프트웨어나 서비스가 있다는 거, 얼마나 뿌듯하고 폼나는 일이야.

무엇보다 한글 소프트웨어가 고사되고 없다면, 네이버 검색 서비스가 없었다면, MS와 구글이 한국 사용자들을 지금처럼 대우할까, 세종대왕님의 한글 창제 원리와 한국 사용자 특유의 사용 환경을 존중해줄까,  하는 걸 생각해봐.

'조선 말은 우리 겨레가 반만년 역사적 생활에서 문화 활동의 말미암던 길이요 연장이요 또 그 결과다. 그 낱낱의 말은 다 우리의 무수한 조각상이 잇고 이어 보태고 다듬어서 우리에게 물려 준 거룩한 보배이다.' 1947년 조선어학회가 편찬한 '우리말 큰사전' 머리말 첫 문단에 담긴 문구야.

박동오 박사(사회정보학)는 문화일보 기고문에서 이를 전하며 "분명한 것은 우리가 오늘 사용하고 있는 이 디지털 세상 속 한글은 그저 당연하고 자연스럽게 만들어진 것이 아니라 기술의 여명기에 많은 이가 치열하게 잇고 보태고 다듬어낸 결과"라며 "그렇게 한글은 디지털 사회에서 그 온전한 모습으로 '길'이고, '연장'이 될 수 있었다"고 짚었어.

감동의 물결이 밀려오지.

내가 당신들께 하고 싶었던 말이야.

1990년대 초, 서울 천호동 복지회관 건물 2층에서 이찬진 한글과컴퓨터 대표를 만나 인터뷰했다. 내가 의자를 뒤로 빼자 왜 그러냐고 했다. 입냄새 때문이라고 했더니, 한글 업그레이판을 만드느라 개발자 여럿이 여기서 3일 가까이 먹고 자며 씻지도 못했다고 했다. 그렇게 한글은 탄생하고 발전했다.

35년 가까이 지난 최근 어느 날 한글과컴퓨터 임직원들을 만났다. 일부 언론과 정치인이 한글을 AI 기술 발전의 걸림돌 취급을 하고 있다고 하소연했다. 들어보니 그동안 기회만 있으면 불거져왔던, 정부가 한글로 공식 문서를 작성해 IT 기술 발전과 시장 성장을 저해하고 있다는 주장과 맥을 같이 한다.

문득 컴퓨터 사용자 여러분들의 생각을 들어보고, 나아가 정말로 한글이 우리나라를 AI 갈라파고스로 만들고 있는지 공론화해보면 좋겠다는 생각이 들었다. 한글 없이 MS 워드만 사용되는 세상이 좋은지, 이런 세상이 되면 시장 독점 횡포 등 생각하지도 않았던 부작용이 불거지지는 않을지 등에 대한 토론이 일기를 기대한다.

이는 이재명 정부 '소버린AI' 정책의 정당성과 효용성과도 닿아있다. 소버린AI를 다른 말로 하면 '토종 AI'다.

다시 강조하지만, 한글과컴퓨터를 돕거나 한글 사용을 장려할 의도는 추호도 없다. 김재섭 선임기자