Cjournal
2025금융포럼
기업과산업  전자·전기·정보통신

한글과컴퓨터, 'PDF 데이터 추출 기술' 글로벌 AI 개발 표준 등록

조승리 기자 csr@businesspost.co.kr 2025-11-03 10:33:11
확대 축소
공유하기
페이스북 공유하기 X 공유하기 네이버 공유하기 카카오톡 공유하기 유튜브 공유하기 url 공유하기 인쇄하기

한글과컴퓨터, 'PDF 데이터 추출 기술' 글로벌 AI 개발 표준 등록
▲ 3일 한글과컴퓨터는 PDF 데이터 추출 기술 '오픈데이터로더 PDF'가 랭체인의 도큐먼트 로더 PDF 파트 공식 구성요소로 등록됐다고 밝혔다. <한글과컴퓨터>
[비즈니스포스트] 한글과컴퓨터는 PDF 데이터 추출 기술 '오픈데이터로더 PDF'가 글로벌 인공지능(AI) 개발 프레임워크인 '랭체인'의 도큐먼트 로더 PDF 파트 공식 구성요소로 등록됐다고 3일 밝혔다.

랭체인은 챗GPT와 같은 대규모 언어 모델(LLM)을 기반으로 다양한 AI 애플리케이션을 구축하는 데 가장 널리 사용되는 오픈소스 프레임워크다. 전 세계 수십만 명의 AI 개발자가 활용하는 사실상의 표준 개발 도구로 자리 잡았다.

오픈데이터로더 PDF는 AI 학습 및 활용 과정에서 고질적인 병목 현상을 유발했던 PDF 문서 내 텍스트, 표, 이미지 등의 데이터를 정확하고 빠르게 추출하여 AI가 즉시 활용 가능한 형태로 변환하는 기술이다. 

한글과컴퓨터는 이번 랭체인 등록을 통해 PDF 데이터 처리 문제로 어려움을 겪는 전 세계 AI 개발자들에게 오픈데이터로더 PDF를 PDF 데이터 분야에서 신뢰할 수 있는 솔루션으로 직접 제공할 수 있게 됐다.

한글과컴퓨터는 이번 등록이 지난 9월 깃허브에 오픈데이터로더 PDF 코드를 공개한 데 이어, 해당 기술이 글로벌 AI 개발 생태계의 핵심 구성요소로 공식 인정을 받았다는 점에서 의미가 있다고 밝혔다. 

랭체인과의 통합은 단순히 코드를 공개하는 것을 넘어 해당 기술의 안정성, 성능, 그리고 AI 개발 환경에서의 적합성을 공식적으로 검증받았음을 뜻한다고 회사 측은 설명했다. 조승리 기자

최신기사

[현장] 삼양식품 불닭 이어 원조로 온다, 김정수 36년 만에 '우지라면' 점유율 회복..
해외 매출 늘면 수익성 줄어드는 야놀자, 부킹닷컴 수수료에 발목잡힌 제휴사업
HD현대 3분기 영업익 1.7조로 294.5% 증가 '역대 최대', 조선·기계 호조에 ..
최태원 "젠슨황도 HBM 개발 속도 재촉 안해, SK하이닉스 준비 완벽하다는 의미"
테슬라 미국 이어 중국도 전기차 판매 감소 리스크, 정부 지원 '반토막' 예고
[3일 오!정말] 장동혁 "내일도 너무 늦다. 이재명 재판은 오늘 시작돼야 한다"
넥슨 '아크 레이더스' 글로벌 슈팅 재도전, 이정헌 "이번은 달라" 초반 질주 이어간다
삼성전자, HBM4 핵심 개발진 30명에 5억 규모 자사주 지급
경사노위 위원장에 전 대법관 김지형 임명, "노동법 권위자로 사회적 약자 보호"
[오늘의 주목주] '새 청사진' SK하이닉스 10%대 상승, 코스닥 로보티즈 24%대 올라
Cjournal

댓글 (0)

  • - 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
  • - 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 댓글은 관련 법률에 의해 제재를 받을 수 있습니다.
  • - 타인에게 불쾌감을 주는 욕설 등 비하하는 단어가 내용에 포함되거나 인신공격성 글은 관리자의 판단에 의해 삭제 합니다.