Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- OpenCV
- 확산 모델
- 생성형 AI
- PYTHON
- AI 기술
- 인공지능
- 딥러닝
- 트랜스포머
- 강화 학습
- 다국어 지원
- 휴머노이드 로봇
- 오픈소스
- 티스토리챌린지
- 실시간 렌더링
- ubuntu
- AI
- 일론 머스크
- LORA
- 메타
- 시간적 일관성
- 우분투
- 오픈AI
- 3d 재구성
- Stable Diffusion
- tts
- 오블완
- 생성형AI
- OpenAI
- LLM
- 코딩
Archives
- Today
- Total
목록doctags (1)
AI 탐구노트

문서를 디지털 데이터로 변환하는 것은 생각보다 어려운 작업입니다. 특히 PDF 문서는 인쇄에 최적화된 형식이라 내부 내용을 쉽게 분석하기 어렵습니다. 문서에는 텍스트뿐만 아니라 표, 수식, 차트, 코드 같은 다양한 요소가 포함되어 있어 단순한 OCR(광학 문자 인식) 기술만으로 정확한 변환이 어렵습니다. 기존에는 두 가지 방식이 많이 사용되었습니다. 첫 번째는 각 요소를 따로 처리하는 시스템입니다. 예를 들어, OCR 기술로 텍스트를 인식한 후, 별도의 모델이 문서 레이아웃을 분석하고, 또 다른 모델이 표나 수식을 변환하는 방식입니다. 이렇게 하면 비교적 정확한 결과를 얻을 수 있지만, 여러 모델을 조합해야 해서 시스템이 복잡해지고 처리 속도가 느려지는 단점이 있습니다. 두 번째는 대형 AI 모델을 이용..
AI 기술
2025. 3. 19. 12:16