일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- LORA
- 휴머노이드 로봇
- AI
- 강화 학습
- 티스토리챌린지
- tts
- 확산 모델
- 딥러닝
- 오픈AI
- ChatGPT
- LLM
- OpenCV
- 메타
- 일론 머스크
- 다국어 지원
- 멀티모달
- 오픈소스
- 시간적 일관성
- 생성형AI
- 오블완
- 실시간 렌더링
- AI 기술
- 트랜스포머
- 인공지능
- 자연어 처리
- ai 챗봇
- 우분투
- PYTHON
- OpenAI
- XAI
- Today
- Total
목록인공지능 (28)
AI 탐구노트

얼마 전 중국의 한 스타트업이 공개한 DeepSeek R1 소식을 전해 드린 바 있습니다. 중국 DeepSeek R1의 등장: AI 개발 패러다임의 변화와 미국 빅테크 위기의식인공지능 기술의 발전은 기존 산업의 변화를 촉진하고 새로운 경제 질서를 창출해왔습니다. 특히 미국의 빅테크 기업들은 AI 혁신을 선도하며 막대한 자본과 기술력을 바탕으로 글로벌 시장을42morrow.tistory.com 놀라운 엔지니어링의 결과로, 소규모의 GPU와 적은 데이터셋으로도 최고 모델에 버금가는 성능과 기능을 보여줬었죠. 무엇보다도 그 과정을 다 오픈소스로 공개했다는 측면 때문에 AI 비즈니스 영역에는 ChatGPT 출시 때와 비슷한 충격을 줬다고 해도 과언이 아닙니다. DeepSeek R1의 제약사항그런데, 이 De..

인공지능 기술의 발전과 함께, 텍스트를 자연스러운 음성으로 변환하는 텍스트-투-스피치(Text-to-Speech, TTS) 시스템의 수요가 급증하고 있습니다. 특히, 다양한 언어를 지원하면서도 경량화된 TTS 모델은 엣지 디바이스나 임베디드 시스템과 같은 제한된 환경에서의 활용 가능성을 높여줍니다. 얼마 전 'Kokoro-82M' 이라는 TTS 모델을 소개한 바 있었습니다. 경량 TTS 모델로 8200만개의 매개변수만으로 아주 좋은 성능과 처리 속도를 보여준다고 말입니다. 게다가 공식 지원 언어에 한국어가 들어가 있다는 장점도 있었죠. 'Local Elevenlabs'라고 불릴 정도로 사람들의 주목을 많이 끌었습니다. Kokoro-82M: 컴팩트하면서 강력한 TTS 솔루션텍스트-음성 변환(TTS)은 ..

디자인 작업이나 프레젠테이션을 준비하다 보면, 종종 고해상도의 깔끔한 이미지를 사용해야 할 때가 있습니다. 벡터 이미지는 이러한 요구에 적합한 선택지로, 해상도에 제약 없이 확대와 축소가 가능하다는 장점이 있습니다. 하지만 문제는 이러한 벡터 이미지를 만드는 과정이 만만치 않다는 점입니다. 전문가 수준의 디자인 소프트웨어와 많은 시간, 그리고 숙련된 기술이 필요하기 때문입니다. 이 부분은 이미 앞서 다른 글에서도 언급했던 바가 있습니다. 최근에는 Pixelmate Pro 등 다양한 도구들이 나와 있는 것으로 알고 있지만 예전에는 그래픽 디자인에서 벡터 그래픽하면 대부분 Adobe사의 illustrator를 사용했었습니다. 값 비싼 소프트웨어도 구매해야 하고 툴에 익숙해져야 하고 벡터 이미지 생성에 대한 ..

음악은 인간 감성의 언어로, 수천 년 동안 문화를 형성하고 우리 삶을 풍요롭게 해왔습니다. 현대의 기술 발전은 단순히 음악을 듣는 것을 넘어, 음악의 구조를 이해하고 시각적으로 표현하는 데까지 이르고 있습니다. 예를 들어, 스마트폰을 통해 간단히 멜로디를 검색하거나, 피아노 앱에서 연주 실력을 평가받는 것처럼, 기술은 점차 음악의 언어를 해석하고 번역하는 방향으로 발전하고 있습니다. 이제는 한 걸음 더 나아가, 특정 소리나 음악을 실시간으로 듣고 이를 정확한 악보로 전사하는 기술이 주목받고 있습니다. 이는 단순한 편리함을 넘어, 교육, 창작, 보존 등의 영역에서 새로운 가능성을 열어줍니다. 이 글에서는 음악을 악보로 전사하는 기술이 가진 잠재력과 이를 실현하기 위한 접근법을 살펴봅니다.1.악보 제작 기술..

1. 서론 인공지능(AI) 기술의 급속한 발전은 다양한 산업 분야에서 혁신을 이끌고 있습니다. 특히, AI 시스템이 실시간으로 방대한 데이터를 처리하고 분석하여 의사결정을 지원하는 능력은 기업의 경쟁력을 높이는 핵심 요소로 부상하고 있습니다. 그러나 이러한 AI 시스템이 효과적으로 작동하기 위해서는 다양한 데이터 소스와의 원활한 연동이 필수적입니다. 현재 많은 AI 모델은 특정 데이터 소스와의 통합을 위해 개별적인 커스터마이징이 필요하며, 이는 개발 시간과 비용을 증가시키는 요인으로 작용합니다. 이러한 문제를 해결하기 위해, 앤트로픽(Anthropic)은 AI 시스템과 데이터 소스를 효율적으로 연결하는 표준화된 방법인 모델 컨텍스트 프로토콜(Model Context Protocol, MCP)을 도입하였습..

1.서론: 인공지능이 바이오를 바꾸다 인공지능(AI)은 다양한 산업에 혁신을 가져왔지만, 그 중 바이오 분야는 특히 주목할 만합니다. 최근 딥마인드의 알파폴드 3(AlphaFold 3)는 단백질 구조 예측의 새로운 지평을 열며, 생명과학 연구에 엄청난 변화를 예고했습니다. 본 글에서는 알파폴드 3가 바이오 분야에서 어떤 혁신을 가져오고 있는지 살펴보겠습니다.2.본론: 알파폴드 3의 혁신적 기능과 영향 2.1. 알파폴드 3란 무엇인가? 딥마인드의 알파폴드 시리즈는 단백질 구조 예측의 판도를 바꾸었습니다. 알파폴드 3는 이전 버전보다 더 빠르고 정확하게 단백질 구조를 예측하며, 바이오 연구자들에게 새로운 가능성을 제공합니다.높은 정확성: 단백질 구조 예측의 정확도가 기존 알파폴드 2 대비 50% 향상복합체 ..

1.카메라 영상 분석 CCTV 카메라를 이용해 특정 금지구역이나 위험구역에 사람들이 들어가는 것을 신속하게 감지하고 경고를 주거나 알림 정보를 관리자에게 전달하는 솔루션이 최근 제조, 건설 현장 등에서 많이 활용되고 있습니다. 즉, 인공지능(AI) 기술이 접목된 지능형 CCTV 시스템, 혹은 영상분석(Video Surveillance)이 바로 그것인데요, 이번 글에서는 지능형 CCTV를 활용한 침입 감지를 하는 간단한 코드를 만들고 그것으로 테스트를 진행해 보겠습니다. 참고로 아래 내용은 CCTV 보급과 발전과정을 시대 별로 정리해서 소개한 좋은 글입니다. 읽다가 링크를 가져와서 소개해야겠단 생각이 들어 가져와 소개합니다. CCTV의 보급과 발전과정[BY 자비스넷 잡학사전] CCTV. 요즘 TV 뉴..

1.영상복원시간이 지나 흐릿해진 옛 사진을 마주할 때마다 그 안에 담긴 추억도 조금씩 사라지는 듯한 아쉬움이 들곤 합니다. 그러나 요즘, AI 기술의 발전 덕분에 이러한 사진들이 새로운 생명력을 얻고 있습니다. 몇 년 전만 해도 흐릿하거나 손상된 사진을 선명하게 복원하는 것은 전문가의 손을 빌려야 가능한 일이었지만, 이제 AI 기반 복원 기술이 널리 퍼지며 누구나 손쉽게 과거의 추억을 선명하게 되살릴 수 있게 되었습니다. 특히, 딥러닝 모델을 활용해 사진의 해상도를 높이고 색을 되살리며, 심지어 손상된 부분까지 복원해주는 기술이 일상에 스며들고 있는데요, 이는 단순한 기술 이상의 의미를 지닙니다. 과거의 소중한 순간들이 다시금 생생하게 부활하며 새로운 감동을 안겨주는 일이니까요. 오래된 영상이라고 하니...

OpenAI, 더 똑똑해진 AI 모델 'o1' 출시... 복잡한 문제 해결 능력 강화 OpenAI는 새로운 인공지능 모델 'o1'을 드디어 공개했습니다. 이 모델은 '스트로베리(trawberry)'라는 코드명을 가진 프로젝트로 진행되어 왔었는데, OpenAI의 실력을 이미 다 알고 있었기에 지난 발표 이후 생각보다 오랜 긴 침묵을 보며 이번에는 어떤 것들을 선보일까, 게다가 기존의 GPT-4 등에 사용된 기술이 아닌 전혀 다른 접근을 하고 있다는 얘기들도 있었기에 초기 버전의 AGI의 한 측면을 볼 수 있지 않을까 하는 기대를 불러일으켜 왔습니다. 공개된 내용에 의하면, o1은 추론, 특히 복잡한 문제 해결을 위한 추론에 특화되어 있고 과학, 수학, 코딩 등 다양한 분야에서 이전 모델보다 훨씬 뛰어난..

ChatGPT의 코딩 능력을 빌어와 아이와 함께 할 수 있는 프로그램 만들기 유튜브에는 재미난 퀴즈를 소개하는 채널들이 있습니다. 아이와 가끔씩 들여다 보는 편인데 생각보다 재미있어서 보다보면 어느새 몇 개는 훌쩍 지나가 버리고 말죠. 아무래도 제시되는 문제들이 일반적인 것들이어서 나름 나만의 퀴즈를 만들어서 아이와 함께 해 보는 것은 어떨까 생각하게 됐고 그렇게 해 봤습니다. 코딩은 ChatGPT한테 시키고 저는 그걸 옮겨서 실행만 시키는 걸로... ^^; 일단 다음과 같은 프롬프트를 이용했습니다. 퀴즈를 내는 웹 프로그램을 만들텐데 구현하려는 기능은 다음과 같아.단, python 만으로 가능하면 그렇게 해 주고 그렇지 않으면 javascript나 html을 사용해도 좋아. 1.화면은 첨부한 이미지..