| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
- 이미지 편집
- 강화학습
- 딥러닝
- 바이브코딩
- 일론 머스크
- XAI
- 오블완
- ChatGPT
- 확산 모델
- 오픈AI
- 메타
- 생성형AI
- 우분투
- 멀티모달
- 트랜스포머
- 감정 표현
- PYTHON
- OpenAI
- AI 기술
- 오픈소스
- 음성 인식
- AI
- 자동화
- 티스토리챌린지
- tts
- LLM
- 이미지 생성
- 음성합성
- gaussian splatting
- 인공지능
- Today
- Total
목록PYTHON (33)
AI 탐구노트
이번에는 단독 웹앱으로 별자리 보기 프로그램을 만들어 봤습니다. 예전에 스텔라리움에 대해 소개를 한 바 있습니다. 처음에 해당 프로그램을 써보고 우와... 이렇게 멋진~ 하면서 감동을 받은 바 있었죠. 별 관찰, 별자리 보기에 딱 좋은 프로그램이고 제공되는 수많은 기능이 있었기 때문입니다. 하지만, 어디까지나 내 프로그램이 아니기 때문에 원하는 간단한 기능 하나 추가할 수 없습니다. 게다가 너무 많은 기능을 가지고 있다보니 정말 단순한 커스텀 요건을 수용하도록 하기에는 어려움이 많죠. 그래서, 간단한 별자리 보기 프로그램을 만들고 거기에 내가 필요로 하는 기능을 추가할 수 있는 코드를 만들어봐야겠다 싶었습니다. 퀴즈나 아이 학습에 필요할 수도 있으니까요.별자리 보기 웹 프로그램 LLM이라는 도구를 사..
Ollama에서 Gemma3 모델을 올려두고 API 호출을 통해 서비스를 받았습니다. 이전 글에서 언급한 것처럼 돌아오는 답변이 원하는 포맷이 아니고 요약도 엉망으로 되는 경우가 많았습니다. ollama 쪽 모델은 원본과는 좀 다른가보다... 자기 고집이 센 녀석인가보다 하면 불편하지만 참으며 사용했고, 요약 결과가 너무 이상하다 싶으면 좀 더 큰 다른 모델을 이용하는 방식으로 넘어갔었습니다. 그런데... 아무리 Ollama 쪽 모델의 특성일 수도 있겠다 생각해도 이 모델이 이렇게까지 헤맬까? 하는 의문이 드는겁니다. 그래서, 일종의 버그 잡기를 시도했고, 그 과정을 기록해 둡니다. 흑역사죠. 1) 문제점 확인 예전에 만들어 둔 Youtube 스크립트 요약기에서 로컬 모델 사용 방식을 LM Stud..
해외에 나가서 직접 체험을 해 보는 TV 예능 프로그램을 보면, 다들 하나같이 영어로 외국인들과 대화를 잘 합니다. 물론 그런 사람들을 위주로 팀을 짰겠지만, 언어 울렁증이 있는 저로서는 난 이제껏 뭘하며 살았나 할 때가 가끔씩 있습니다. 다양한 체험은 그 사람의 세계관과 시야를 넓혀준다는 사실은 진리고, 내가 가지지 못한 능력을 갖고 있고, 그로 인해 내가 해 보지 못하는 체험을 해 볼 수 있는 사람들이 주변에 많을거란 사실에 때론 속이 상할 때도 있습니다. T^T 그런데 최근 다국어 통역, 번역을 해 주는 AI의 급격한 기술 발전을 보면서 제발 구글아~ 하며 손꼽는 날들이 늘었었습니다. 거의 다 온 것 같은데... 아직 약간 더 기다려야 한다는 전망들을 보면서 흠... 이러다 정말 필요없을 때 그 ..
영어 스펠링을 못 읽은 아이에게 팝송 가사를 따라 부를 수 있도록 해 주려고 영어 문장을 한글 표기로 바꿔주는 프로그램을 만들어 봤습니다. 물론 제대로 된 문장, 발음을 공부하는 것이 좋겠지만, 아직 어려서 (혹은 선행학습 같은 것을 전혀 하지 않아서 ^^;) 그러지 못하는 경우를 위해서 말이죠. 이번 글에서는 그 과정을 정리해서 소개하겠습니다. 1️⃣ 개요 영어 학습/발음 학습에서 자주 필요한 기능은 영어 단어, 문장을 한글 발음으로 읽을 수 있게 만드는 것입니다. 기존 방식(단순 자모 치환 방식)은 'ㅍ오ㅇ어' 같은 미완성 자모가 나오기 쉽고, 실제로 읽기 어렵습니다. 목표는 다음 3단계 파이프라인을 통해 완성형 한글(포워드, 컴퓨터 등)로 변환하는 것입니다.영어단어 → IPA(발음기호) : 연음..
사무실이나 혹은 가정에서도 늘 컴퓨터 앞에만 있는 경우가 있습니다. 작업을 하다가 결과물이 될 듯말 듯 할 때는 더 그렇죠. 몇 시간이고 그 자리를 떠나지 못하게 되는 경우가 비일비재합니다. 하지만, 종일 컴퓨터 앞에만 앉아 있으면 몸건강, 마음건강에 좋지 않습니다. 그래서, 간단하게 PC에서 사용할 수 있는 알람앱을 만들어 봤습니다. 원칙은 '단순하게, 그렇지만 편리하게'로 잡았습니다. 1️⃣ 개요Python 백엔드 기반의 알람 시스템Tk, Qt 등 GUI 라이브러리 대신 웹UI 이용 (못 생김 주의 때문!)웹 UI는 설정만 담당하고, 실제 알람 동작은 백그라운드에서 소리로만 수행nohup으로 백그라운 동작 2️⃣ 아키텍처 프론트 : 웹 UI (설정 전용)알람 추가 / 수정 / 삭제 / 활성 ..
연말 연시, 크리스마스에 써먹을 수 있는 'ASCII 타입 크리스마스 트리'를 한번 만들어 봤습니다. 뭐... 워낙 생성형 AI가 이미지나 영상을 잘 만들어내니 굳이 이걸 돌릴 필요는 없겠지만, 그래도 재미삼아 해 봅니다. ^^; 1) ANSI 캐릭터를 이용한 버전 먼저 ANSI ASCII만 사용한 버전입니다. Claude는 역시 ChatGPT 대비 깔끔한 코드와 결과물을 보여줍니다. import timeimport randomimport osdef clear_screen(): """화면을 지웁니다""" os.system('cls' if os.name == 'nt' else 'clear')def get_tree_line(row, height, decorations, blink_state)..
Hugging Face에 올라온 데모를 로컬 PC에서 사용하기 위한 절차를 간단히 정리해 봅니다. 아래 예는 Qwen Image Edit Inpainting 데모 (링크)를 이용해서 작성되었습니다. 1.Space 클론하기 Hugging Face의 space도 우리가 아는 github 저장소처럼 clone하는 방식은 동일합니다. $ git clone https://huggingface.co/spaces/linoyts/Qwen-Image-Edit-Inapint$ cd Qwen-Image-Edit-Inapint 2.uv 가상환경 만들기 conda나 venv를 이용해 가상환경을 생성하면 됩니다. 지금은 uv를 이용해서 진행하겠습니다. 기존과 방식은 동일하고 맨 앞에 'uv'만 추가하면 됩니다. uv의 장점은..
X를 보다 보니 Python으로 크로스 플랫폼 기반으로 웹앱/앱을 생성할 수 있는 도구가 나왔다고 해서 요약 정리해 봅니다. 프런트를 개발하려면 공부해야 하는 것이 많고 이걸 다시 백엔드와 연계하는 것은 또 하나의 숙제가 될 수 있는데 그런 번거로움을 줄일 수 있는 좋은 도구 같아서 입니다. 다만, 아직은 덜 여문 상태로 점점 더 좋아질 것을 기대하면서 소개해 보겠습니다. Flet이란?Flet은 Pyhton으로 웹, 데스크톱, 모바일 앱을 개발할 수 있는 크로스 플랫폼 UI 프레임워크 Flutter 기반의 UI 컨트롤을 Python 코드로 제어하며, 프론트엔드 지식 없이도 앱을 구현할 수 있습니다.단일 Python 모노리스 형태의 구조를 사용해 백엔드–프론트엔드 분리 없이 실시간 SPA(Single P..
아이와 가끔씩 나라 이름 말하기나 수도 이름 말하기, 국기 맞히기 등의 놀이를 할 때가 있습니다. 대부분의 아이들이 이런 게임을 좋아하고 곧잘 외우죠. 어른들은 아주 예전 학교에서 배웠던 것들을 가지고 얘기하는터라, 아무래도 아이들의 파릇파릇한 기억력을 당해낼 재간이 없을 것 같았습니다. 하지만, 의외로 대부분 아이들이 국기를 보고 나라 이름을 맞히기는 하는데, 그 나라가 대략 어디쯤 있는지를 모르는 경우가 많더군요. 그래서, 아이들 용 컨텐츠로 나라의 위치를 공부하는 것을 하나 만들어 보기로 했습니다. 전체 내용은 대략 다음과 같습니다.❓️세계지도 정보, MapPuzzle로 안 되었나?🕵️♀️ 세계지도 라이브러리 조사👨💻 Worldmap을 이용한 코드 생성 ❓️세계지도 정보, MapPuzzl..
유튜브에는 전문가들이 쏟아내는 수많은 지식과 정보가 넘쳐납니다. 하지만 영상 길이는 대부분 20분, 길게는 1시간을 훌쩍 넘기기도 하죠. '내용은 궁금한데, 전부 다 볼 시간은 없다'는 고민, 누구나 한 번쯤 해보셨을 겁니다.그럴 때 바로 '스크립트'와 'AI 요약'의 조합이 강력한 해결책이 됩니다. 유튜브가 제공하는 '자동 자막(스크립트)'을 텍스트로 추출하면, 전체 영상을 재생하지 않고도 내용을 빠르게 훑어보고, 필요한 부분만 골라볼 수 있습니다. 여기에 AI 요약 기능까지 활용하면, 전문가 영상도 몇 분 만에 핵심만 쏙쏙 정리할 수 있게 되죠.이번 글에서는 유튜브 스크립트를 활용해 짧은 시간에 많은 정보를 효율적으로 처리하는 방법, 그리고 실제로 AI와 함께 어떤 방식으로 요약과 정리를 할 수 있는..
