일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 가상환경
- ubuntu
- AI
- 시간적 일관성
- 티스토리챌린지
- AI 기술
- OpenAI
- 뉴럴링크
- LORA
- TRANSFORMER
- 딥마인드
- tts
- 멀티모달
- 아두이노
- 오픈AI
- 휴머노이드 로봇
- 서보모터
- 인공지능
- 딥러닝
- 오블완
- 트랜스포머
- 확산 모델
- LLM
- 우분투
- 생성형 AI
- ChatGPT
- PYTHON
- 일론 머스크
- 메타
- ControlNet
- Today
- Total
목록2024/08/27 (5)
AI 탐구노트
마이크로소프트에서 공개한 경량 LLM 모델 Phi-1.5는 Microsoft가 발표한 공개 LLM 모델입니다. 13억개의 매개변수를 가진 상대적으로 덩치가 작은 sLLM 쪽에 가깝습니다. Microsoft에서는 소규모 Transformer 기반 언어모델의 성능에 대한 연구가 계속 진행해왔으며 그 결과 Phi-1 이후 Phi-1.5까지 이르게 되었고 13B로 70B의 매개변수를 가지는 Llama2 모델의 성능과 유사한 결과를 낸다고 하네요. 이 모델은 사회적 편견 이해, 독성 감소 등을 목적으로 하고 있기에 학습에 사용한 데이터 자체에 먼저 집중했습니다. '교과서 품질'의 데이터셋을 구성하기 위해 웹에서 크롤링한 데이터를 배제했습니다. 그리고 기존 LLM을 활용하는 방식으로 접근했으며 인간 피드백을 통한 ..
텍스트 이미지 생성을 위한 새로운 다중 LoRA(Low-Rank Adaptation) 구성방식인 LoRA Switch와 LoRA Composite를 발표 Microsoft와 일리노이 대학교 연구진이 텍스트 이미지 생성을 위한 새로운 접근방법으로 다중 LoRA(Low-Rank Adaptation) 구성방식인 LoRA Switch와 LoRA Composite를 발표했습니다. 별도의 미세조정없이 여러 개의 LoRA를 통합하는 것인데 기존 LoRA 가중치 병합 방식(LoRA Merge)과는 달리 개별 LoRA의 가중치는 그대로 유지하고 디코딩 프로세스에 중점을 두고 있습니다. 그러다보니 기존 방식에서 LoRA가 추가될 수록 디테일이 떨어지고 왜곡이 심해지던 현상을 개선할 수 있게 되었다고 합니다. GPT-4V를..
인간의 실제 신체 모양과 동작과 유사하게 재현하는 모델 SMPLer-X은 인간의 신체 (몸, 손, 얼굴 등)의 모양과 동작을 실제와 유사하게 재현하도록 만들어주는 모델입니다. 사진이나 비디오에서 관찰된 사람의 포즈와 형태를 정확하게 추정하는 것을 목표로 하죠. 이 모델은 3D 신체 모델링을 위한 SMPL 모델을 확장한 것으로, 백본(backbone)에서는 ViT(Vision Transformer)를 이용해 이미지 특징을 추출하고, Neck에서는 특징맵에서 손과 얼굴의 바운딩 박스와 자르기 관심 영역 예측하며, Head(Regression Head)에서는 각 부분의 매개변수를 추정하도록 구성되어 있습니다. 기존 방식은 한정된 훈련 데이터셋에 의존하므로 이제껏 보지 못했던 시나리오에 일반화하는 것이 어려웠습..
AI가 포항제철소의 안전과 생산성을 어떻게 높였나포스코 포항제철소는 인공지능(AI) 기술을 활용해 생산성과 안전을 크게 향상시켰는데, AI는 1000도에 달하는 쇳덩이 슬라브의 이동을 실시간으로 감시해 이상 징후를 미리 감지하고 사고를 예방한답니다. (서울경제) 루게릭병 환자, 뇌 전극으로 '말문' 열다미국 연구진이 루게릭병 환자의 뇌에 전극 256개를 이식한 후 뇌 신호를 분석해 환자가 생각하는 말을 컴퓨터로 표현하는 데 성공했습니다. (YTN) AI 시대를 위한 IBM과 삼성의 차세대 칩셋 협력IBM은 삼성전자의 5나노 공정으로 제작된 AI 칩셋 '텔럼2'와 '스파이어'를 발표했는데, 이 칩은 데이터 입출력과 AI 처리 능력이 강화되었고 금융과 공공 시장을 겨냥하고 있습니다. (서울경제) 양자 기술..
텍스트로 음악을 이해하고 생성하는 오픈소스 LLM 모델 ChatMusician는 음악을 생성하는 오픈소스 LLM 모델입니다. 여기에는 LLaMA2가 적용되어 있으며 음악의 텍스트 호환 음악 표현, ABC 표기법 등을 사전 훈련하고 미세조정을 거쳤습니다. 일반적으로 음악이라고 하면 아... 당연히 멀티모달 방식이겠구나 하실 수도 있는데 ChatMusian의 경우에는 순수하게 텍스트 토크나이저로 음악을 이해하고 생성합니다. 게다가 텍스트, 코드, 멜로디, 모티브, 음악 형식 등을 조건으로 구조화된 음악을 구성할 수 있다고 하네요. 사전 훈련에 사용한 코퍼스 데이터는 MusicPie 것인데, 훈련 데이터 대부분이 아일랜드 음악 스타일이라고 하며 형식도 아직은 엄격히 정의된 형식과 폐쇄형 지침만 지원되는 제약..