📮 왕의 귀환! 가장 강력한 오픈 LLM🦅

#Falcon-180B #RLAIF #MVDream

2023. 9. 10.

함께 공유하고 성장하는 연구 문화를 전파해요

2023년 9월 11일 모두레터

구독하기 I 웹에서 보기 I 지난 레터 보기

created with DALL・E2

님, 모두레터가 왔어요.

모두레터가 한 주 쉬어가서, 오늘은 내용이 좀 많네요.

내용이 잘릴 수 있어서 웹에서 보기를 추천할게요!

[공지 I 모두레터 가꿈이 휴가로 다음주 레터는 쉽니다🌱]

이번주 AI 소식

가장 강력한 오픈소스 언어모델 'Falcon-180B' 출시
RLHF(인간 피드백기반 강화학습), 이젠 인공지능으로?
3D 이미지 생성을 위한 모델 'MVDream' 발표

열린 세미나: LLM 모델 기반 서비스 실전 가이드

가장 강력한 오픈소스 언어모델 'Falcon-180B' 출시

오픈소스 LLM(Large Language Model) 팔콘(Falcon)의 180B 모델이 공개됐습니다. 파라미터 수가 1800억 개, 모델 학습에 사용된 텍스트 토큰 수는 무려 3조 5천억 개에 이르는 거대한 모델인데요! 현재 허깅페이스의 오픈 LLM 리더보드에서 '팔콘-180B' 모델은 미세조정(Fine-tuning)을 하지 않은 사전학습된(Pre-trained) 모델 중 가장 높은 순위를 기록하고 있습니다. 오픈소스가 아닌 모델들과 비교하면 오픈AI의 'GPT-4'보다는 조금 낮지만, 파라미터 수가 2배 가까이 되는 구글의 '팜(PaLM) 2 Large' 모델과는 비슷한 성능을 보였다고 하네요. 팔콘-180B 모델은 허깅페이스의 'transformers' 라이브러리를 이용해 쉽게 사용할 수 있는데요. 아주 큰 모델이기 때문에 학습이 아닌 추론(Inference) 과정에도 400GB 이상의 메모리 공간이 필요하다고 합니다. 여기에서 '팔콘-180B-챗' 모델과 대화해 볼 수 있으니, 관심있는 분들은 시도해 보세요!

Spread Your Wings: Falcon 180B is here

RLHF(인간 피드백기반 강화학습), 이젠 인공지능으로?

LLM의 성능을 향상시키는 방법 중에는 'RLHF(Reinforcement Learning from 👤Human Feedback, 인간 피드백을 통한 강화학습)'라는 기법이 있습니다. LLM이 생성한 답변을 사람이 평가하고, 강화학습을 통해 LLM의 파라미터를 조정하는 방법이죠. RLHF는 챗GPT나 바드(Bard)와 같은 대표적인 LLM 서비스에서 자연스러운 답변이 생성될 수 있게 하는 데 중요한 역할을 했지만, 사람이 평가를 하기 때문에 데이터를 얻기 어렵다는 단점이 있었습니다. 구글 리서치가 발표한 이번 논문은 RLHF에서 LLM의 답변을 평가하는 단계를 사람이 아닌, 다른 LLM이 수행하도록 하는 'RLAIF(Reinforcement Learning from 🤖AI Feedback)' 기법을 제시합니다. 이 논문에서는 RLAIF를 문서 요약 태스크에서만 사용했는데요. 언어 모델이 생성한 요약 두 가지 중 어느 것이 더 좋은지 LLM에게 물어본 다음 각각 점수를 매기고, 이 점수를 강화학습에 사용했습니다. 두 기법을 각각 사용해 생성된 텍스트로 사람들의 선호도를 조사한 결과, 통계적으로 유의미한 차이는 없었다고 하네요. 문서 요약 외에 다른 태스크에서도 사람의 노력을 최소화할 수 있을지 지켜보면 좋을 것 같습니다.

RLAIF: Scaling Reinforcement Learning from Human Feedback with AI Feedback

3D 이미지 생성을 위한 모델 'MVDream' 발표

영상 공유 플랫폼 틱톡(TikTok)의 모기업 바이트댄스(ByteDance)에서 텍스트로부터 3D 개체를 생성하는 모델 'MVDream'을 발표했습니다. 2D 이미지 생성을 위한 모델을 3D 개체 생성에 적용하는 연구는 기존에도 존재했지만, 다양한 각도에서 본 모습을 잘 표현하지 못하는 경우가 많이 있었다고 하는데요. 이 문제를 해결하기 위해, MVDream은 2D 디퓨전(Diffusion) 모델에 3D 이미지 데이터셋을 추가로 사용했습니다. 텍스트 프롬프트와 카메라의 위치 정보를 함께 사용해 3D 개체를 생성하고, 실제 3D 데이터를 다양한 각도에서 찍은 이미지들과 비교하는 방법으로 모델을 학습시켰습니다. 그 결과, 중복되는 부분이 반복적으로 생성되는 것과 같은 문제점들이 눈에 띄게 개선되었고, 'DreamFusion', 'Magic3D', 'Text2Mesh' 등 기존의 3D 개체 생성 모델보다 더 좋은 성능을 보였다고 하네요!

MVDream: Multi-view Diffusion for 3D Generation

필진 I 신승연, 하자혜

🏆모두의연구소 김승일 대표, '직업능력의 달 기념식'에서 대통령 표창 수상!

모두연 김승일 소장님이 지난 5일 더 플라자 호텔 그랜드볼룸에서 열린 '2023 직업능력의 달 기념식'에서 직업훈련기관 대표 부문 '대통령 표창'을 받았습니다! K-디지털 트레이닝 기관 대표가 대통령 표창을 수상한 것은 이번이 최초라고 해요. 앞으로 님과 함께 한층 더 성장할 모두연이 기대되네요!🤗

⎯ 🌱이벤트 유의사항 ⎯

• 아이펠 7기 서류 제출자 중 추첨을 통해 한빛미디어의 <AI 전쟁>, <박태웅의 AI 강의> 중 한 권을 선물로 드려요.

• 선물 배송을 위한 배송지 정보 입력폼을 기간 내 제출하지 않을 경우 본 혜택이 지급되지 않아요.

• 배송지 정보 입력폼에 잘못된 개인정보를 입력하거나, 개인정보수집・이용에 동의하지 않는 경우 본 혜택 제공이 불가해요.

모두연 커뮤니티 소식

LAB 연구원 찾아요

Speech2Face LAB #멀티모달 #논문 #9월 12일까지
Coding&Taekwonyap LAB #교육프로그램_개발 #9월 13일까지
PRIVATE AI LAB #PET(Privacy-enhancing Tech.) #9월 18일까지
KBLM LAB #KBLM(Knowledge Based Language Model) #논문 #9월 19일까지

새로운 LAB 만들기

추천 행사 ) MLOps Now - LLM in Production

모두의연구소, VESSL AI, Weights & Biases, 스캐터랩이 함께 주최하는 행사를 소개합니다. 최신 LLM & LLMOps 트렌드와 대형언어모델 서비스 운영·배포에 대해 다룬다고 하고요. 맛있는 피자까지 제공돼요!🍕

일시: 9월 15일 금요일 1PM
장소: 모두의연구소 강남캠퍼스
연사: 안재만(VESSL AI), Akira Shibata(Weights & Biases), 김준성(스캐터랩)

행사 신청하기

열린 세미나

모두팝 ) LLM 모델 기반 서비스 실전 가이드

일시: 9월 19일 화요일 7:30PM - 9PM
장소: 모두의연구소 강남캠퍼스 라운지
연사:이태영(서울과기대 박사과정, 케라스 코리아 운영진)
내용: LLM 프로젝트를 기획・실행하는 목적 • 본질적으로 사용자가 원하는 서비스를 위한 지향점 • LLM 전체 서비스 아키텍처 구성 • LLM 서비스의 적용 방안 및 서비스 구축에 대한 다양한 방법론에 대한 이해