디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] 허깅페이스, 매개변수 8B짜리 멀티모달모델 ‘아이드픽스2’ 출시

ㅇㅇ(182.230) 2024.04.17 19:44:49
조회 173 추천 5 댓글 3
														

https://www.aitimes.com/news/articleView.html?idxno=158879

 



7ce8887eb28b07f739ee86e441ee7065c8ae6d31797ae8e842ea0a7feba72afe600e



허깅페이스가 텍스트 및 이미지 프롬프트에 응답할 수 있는 초경량 멀티모달언어모델(LMM)을 출시했다. 매개변수 크기가 80억개로 가장 작은 규모의 LMM 중 하나이지만, 동급 LMM 가운데 최고 성능을 기록했다는 주장이다. 


벤처비트는 16일(현지시간) 허깅페이스가 텍스트 및 이미지 프롬프트에 응답할 수 있는 80억 매개변수의 LMM ‘아이드픽스2(Idefics2)’를 출시했다고 보도했다.


이에 따르면 아이드픽스2는 딥마인드가 개발한 기술을 사용해 2023년 출시한 800억 매개변수의 ‘아이드픽스’를 기반으로 한다. 이번에는 더 작은 매개변수 크기, 오픈 라이선스, 향상된 OCR(광학 문자 인식) 등으로 업그레이드했다. 


최대 980x980 픽셀의 기본 해상도와 기본 종횡비 조작 기능을 추가했고, OCR 기능과 차트, 그림 및 문서에 대한 답변 능력을 향상했다는 설명이다.


허깅페이스는 공개적으로 사용 가능한 데이터셋, 특히 미스트랄-7B-v0.1 및 siglip-so400m-patch14-384를 혼합해 아이드픽스2를 훈련했다. 이 외에도 웹 문서, 이미지- 캡션 쌍, OCR 데이터, 렌더링된 텍스트 및 이미지-코드 데이터를 활용했다.


그 결과 라바-넥스트-미스트랄-7B, MM1-챗-7B, 딥시크-VL-7B 등 동급 LMM과의 벤치마크에서 가장 뛰어난 성능을 기록했다고 밝혔다.



7ce8887eb28b07f739ee86e44eee7169547c5e0202d16a49296c2eaaca5e7c24aa



한편 이번 출시는 경쟁업체들이 최근 최신 LMM을 공개한 가운데 이뤄졌다.


스타트업 레카는 전날 이미지, 오디오, 비디오 등 다양한 양식을 이해할 수 있는 LMM ‘레카 코어(Reka Core)’를 출시했다. 이틀 전에는 일론 머스크의 xAI가 문서, 다이어그램, 차트, 스크린샷 및 사진을 포함한 다양한 시각적 정보를 처리하는 LMM '그록-1.5V'을 공개했다.


또 지난주에는 구글이 '이마젠 2(Imagen 2)'에 텍스트 프롬프트를 애니메이션 이미지로 변환하는 '텍스트-투-라이브(text-to-live)' 기능을 공개했다.


자동등록방지

추천 비추천

5

고정닉 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2861 설문 어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는? 운영자 24/05/20 - -
412470 공지 레이 커즈와일 신간 6월 25일 발매 [29] 모브갤로그로 이동합니다. 24.01.24 7079 32
242613 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [2962] 특갤용갤로그로 이동합니다. 23.08.06 38256 43
433260 공지 웬만하면 신문고에 문의 해주시면 차단 풀어드립니다 [1] 부패하는유전자!!!갤로그로 이동합니다. 24.03.06 2285 2
363220 공지 선형글 삭제 기준 [6] 특갤용갤로그로 이동합니다. 23.10.14 6944 24
375493 공지 필독) 유입 특붕이를 위한 AI 정보글 모음 (01/23) [40] ㅇㅇ(182.230) 23.11.11 12936 122
373402 공지 직업 비하, 조롱 글 30일 차단됩니다. [50] 특갤용갤로그로 이동합니다. 23.11.07 8657 79
385147 공지 구글의 AGI 분류 체계 [17] ㅇㅇ갤로그로 이동합니다. 23.11.22 8017 31
332612 공지 음모론 삭제 기준을 안내드립니다. [23] 특갤용갤로그로 이동합니다. 23.08.25 8888 30
259237 공지 특갤 용어 모음집 [6] 특갤용갤로그로 이동합니다. 23.08.09 22396 33
478764 일반 스칼렛 요한슨 성명문 알트만 ㅈ댄듯? [5] ㅇㅇ갤로그로 이동합니다. 07:54 164 2
478763 일반 보이스 기능 몇 달 후는 진짜 에반데.. [1] ㅇㅇ(218.157) 07:45 81 0
478762 일반 AI로 만든 이미지는 상업적 이용이 안 됨? ㅇㅇ(218.147) 07:44 29 0
478761 일반 오늘도 하루빨리 노동대체가 되길 간절히빌며 눈물의 출근길강행 [1] ㅇㅇ(221.154) 07:39 41 0
478760 일반 Chatbot Arena 순위 (하드프롬프트 적용) [6] 디붕이(121.190) 07:31 146 2
478758 일반 코파일럿에 4o탑제된거면 유료왜씀? [4] ㅇㅇ갤로그로 이동합니다. 07:08 183 0
478757 일반 남세동 "AGI가 오고 있다" [3] ㅇㅇ(125.143) 06:55 338 3
478756 일반 인공지능 목소리로 학습되서 유명해지면 [1] ㅇㅇ(110.46) 06:55 90 0
478755 일반 Gpt4o 사만다 애플출시보다 늦으면 ㅅㅂ [1] 연맛갤로그로 이동합니다. 06:46 145 0
478104 정보 '저작권 문제 없는' 그림 ai, 마침내 출시 [25] 한가운데갤로그로 이동합니다. 05.19 1310 13
478288 일반 얀르쿤의 개같은 복종을 보고싶다 [8] 늦네에특이점갤로그로 이동합니다. 05.20 410 8
478357 일반 특붕이 변기 고장난거 gpt4o한테 물어봐서 고침. [19] ㅇㅇ갤로그로 이동합니다. 05.20 1091 20
478482 일반 제미니 어드벤스드 에이전트 적용됨 지림 ㄷㄷㄷ [7] ㅇㅇ갤로그로 이동합니다. 05.20 523 12
478753 정보 속보) GPT-4o 음성 모드 출시 지연 (+수정) [31] Ad_Astra갤로그로 이동합니다. 06:14 513 3
478751 정보 "최적의 프롬프트 단어 수는 21개" 제미니 가이드북 발간 디시콘발사대갤로그로 이동합니다. 05:54 141 2
478750 일반 근데 gpt4o 인터넷검색 되는데 빙 왜씀 ㅇㅇ(124.54) 05:51 92 0
478749 정보 앤트로픽은 ASL-3에 도달시 모델 학습,배포 중지 약속 [7] ㅇㅇ(119.77) 05:45 251 0
478748 정보 앤트로픽, claude 3 opus의 4배 컴퓨팅 모델 교육 중 [2] ㅇㅇ(119.77) 05:37 187 3
478747 정보 코파일럿(by gpt-4o)와 함께하는 마인크래프트 [4] ㅇㅇ(119.77) 05:31 226 4
478745 일반 예측이 지능의 본질인 이유.4ai [16] ㅇㅇ(125.143) 05:15 311 1
478743 일반 홀로그램 과도기인가 [7] ㅇㅇ(223.39) 05:06 206 0
478742 일반 시발 좀 보이스 기능 언제푸냐! ㅇㅇ(118.235) 05:05 50 0
478741 일반 예측은 지능의 본질임 ㅇㅇ(125.143) 05:01 69 2
478740 일반 미래엔 책을 안읽겠네 [6] ㅇㅇ(223.39) 04:59 197 0
478739 일반 논문작성하기 가장 괜찮은 ai는 뭐냐 ㅇㅇ(49.96) 04:55 43 0
478738 일반 아직도 환각 심하냐? ㅇㅇ(1.240) 04:47 43 0
478737 일반 2025 AGI 믿는 이유.. [8] ㅇㅇ(125.143) 04:35 249 0
478736 일반 gpt 4o 정도면 충분히 혁신 같음 [2] ㅇㅇ(59.8) 04:32 210 2
478735 일반 솔직히 10년, 50년 뒤는 별로 안 바뀔 거 같고 500년 뒤가 궁금함 [6] .(49.142) 04:08 223 0
478734 일반 반도체 갤러리 보니까 [2] ㅇㅇ갤로그로 이동합니다. 04:07 186 0
478733 정보 AI가 고래 통신을 해독하는 방법 : 단파 ㅇㅇ갤로그로 이동합니다. 03:45 115 1
478732 일반 내 친구중에 엄마없이 자란 친구 있었는데 [5] ㅇㅇ(117.20) 03:45 286 0
478731 일반 코파일럿 pc 써보고싶다 [3] ㅇㅇ(119.77) 03:38 139 0
478730 일반 맥버전 gpt만 출시한 이유가 있었네 [2] ㅇㅇ갤로그로 이동합니다. 03:28 202 0
478729 정보 Copilot, 최신 OAI 모델 지원 예정 [1] ㅇㅇ(119.77) 03:27 304 1
478728 일반 Ai노트북 사양이 어떰? 겜트북급? [3] lIlIllIlIIlIlIllIlIl갤로그로 이동합니다. 03:10 143 1
478727 일반 거짓이 거짓임을 알수있는 이유 [7] ㅇㅇ(125.143) 03:09 310 0
478726 일반 Ai os가 생기면 [1] 잭더리퍼갤로그로 이동합니다. 03:01 123 0
478725 일반 ai노트북 <- 뭐가 들어있길래 그런 명칭임 [3] ㅇㅇ(211.171) 03:00 170 0
478723 일반 빨리 agi든 신약혁명이든와서 ㅇㅇ(111.91) 02:54 64 1
478722 일반 마소 저거 os까지 새로 내놓는다는거 아님? [2] 잭더리퍼갤로그로 이동합니다. 02:48 219 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2