디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] 오늘 올라온 클로드3의 미친 언어 능력 테스트

ㅇㅇ(115.138) 2024.03.06 10:07:11
조회 3971 추천 42 댓글 13
														

원글 링크: https://twitter.com/hahahahohohe/status/1765088860592394250



번역된거 올려봄 번역은 클로드가 해줌:


오늘 @AnthropicAI의 새로운 모델 Claude 3 Opus를 테스트하는 동안 너무나 놀라운 일을 목격했습니다. 마치 기적 같은 느낌이었습니다. 거짓말처럼 들릴 수 있지만, 정말 그렇게 느껴졌습니다.


중요한 배경 설명을 하자면, 저는 지난 2년 동안 제 모국어인 체르케스어에 대한 자연어 처리 작업을 해왔습니다. 체르케스어는 매우 자원이 부족하고 인터넷 상에서의 존재감도 미미합니다. 체르케스-압하즈 고립어군에 속하며, 관련 언어가 없습니다. 복잡한 형태론과 제한된 데이터로 인해 언어 모델에게 심각한 도전이 됩니다.


이 기간 동안 저는 부족한 자료에서 6만 4천 개의 번역 쌍을 손수 모으고, 전문화된 모델(T5, MLM-100, NLLB-200 등)을 훈련시켜 적절한 러시아어-카바르디아어 기계 번역을 달성했습니다. Claude Opus로 실험을 해보기로 했습니다.


새로운 채팅을 시작하고 단어/문장의 번역 쌍 5,700개를 무작위로 선택하여 첨부했습니다. 이는 6만 4천 개 데이터셋의 일부에 불과하며, 전체 어휘를 다루지도 않습니다. 이 예제를 바탕으로 새로운 문장을 번역할 수 있는지 확인하기 위함이었습니다. 


별 기대 없이 러시아어로 된 간단한 문장 "I am lying in the bed"를 체르케스어로 번역해 달라고 요청했습니다. Claude는 완벽한 번역을 제공했을 뿐만 아니라 문법과 형태론까지 분석했습니다. 


분명히 운이 좋았고 이 문장이 예제에 있었을 거라고 생각했습니다. 그러나 아니었습니다. 데이터에 절대 있을 수 없는 독특한 문장을 만들어 보았습니다. 다시 한번 완벽한 번역과 분석이 이루어졌습니다. 


적은 양의 데이터로 Claude는 기계 번역을 위해 특별히 훈련된 제 전문 모델의 성능에 근접했습니다. 믿기지 않았습니다. 문학작품의 복잡한 구절, 최신 뉴스 기사, 심지어 문법과 표기 체계가 상당히 다른 다른 체르케스 방언의 텍스트로 더 테스트한 결과, Claude는 지속적으로 언어 구조에 대한 깊은 이해를 보여주었습니다. 


알 수 없는 단어를 지능적으로 유추하고, 차용어를 적절히 사용하며, 그럴듯한 어원 분석을 제공하고, 번역에서 원문의 스타일을 유지하고, 심지어 요청 시 새로운 용어를 만들어냈습니다. 이 모든 것이 샘플 세트에는 없었고, 단지 몇 천 개의 번역 쌍만 있었습니다.


체르케스어는 복잡한 형태론과 문법을 가진 매우 어려운 교착어입니다. 이러한 작업을 완수하려면 언어에 대한 깊은 이해가 필요하며, 동일한 입력이 주어졌을 때 그 언어에 익숙하지 않은 언어학자라면 1년 정도 걸릴 것입니다. 그런데 Opus는 불과 5,700개의 무작위 번역 쌍으로 1분도 안 되어 이러한 미묘한 차이를 쉽게 파악했습니다.


비교를 위해 GPT-4에서도 동일한 테스트를 해보았는데, 완전히 실패했습니다. 가장 간단한 문장조차 번역을 거부했고, 문법적 복잡성은 말할 것도 없었습니다. 이전에 GPT-3.5를 비슷한 데이터셋으로 파인튜닝해 본 적이 있는데, 결과는 그저 잡음이었습니다. 


Anthropic이 이 모델로 무엇을 했는지 모르겠지만, 다른 어떤 것과도 완전히 다릅니다. 많은 사람들이 합성 벤치마크에서 선두를 달리는 것에 회의적이지만, 제가 목격한 것은 훈련 데이터셋에 0%의 가능성으로 포함되어 있을 새롭고 매우 도전적인 벤치마크에서의 눈부신 결과입니다.


오염 가능성을 테스트하기 위해 샘플 번역을 첨부하지 않고 동일한 프롬프트를 시도해 보았는데, Claude는 체르케스어에 익숙하지 않다고 말하며 실패하고 대답을 거부했습니다. 


이것의 의미는 심오합니다. 제가 2년간 전념해 온 작업을 Claude는 몇 천 개의 예제로 해냈습니다. 이는 자원이 부족한 언어와 많은 다른 분야에 있어 엄청난 도약입니다. 먼 미래에나 일어날 것으로 예상했던 일이 오늘 일어났습니다. 미래는 이미 여기 있고, 그것은 놀랍습니다.




7cf3da36e2f206a26d81f6e74787766f8d

7ff3da36e2f206a26d81f6e44e85706b16






클로드 쓰면서 언어 능력 참 좋다고 느끼긴 했는데 이정도였다니? 대단하네

자동등록방지

추천 비추천

42

고정닉 14

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2858 설문 SNS로 싸우면 절대 안 질 것 같은 고집 있는 스타는? 운영자 24/05/06 - -
412470 공지 레이 커즈와일 신간 6월 25일 발매 [27] 모브갤로그로 이동합니다. 24.01.24 5606 32
242613 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [2842] 특갤용갤로그로 이동합니다. 23.08.06 36968 41
433260 공지 웬만하면 신문고에 문의 해주시면 차단 풀어드립니다 [1] 부패하는유전자!!!갤로그로 이동합니다. 24.03.06 1835 2
363220 공지 선형글 삭제 기준 [6] 특갤용갤로그로 이동합니다. 23.10.14 6417 24
375493 공지 필독) 유입 특붕이를 위한 AI 정보글 모음 (01/23) [40] ㅇㅇ(182.230) 23.11.11 12158 122
373402 공지 직업 비하, 조롱 글 30일 차단됩니다. [50] 특갤용갤로그로 이동합니다. 23.11.07 8172 79
385147 공지 구글의 AGI 분류 체계 [16] ㅇㅇ갤로그로 이동합니다. 23.11.22 7321 30
332612 공지 음모론 삭제 기준을 안내드립니다. [23] 특갤용갤로그로 이동합니다. 23.08.25 8331 29
259237 공지 특갤 용어 모음집 [6] 특갤용갤로그로 이동합니다. 23.08.09 21609 33
465764 일반 특이점오면 날씨제어도 ㄱㄴ? ㅇㅇ(118.235) 15:58 0 0
465763 일반 오늘도 노동해방과 특이점을 향한 기도를 올립니다 [3] ㅇㅇ(219.240) 15:56 18 0
465762 일반 특이점갤에 쓰는 아날로그 글 ㅇㅇ(219.240) 15:56 8 0
465761 일반 그래서 월요일엔 agi만 나오고 끝이라는거지? [1] ㅇㅇ(118.235) 15:55 21 0
465759 일반 also도 몇번 쓰다보니까 별거 없는 거처럼 느껴진다 [1] 매직ai갤로그로 이동합니다. 15:53 35 0
465758 일반 월요일까지 겨울이네... [3] ㅇㅇ(121.124) 15:49 35 0
465757 일반 너무 기대하지는 말자 [1] 매직ai갤로그로 이동합니다. 15:45 50 0
465756 일반 모델 이름이 시드니일 수도 ㅇㅍㅈ갤로그로 이동합니다. 15:42 28 0
465755 일반 지금 사람들이 착각하는게 [3] ㅇㅇ(117.20) 15:35 168 0
465754 일반 그래서 agi는 언제나오나요 ㅇㅇ(115.139) 15:34 25 0
465753 일반 워렌버핏 불쌍하다 [4] ㅇㅇ(125.180) 15:30 122 0
465752 일반 알트만 게이 여유로운거 보니까 내부 agi 있을듯 [1] ㅇㅇ(175.209) 15:26 94 1
465751 일반 이루다랑도 연애하는데 openai는 왜 안된다고 생각하냐? [1] 딩둘딩갤로그로 이동합니다. 15:22 80 0
465750 일반 24살 잔고 ㅁㅌㅊ? [9] ㅇㅇ(180.226) 15:20 219 1
465748 일반 장기기억에 대한 실마리도 없는데 뭔 her 임 ㅋㅋㅋㅋㅋ [3] ㅇㅇ(125.134) 15:17 115 0
465747 일반 근데 her나와도 연애는 아직 좀 시기상조 아님? [2] ㅇㅇ(220.83) 15:16 94 0
465744 일반 그래서 이번 발표때 AGI 엑조디아 뭐뭐 나오는데 ㅇㅇ(121.124) 15:14 34 0
465742 일반 갤이 Her로 도배돼있네 [3] ㅇㅇ갤로그로 이동합니다. 15:14 118 0
465741 일반 만약에 VR 기기랑 AI가 연결된다면 [2] 천사다천사갤로그로 이동합니다. 15:13 62 0
465740 일반 Chat GPT 플러스 모바일로 결제해도 PC에서 이용 가능함? [4] ㅇㅇ갤로그로 이동합니다. 15:11 61 0
465739 일반 보이스엔진으로 아나운서 성우 상담사 완전대체 가능? [6] ㅇㅇ(124.56) 15:08 78 0
465738 일반 음성으로 아이폰 조작하는 정도면 GPT-4 수준으로 할 수 있을 듯 ㅇㅇ(120.142) 15:07 39 0
465737 일반 근데 스마트폰에 수준급 온디바이스 ai 탑재되면 진짜 편할듯 [2] ㅇㅇ갤로그로 이동합니다. 15:03 73 0
465735 일반 GPT5는 AGI 엑조디아 다 모으고 나서 출시할듯 [3] ㅇㅇ갤로그로 이동합니다. 15:00 163 1
465734 일반 이번 발표 기대 전혀 안되는 이유 [2] ㅇㅇ(125.140) 14:58 140 0
465733 일반 GPTs도 1시간 대화제한잇음>? ㅇㅇ(218.146) 14:57 32 0
465732 일반 장기기억은 어떻게 하려고 her 특들갑이야 [1] ㅇㅇ갤로그로 이동합니다. 14:56 100 0
465731 일반 나는 gpt의 지능 자체가 업그레이드 되는걸 원하는데 천사다천사갤로그로 이동합니다. 14:56 48 1
465730 일반 미소노 미카랑 결혼하는게 꿈이다 [1] ㅇㅇ(211.246) 14:55 60 0
465729 일반 특이점이 온다. ㅇㅇ(1.239) 14:55 24 0
465728 일반 뭐가 됐든 애플 독점은 절대 아님 ㅇㅍㅈ갤로그로 이동합니다. 14:55 47 1
465727 일반 her 보면서 이상하게 여겼던 부분 [3] ㅇㅇ(119.207) 14:54 112 0
465726 일반 한가지 확실한건 사람이랑 구분 불가능한건 확실하다 ㅇㅇ(117.20) 14:53 58 0
465724 일반 her 나오면 진짜 다 설득 당해서 좆될 수 있음 ㄷㄷ [3] ㅇㅇ(121.188) 14:51 148 0
465723 일반 Agi 뭐 진척된 거 있음? [4] ㅇㅇ갤로그로 이동합니다. 14:50 107 0
465722 일반 세상이 바뀔 거대한 뭔가가 오긴 오나보다 [2] ㅇㅇ(218.147) 14:50 76 0
465720 일반 이번에 voice engine 나온다는거라고 보면 될거같음 딩둘딩갤로그로 이동합니다. 14:48 56 0
465718 일반 이번 gpt2가 gpt4보다 압도적으로 좋음? [3] ㅇㅇ갤로그로 이동합니다. 14:45 101 0
465717 일반 openai가 애플이랑 협업 할 이유 없는게 [1] 딩둘딩갤로그로 이동합니다. 14:45 66 0
465716 일반 아이폰에 Her 탑재되면 큰일난다 게이들아 [4] ㅇㅇ(118.223) 14:41 224 0
465715 일반 알트만"ubi대신 gpt7의 일부를 얻을 수 있는 보편적 기본 컴퓨팅필요 [10] ㅇㅇ(121.188) 14:40 167 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2