디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] 트랜스포머 재밌는 특성(딥러닝갤 펌)

솔.이☆갤로그로 이동합니다. 2024.03.25 01:30:37
조회 3669 추천 35 댓글 25
														

a14b30ad2006b479aaf1c6bb11f11a39b526ab73cc4c1e53



캐리(carry)는 수학적인 덧셈이나 뺄셈 과정에서 한 자릿수의 계산 결과가 해당 자리의 최대값(대개 10)을 초과할 때 다음 자릿수로 넘겨주는 값을 의미합니다. 예를 들어, '8 + 7'의 계산에서 15가 되며, 이 경우 일의 자리인 5는 남기고, 10이 넘었으므로 1을 십의 자리로 넘겨주는데, 이를 '캐리'라고 합니다.

그러나 트랜스포머 알고리즘에서 말하는 '캐리'는 이와는 다소 다른 개념입니다. 트랜스포머 모델은 순차적인 데이터 처리를 위한 RNN이나 LSTM과 달리 '어텐션 메커니즘'을 사용하여 전체 시퀀스를 한 번에 처리합니다. 이 때문에 수학적 덧셈의 '캐리'와 같은 개념이 직접적으로 트랜스포머 모델에 적용되지는 않습니다.

트랜스포머 모델 내에서 시퀀스의 각 요소에 다른 요소들이 얼마나 중요한지를 결정하는 데 어텐션 메커니즘이 중심 역할을 하며, 이는 정보의 '가중치'를 분배하는 과정으로 볼 수 있습니다. 즉, 모델이 숫자를 거꾸로 처리하면서 높은 정확도를 보이는 것은 '캐리'가 아니라, 모델이 특정 정보(덧셈에서는 높은 자릿수의 숫자)에 더 높은 어텐션 가중치를 할당하여 이 정보를 더 잘 학습하기 때문일 수 있습니다.

따라서 이미지에서 보여지는 현상은 트랜스포머 모델이 숫자를 거꾸로 처리할 때, 어텐션 메커니즘을 통해 초기 단계에서 더 중요한 정보(예: 높은 자릿수의 숫자와 캐리)에 집중할 수 있기 때문에 더 나은 성능을 보이는 것으로 해석할 수 있습니다. 이는 트랜스포머의 어텐션 메커니즘이 전체 시퀀스에 대한 문맥을 학습하는 동안 중요한 정보를 강조하는 방식에 기인합니다.



얀르쿤이 왜 scale is all you need 에 부정적인지 이해가 될거 같기도 함...

자동등록방지

추천 비추천

35

고정닉 18

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2860 설문 경제관념 부족해서 돈 막 쓸 것 같은 스타는? 운영자 24/05/13 - -
412470 공지 레이 커즈와일 신간 6월 25일 발매 [27] 모브갤로그로 이동합니다. 24.01.24 6350 32
242613 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [2885] 특갤용갤로그로 이동합니다. 23.08.06 37536 41
433260 공지 웬만하면 신문고에 문의 해주시면 차단 풀어드립니다 [1] 부패하는유전자!!!갤로그로 이동합니다. 24.03.06 2021 2
363220 공지 선형글 삭제 기준 [6] 특갤용갤로그로 이동합니다. 23.10.14 6647 24
375493 공지 필독) 유입 특붕이를 위한 AI 정보글 모음 (01/23) [40] ㅇㅇ(182.230) 23.11.11 12483 122
373402 공지 직업 비하, 조롱 글 30일 차단됩니다. [50] 특갤용갤로그로 이동합니다. 23.11.07 8358 79
385147 공지 구글의 AGI 분류 체계 [16] ㅇㅇ갤로그로 이동합니다. 23.11.22 7632 30
332612 공지 음모론 삭제 기준을 안내드립니다. [23] 특갤용갤로그로 이동합니다. 23.08.25 8562 29
259237 공지 특갤 용어 모음집 [6] 특갤용갤로그로 이동합니다. 23.08.09 21962 33
474038 일반 지금 앱에서 쓰는 언어 입출력 개쩌는데 ㄷㄷㄷ ㅇㅍㅈ갤로그로 이동합니다. 05:42 22 0
474037 일반 진짜 사람같아 질수록 걱정하는 사람들이 많네 [1] ㅇㅇ(117.20) 05:40 33 0
474036 일반 플라잉 카는 언제 나오려나 ㅇㅇ(1.247) 05:25 28 0
474035 일반 오늘도 플랫한특갤ㅋㅋㅋㅋㅋ ㅇㅇ(222.102) 05:23 51 0
474033 일반 애초에 이든은 몇주째 부재중이었는데 ㅋㅋㅋ ㅇㅇ(220.118) 05:20 28 0
474032 일반 특이점 이후엔 대략 중동 산유국 처럼 되지 않을까? [2] ㅇㅇ(175.192) 05:18 44 0
474031 일반 이든 파딱 짤렸노 ㅋㅋㅋㅋ [1] ㅇㅇ(220.126) 05:17 74 0
474030 일반 특갤보면 양띵생각난다 ㅇㅇ(39.124) 05:14 45 0
474029 일반 진지하게 구글 ai스튜디오에서 1.5플래시 ㄱㄱ VV(223.38) 05:14 58 1
474028 일반 구글이 컨텍스트 렝쓰 늘리는 이유가 [2] ㅇㅇ(218.153) 05:11 60 1
474027 일반 gpt 4o 솔직히 별론데? [1] ㅇㅇ(180.66) 05:10 97 0
474026 일반 특갤의상징 사진 [2] ㅇㅇ(1.239) 05:10 65 0
474025 일반 특이점이온다 특이점은웃고있다 ㅇㅇ(119.207) 05:09 10 0
474024 일반 근데 AI의 발전이 꼭 유토피아만 있는건 아니지 않음? [5] ㅇㅇ갤로그로 이동합니다. 05:06 93 1
474023 일반 아니 gpt-4o 음성ai 반응속도 엄청 느린데? [16] ㅇㅇ(117.20) 05:03 218 0
474022 일반 ?됨게떻어 황근 주갤 일와즈커이레 [4] ㅇㅇ(211.118) 05:03 44 0
474021 일반 귀여운 땀르쿤 보고가삼 [1] ㅇㅇ(222.101) 05:01 45 1
474020 일반 갤주 성경 거꾸로 읽으니 읽을만하네 ㅇㅇ(175.192) 05:01 34 0
474019 일반 gpt gpt gpt!! ㅇㅇ(118.34) 05:00 14 0
474018 일반 컴공인데 네트워크 통신쪽으로 틀어야겠다. [7] ㅇㅇ(59.26) 04:59 103 0
474017 일반 야옹야옹 오픈ai ㅇㅇ(39.115) 04:58 28 0
474016 일반 제미나이 1.5 Flash 이거 1.5 Pro 썼던 사람이면 개이득임 [12] VV(223.38) 04:57 113 0
474015 일반 gpt4o 신기능 언제열림? 사만다 [1] ㅇㅇ(121.147) 04:56 55 0
474014 일반 근데 gpt발전하면 개랑도 대화할수있지않을까 ㅇㅇ(1.240) 04:50 27 0
474013 일반 앤트로픽은 발표회 언제함? zsefa갤로그로 이동합니다. 04:48 34 0
474012 일반 구글 쉴드가 아직도 있네 ㅋㅋ ㅇㅇ(58.78) 04:43 58 0
474011 일반 구글에.애이아이는.은제.애이.지.아이.달성하나요 [1] 떼껄룩해적단갤로그로 이동합니다. 04:40 77 0
474010 일반 구글은 여전히 병신이네 ㅇㅇ(125.134) 04:37 59 0
474009 일반 제미나이 진짜 존나 웃기네ㅋㅋㅋㅋㅋ [7] ㅇㅇ(118.223) 04:34 321 11
474008 일반 요새 기술로는 마이크로 카메라를 안경에 심는거야 일도 아니지 [2] ㅇㅇ(175.192) 04:32 92 0
474007 일반 유튜브 뉴스보니까 그놈의 "무섭다" [11] 껌젖갤로그로 이동합니다. 04:31 208 2
474006 일반 사실 제미니도 oai가 만든거임 ㅇㅇ(106.101) 04:27 85 0
474004 일반 구글과 OAI는 다른 전략을 쓸수밖에없는데 [5] ㅇㅇ(218.153) 04:25 163 0
474003 일반 삼성이 살려면 이 방법밖에 없다 ㅇㅇ(58.78) 04:24 94 0
474002 일반 현재패턴대로면 미래가 보임 맘보토갤로그로 이동합니다. 04:24 137 0
474001 일반 진짜 1.5 울트라도 없는 건 충격적이다 ㅇㅇ갤로그로 이동합니다. 04:23 73 0
474000 일반 그래서 특이점언제옴? [1] ㅇㅇ(222.232) 04:22 58 0
473999 정보 gemma 2 27b llama3 70b랑 비빈다고 함 [5] (223.38) 04:18 184 1
473998 일반 이 와중에 gpt-4o 근황.png [7] ㅇㅇ(14.63) 04:17 333 1
473997 일반 오늘 보니까 결국 구글이 이길 수 밖에 없는게 [4] 걸갤러(125.187) 04:16 252 0
473996 일반 뜬금없긴 한데 애플도 생각보다는 ai기술 좀 있는 것 같기도 하고 [1] ㅇㅇ(118.223) 04:15 113 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2