devmoa

고등학생도 이해하는 Transformer (Deep Learning) #5

데보션·2024년 11월 13일·00
Transformer딥러닝내적Linear LayerMNISTPython

AI 요약

Beta

본 글은 딥러닝의 핵심 개념인 Transformer를 고등학생도 이해할 수 있도록 설명하는 시리즈의 일부입니다. 이전 글에서 벡터의 내적이 유사성을 나타내는 중요한 지표임을 설명했으며, 이번 글에서는 이 내적의 개념을 실제 코드로 구현하고 기본적인 딥러닝 모듈인 Linear Layer를 통해 학습하는 과정을 다룹니다.

특히, MNIST 데이터셋을 활용하여 손글씨 숫자를 분류하는 태스크를 예시로 들며, 네트워크 설계부터 학습까지의 과정을 그림과 함께 최대한 쉽게 설명하고자 합니다. Python 코드를 직접적으로 사용하기보다는 그림을 통해 개념을 직관적으로 이해시키는 데 초점을 맞추고 있습니다.

이 글이 궁금하신가요?

원문 블로그에서 전체 내용을 확인해 보세요

원문 읽으러 가기

AI 추천 연관 게시글

이 글과 관련된 다른 기술 블로그 글을 AI가 추천합니다