(3강) Baseline 분석

💡
Baseline이 Task에 접근하는 두가지 방법에 대해 배운다.

Tabular Approach

Sequential한 정보를 집계하여, Table 형태로 접근할 수 있다.

Feature Engineering을 통해 집계 간 손실된 정보 등을 추가할 수 있다.

Validation Set을 구성할 떄는, 사용자 단위로 Split하여, Leackage가 발생하지 않도록 한다.

Sequential Approach

Sequentail data의 예시는 다음과 같다.

현재의 Baseline은 Many-to-Many의 형태이며, 이 중 가장 마지막 Output에 대해서만 Loss를 구하고 있다.

LSTM과 Transformer의 구조를 살펴보면 다음과 같다.

범주형 변수와 연속형 변수의 Embedding의 방법은 다음과 같다.

각 모델의 구현 Code는 다음과 같다.


Reference


Project

오늘의 목표 및 진척상황

  • Baseline 이해하기

직면했던 문제와 학습한 내용

  1. Baseline 이해하기

    Data의 Embedding 과정을 확인했다.

추가로 진행 할 사항

  • EDA 및 FE

'네이버 부스트캠프 AI Tech' 카테고리의 다른 글

[P4] Day 82 (21.05.27)  (0) 2021.06.26
[P4] Day 81 (21.05.26)  (0) 2021.06.26
[P4] Day 79 (21.05.24)  (0) 2021.06.26
[P3] ODQA Wrap-up Report  (0) 2021.06.26
[P3] Day 78 (21.05.21)  (0) 2021.06.26

+ Recent posts