(3강) Baseline 분석
Tabular Approach
Sequential한 정보를 집계하여, Table 형태로 접근할 수 있다.
Feature Engineering을 통해 집계 간 손실된 정보 등을 추가할 수 있다.
Validation Set을 구성할 떄는, 사용자 단위로 Split하여, Leackage가 발생하지 않도록 한다.
Sequential Approach
Sequentail data의 예시는 다음과 같다.
현재의 Baseline은 Many-to-Many의 형태이며, 이 중 가장 마지막 Output에 대해서만 Loss를 구하고 있다.
LSTM과 Transformer의 구조를 살펴보면 다음과 같다.
범주형 변수와 연속형 변수의 Embedding의 방법은 다음과 같다.
각 모델의 구현 Code는 다음과 같다.
Reference
Project
오늘의 목표 및 진척상황
- Baseline 이해하기
직면했던 문제와 학습한 내용
- Baseline 이해하기
Data의 Embedding 과정을 확인했다.
추가로 진행 할 사항
- EDA 및 FE
'네이버 부스트캠프 AI Tech' 카테고리의 다른 글
[P4] Day 82 (21.05.27) (0) | 2021.06.26 |
---|---|
[P4] Day 81 (21.05.26) (0) | 2021.06.26 |
[P4] Day 79 (21.05.24) (0) | 2021.06.26 |
[P3] ODQA Wrap-up Report (0) | 2021.06.26 |
[P3] Day 78 (21.05.21) (0) | 2021.06.26 |
Uploaded by Notion2Tistory v1.1.0