Project
오늘의 목표 및 진척상황
- GRU Attention Model 실험
- Test ID 기준 Data Augmentation 실험
- User ID 기준 Validation Set Code 설계
직면했던 문제와 학습한 내용
- GRU Attention Model 실험
생각보다 GRU Model이 더 좋은 성능을 보여서 Attention Module을 붙여서 실험해보기로 했다. 일정 부분 성능에 개선이 있었으나, 생각보다 더 빠르게 과적합이 되는 모습을 보였다. 이에, 과적합을 막기 위해 Drop out rate를 높여봤고, Layer와 Head를 줄여보는 등의 실험을 진행했다.
- Test ID 기준 Data Augmentation 실험
Sequence의 길이가 짧아도 성능에 악영향이 없고, 각 User가 Test ID별로 Interaction을 발생시키고 있기 떄문에, Test ID 기준으로 Sequence를 구성하면 좋을 것이라 생각했다.
실제로, 위와 같은 Augmentation을 추가하자 약 20배에 가까운 Data를 얻을 수 있었다. 이 Data로 학습을 시켜보니, 성능에 큰 향상이 있었다.
팀 전체에 이 방법을 적용하였고, 실제로 팀 전체의 성능이 오르는 것을 확인할 수 있었다.
- User ID 기준 Validation Set Code 설계
위 Augmentation으로 성능 향상을 얻었지만, Validation에서 문제가 생길 수 있다는 생각이 들었다. Feature에 User를 식별할 수 있는 정보가 없긴 하지만, 행여나 이와 같은 Feature를 활용하는 팀원이 있거나, 내 Code에도 있을 수 있었기 때문에 Train과 Valid를 Split하는 Code를 새로 구성하기로 했다.
User ID 기준으로 먼저 Split을 하고, Test ID 기준으로 Augmentation하여 Squence를 구성하도록 Pipeline에 Code를 적용했다.
추가로 진행 할 사항
- 다양한 Model Architecture 실험
'네이버 부스트캠프 AI Tech' 카테고리의 다른 글
[P4] Saturday 12 June (21.06.12) (0) | 2021.06.26 |
---|---|
[P4] Day 93 (21.06.11) (0) | 2021.06.26 |
[P4] Day 91 (21.06.09) (0) | 2021.06.26 |
[P4] Day 90 (21.06.08) (0) | 2021.06.26 |
[P4] Day 89 (21.06.07) (0) | 2021.06.26 |
Uploaded by Notion2Tistory v1.1.0