(8강) ML Pipeline

💡
데이터, 전처리, 인코딩, 특징 선택, 특성 공학, 모델로 이어지는 Pipeline을 살펴본다.

Pipeline Code

Github Gist


Project

오늘의 목표 및 진척상황

  • Feature Selection
  • Baseline Option Setting

직면했던 문제와 학습한 내용

  1. Feature Selection

    나름 고심해서 만든 Feature였으나, 성능이 들쭉날쭉하게 나오고 있다. Validation의 문제도 있고, Feature에도 문제가 있는 것 같다. 이 문제를 어떻게 해결할 것인지 고민해보고 있다.

  1. Baseline Option Setting

    기본적으로 좋은 Option으로 Baseline을 구성하고 성능을 실험했다. AdamP와 CosineWarmup 등으로 Option을 조정했는데, 성능이 더 들쭉날쭉해졌다.

추가로 진행 할 사항

  • Validation 전략 수립하기

'네이버 부스트캠프 AI Tech' 카테고리의 다른 글

[P4] Day 88 (21.06.04)  (0) 2021.06.26
[P4] Day 87 (21.06.03)  (0) 2021.06.26
[P4] Day 85 (21.06.01)  (0) 2021.06.26
[P4] Day 84 (21.05.31)  (0) 2021.06.26
[P4] Sunday 31 May (21.05.31)  (0) 2021.06.26

+ Recent posts