(10강) QA with Phrase Retrieval
Phrase Retireval in Open-Domain Question Answering
이전까지 살펴본 ODQA에 대한 접근 방식은 다음과 같은 한계점을 지니고 있다. 먼저, Retrieval 단계에서 정확한 Phasage를 찾지 못하는 경우 Redear에서는 정답을 찾을 수 없는 Error Propagation의 문제가 있다. 다음으로, Query에 따라 Answer Span의 Encoding이 달라지는 점이다.
이에 대한 한가지 방법으로 Phrase Indexing 방식을 고려할 수 있다.
Dense-sparse Representation for Phrases
Phrase의 정보를 보다 정확하게 파악하기 위해 두 Embedding 방식을 모두 활용해볼 수 있다.
세부적으로 각 Embedding을 활용하는 과정을 살펴보면 다음과 같다.
위와 같은 방법은 Scale이 매우 클 경우 엄청난 자원을 소요한다. 이에 대한 방법으로, FAISS와 같은 Search를 먼저 수행해볼 수 있다.
Experiment Results & Analysis
위와 같은 형태의 접근의 결과를 살펴보면 다음과 같다.
Reference
Real-Time Open-Domain Question Answering with Dense-Sparse Phrase Index
Contextualized Sparse Representations for Real-Time Open-Domain Question Answering
Project
오늘의 목표 및 진척상황
- 밀린 강의 수강 및 실습 Code 학습
직면했던 문제와 학습한 내용
- 밀린 강의 수강 및 실습 Code 학습
드디어 밀린 강의와 실습 Code 등 복습을 완료했다. 이번 Competition은 이전만큼 집중하지 못하고 있는 것 같다는 생각이 든다. Team Code 빨리 이해하고, 얼른 성과를 내야겠다.
추가로 진행 할 사항
- Team Code 이해 및 개인 Code 작성
- Validating per Steps Code 개선
'네이버 부스트캠프 AI Tech' 카테고리의 다른 글
[P3] Day 70 (21.05.10) (0) | 2021.06.26 |
---|---|
[P3] Day 69 (21.05.07) (0) | 2021.06.26 |
[P2] Holiday 5 May (21.05.05) (0) | 2021.06.26 |
[P3] Day 67 (21.05.04) (0) | 2021.06.26 |
[P3] Day 66 (21.05.03) (0) | 2021.06.26 |
Uploaded by Notion2Tistory v1.1.0