(10강) QA with Phrase Retrieval

💡
Phrase Retireval을 활용한 ODQA에 대해 알아본다.

Phrase Retireval in Open-Domain Question Answering

이전까지 살펴본 ODQA에 대한 접근 방식은 다음과 같은 한계점을 지니고 있다. 먼저, Retrieval 단계에서 정확한 Phasage를 찾지 못하는 경우 Redear에서는 정답을 찾을 수 없는 Error Propagation의 문제가 있다. 다음으로, Query에 따라 Answer Span의 Encoding이 달라지는 점이다.

이에 대한 한가지 방법으로 Phrase Indexing 방식을 고려할 수 있다.

Dense-sparse Representation for Phrases

Phrase의 정보를 보다 정확하게 파악하기 위해 두 Embedding 방식을 모두 활용해볼 수 있다.

세부적으로 각 Embedding을 활용하는 과정을 살펴보면 다음과 같다.

위와 같은 방법은 Scale이 매우 클 경우 엄청난 자원을 소요한다. 이에 대한 방법으로, FAISS와 같은 Search를 먼저 수행해볼 수 있다.

Experiment Results & Analysis

위와 같은 형태의 접근의 결과를 살펴보면 다음과 같다.


Reference

Real-Time Open-Domain Question Answering with Dense-Sparse Phrase Index

Contextualized Sparse Representations for Real-Time Open-Domain Question Answering


Project

오늘의 목표 및 진척상황

  • 밀린 강의 수강 및 실습 Code 학습

직면했던 문제와 학습한 내용

  1. 밀린 강의 수강 및 실습 Code 학습

    드디어 밀린 강의와 실습 Code 등 복습을 완료했다. 이번 Competition은 이전만큼 집중하지 못하고 있는 것 같다는 생각이 든다. Team Code 빨리 이해하고, 얼른 성과를 내야겠다.

추가로 진행 할 사항

  • Team Code 이해 및 개인 Code 작성
  • Validating per Steps Code 개선

'네이버 부스트캠프 AI Tech' 카테고리의 다른 글

[P3] Day 70 (21.05.10)  (0) 2021.06.26
[P3] Day 69 (21.05.07)  (0) 2021.06.26
[P2] Holiday 5 May (21.05.05)  (0) 2021.06.26
[P3] Day 67 (21.05.04)  (0) 2021.06.26
[P3] Day 66 (21.05.03)  (0) 2021.06.26

+ Recent posts