작년 한창 사전구축과 번역에 대해서 공부할때 ACL(Association for Computational Linguistics)에 게재되었던 논문 중 하나를 골라 읽고 발표를 했었는데 그때의 자료다.
한창 NLP 테크닉에 대해 공부하던 때라 통계적 기법을 처음으로 접했던 때다.
본 ppt의 내용은 우선 논문에서 사용되었던 기술들의 기초에 대해 설명한다.
SMT기법을 설명하기 위해 IBM에서 발표했었던 IBM model1과 더불어 EM algorithm에 대해 설명한다.
그 후 논문 내용을 살펴보고 평가방법에 대해서 살펴본다.
한국어로 적었으면 더 좋았으려나? 모르겠다. 간간히 영어로 적기 귀찮아서 한글로 쓴게 보인다.
다운받아보는 어떤 이가 흥미있게 봐주길... 그치만 사소한 영어 문법은 넘어가주길...
The most important thing is how to do.
※수정 및 배포를 허용하지 않습니다.(나도 논문 결과를 마음대로 이렇게 게재해도 되는지 모름)
Mining for Domain-specific Parallel Text from Wikipedia.pptx
'IT · CS > NLP Tech' 카테고리의 다른 글
C++ Porter's Stemmer 구현. (0) | 2014.04.20 |
---|---|
Regular Expression and Automata (0) | 2014.04.09 |