NLP

PreProcess. Konlpy 복합어 등록

jenyy 2021. 5. 30. 16:07

프로젝트 주제에 따라서 복합어를 등록해야 할 필요가 있습니다. 예를 들어 '문제해결능력'을 konlpy의 여러 형태소 분석기를 이용해 명사 추출을 하면 아래와 같이 각각의 분석기 사전에 등록된 대로 추출이 됩니다. 또, 분석하는 도메인에 따라서 고유 명사를 지정해 줄 필요가 있기 때문에 이런 경우 Cutomized Konlpy를 사용할 수 있습니다. 

 

 

  • 다음과 같이 Konlpy 단어사전에는 영어가 없기때문에 가끔 영어 고유명사가 있을 경우 함께 분석하기가 어렵습니다. 

 

1. 복합어 등록 예제 

  • ckonlpy.tag를 통해서 단어사전에 분석에 맞게끔 추가했기 때문에 다음과 같이 결과가 나오는 것을 알 수 있습니다.  

'NLP' 카테고리의 다른 글

PreProcess. Re 영어 문자 전처리  (0) 2021.06.06