- 오픈 소스 형태소 분석 엔진
2. 설치 및 사용
- mecab-ko 설치
https://bitbucket.org/eunjeon/mecab-ko/downloads 다운로드 링크
$ tar zxfv mecab-XX-ko-XX.tar.gz $ cd mecab-XX-ko-XX $ ./configure $ make $ make check $ su # make install
- mecab-ko-dic 설치
https://bitbucket.org/eunjeon/mecab-ko-dic/downloads 다운로드 링크
$ tar zxfv mecab-ko-dic-XX.tar.gz $ cd mecab-ko-dic-XX $ ./configure $ make $ su # make install
* automake 버전 문제로 설치 도중에 에러가 발생하는 경우
선택1) automake 1.11 설치 후 재시도
선택2) autogen.sh 실행 후 재시도
$ tar zxfv mecab-ko-dic-XX.tar.gz $ cd mecab-ko-dic-XX $ ./autogen.sh $ configure $ make $ su # make install
* libmecab.so.2를 찾을 수 없는 에러가 발생하는 경우
- 라이브러리를 다시 링크하고 확인 후 재시도
$ sudo ldconfig
- 사용
$ mecab -d /usr/local/lib/mecab/dic/mecab-ko-dic
1) 형태소 분석하고 싶은 문장을 입력
mecab-ko-dic은 MeCab을 사용하여, 한국어 형태소 분석을 하기 위한 프로젝트입니다.
2) 분석된 결과가 출력
mecab SL,*,*,*,*,*,*,* - SY,*,*,*,*,*,*,* ko SL,*,*,*,*,*,*,* - SY,*,*,*,*,*,*,* dic SL,*,*,*,*,*,*,* 은 JX,*,T,은,*,*,*,* MeCab SL,*,*,*,*,*,*,* 을 JKO,*,T,을,*,*,*,* 사용 NNG,*,T,사용,*,*,*,* 하 XSV,*,F,하,*,*,*,* 여 EC,*,F,여,*,*,*,* , SC,*,*,*,*,*,*,* 한국어 NNG,*,F,한국어,Compound,*,*,한국/NNG/*+어/NNG/* 형태소 NNG,*,F,형태소,Compound,*,*,형태/NNG/*+소/NNG/* 분석 NNG,*,T,분석,*,*,*,* 을 JKO,*,T,을,*,*,*,* 하 VV,*,F,하,*,*,*,* 기 ETN,*,F,기,*,*,*,* 위한 VV+ETM,*,T,위한,Inflect,VV,ETM,위하/VV/*+ᆫ/ETM/* 프로젝트 NNG,*,F,프로젝트,*,*,*,* 입니다 VCP+EF,*,F,입니다,Inflect,VCP,EF,이/VCP/*+ᄇ니다/EF/* . SF,*,*,*,*,*,*,* EOS
* mecab_ko_dic에서 사용하는 사전 형식 or 품사 태그 정보
https://docs.google.com/spreadsheet/ccc?key=0ApcJghR6UMXxdEdURGY2YzIwb3dSZ290RFpSaUkzZ0E&usp=sharing
https://bitbucket.org/eunjeon/mecab-ko-dic 이 주소를 참고하였습니다.