본문 바로가기
프로젝트

Window에서 Mecab 사용하기

by Dr.섭도 2023. 9. 18.

Winodw에서 Mecab 사용하기

사용 이유

프로젝트 데이터 전처리 과정 중 OKT, 바른AI 외에 Mecab이 속도면에서 빠르기 때문에 Mecab을 사용하고자 했다
그런데, Mecab은 일반적인 KoNlpy와 다르게 설치 과정이 조금 까다롭고, Window에서도 지원해주지 않는다
따라서 구글링을 통해 설치를 진행하였다

1. Visual C++ 업그레이드

Mecab은 Visual C++ 14.0 이상 버전을 사용해야 했다.

Visual Studio 다운로드

커뮤니티 버전을 받고, 1차 다운로드가 완료되면
선택창이 뜬다

선택창에서 C++만 업데이트 해주면 되기 때문에 데스크톱 및 모바일에서 C++을 사용한 데스크톱 개발을 눌러준다.

설치가 완료되면 다음 단계로 진행한다

2. Mecab(은전 한 닢) window 설치

설치 위치에 bash 창을 열어준다

 ! git clone https://github.com/SOMJANG/Mecab-ko-for-Google-Colab.git
 ! bash Mecab-ko-for-Google-Colab/install_mecab-ko_on_colab190912.sh

해당 명령어를 사용한 뒤 python에 들어가서

 pip install eunjeon

을 받아준다

설치 이후

 from enjeon import Mecab
 mecab = Mecab()

으로 사용할 수 있다

3. Mecab(KoNlpy) EC2 서버 설치

우선 python이 설치되어있는지 확인하고(기본적으로 3.8 버전이 설치되어있다)

Konlpy를 설치한다

 pip install konlpy
 pip install JPye1

이후 다음 단계를 통해 Mecab을 설치한다

wget https://bitbucket.org/eunjeon/mecab-ko/downloads/mecab-0.996-ko-0.9.2.tar.gz
tar xvfz mecab-0.996-ko-0.9.2.tar.gz
cd mecab-0.996-ko-0.9.2
./configure
make
make check
make install
sudo ldconfig
mecab --version

여기서 make와 같이 따로 설치해줘야 하는 아이들도

pip install make

와 같이 설치해준다

Mecab이 설치되었으면 Mecab-ko-dic를 설치 한다

wget https://bitbucket.org/eunjeon/mecab-ko-dic/downloads/mecab-ko-dic-2.1.1-20180720.tar.gz
tar xvfz mecab-ko-dic-2.1.1-20180720.tar.gz
cd mecab-ko-dic-2.1.1-20180720
./configure
make
make install

설치 완료 이후

sudo apt install curl
sudo apt install git
bash <(curl -s https://raw.githubusercontent.com/konlpy/konlpy/master/scripts/mecab.sh)
pip install mecab-python

로 사용하면 된다


참고

https://han-py.tistory.com/m/283

https://mithumbsup.tistory.com/12

https://vhrehfdl.tistory.com/129