Winodw에서 Mecab 사용하기
사용 이유
프로젝트 데이터 전처리 과정 중 OKT, 바른AI 외에 Mecab이 속도면에서 빠르기 때문에 Mecab을 사용하고자 했다
그런데, Mecab은 일반적인 KoNlpy와 다르게 설치 과정이 조금 까다롭고, Window에서도 지원해주지 않는다
따라서 구글링을 통해 설치를 진행하였다
1. Visual C++ 업그레이드
Mecab은 Visual C++ 14.0 이상 버전을 사용해야 했다.
커뮤니티 버전을 받고, 1차 다운로드가 완료되면
선택창이 뜬다
선택창에서 C++만 업데이트 해주면 되기 때문에 데스크톱 및 모바일에서 C++을 사용한 데스크톱 개발을 눌러준다.
설치가 완료되면 다음 단계로 진행한다
2. Mecab(은전 한 닢) window 설치
설치 위치에 bash 창을 열어준다
! git clone https://github.com/SOMJANG/Mecab-ko-for-Google-Colab.git
! bash Mecab-ko-for-Google-Colab/install_mecab-ko_on_colab190912.sh
해당 명령어를 사용한 뒤 python에 들어가서
pip install eunjeon
을 받아준다
설치 이후
from enjeon import Mecab
mecab = Mecab()
으로 사용할 수 있다
3. Mecab(KoNlpy) EC2 서버 설치
우선 python이 설치되어있는지 확인하고(기본적으로 3.8 버전이 설치되어있다)
Konlpy를 설치한다
pip install konlpy
pip install JPye1
이후 다음 단계를 통해 Mecab을 설치한다
wget https://bitbucket.org/eunjeon/mecab-ko/downloads/mecab-0.996-ko-0.9.2.tar.gz
tar xvfz mecab-0.996-ko-0.9.2.tar.gz
cd mecab-0.996-ko-0.9.2
./configure
make
make check
make install
sudo ldconfig
mecab --version
여기서 make와 같이 따로 설치해줘야 하는 아이들도
pip install make
와 같이 설치해준다
Mecab이 설치되었으면 Mecab-ko-dic를 설치 한다
wget https://bitbucket.org/eunjeon/mecab-ko-dic/downloads/mecab-ko-dic-2.1.1-20180720.tar.gz
tar xvfz mecab-ko-dic-2.1.1-20180720.tar.gz
cd mecab-ko-dic-2.1.1-20180720
./configure
make
make install
설치 완료 이후
sudo apt install curl
sudo apt install git
bash <(curl -s https://raw.githubusercontent.com/konlpy/konlpy/master/scripts/mecab.sh)
pip install mecab-python
로 사용하면 된다
참고
https://han-py.tistory.com/m/283
'프로젝트' 카테고리의 다른 글
org.h2.jdbc.JdbcSQLNonTransientConnectionException 에러 해결 (0) | 2024.06.08 |
---|---|
IntelliJ Invalid VSC root mapping 오류 해결 (0) | 2024.06.07 |
QueryDsl Fetch Join Query문 비교 (0) | 2024.05.30 |
구글 바드 API 오류 해결 (0) | 2023.12.10 |
카카오 디버그 키 해시 가져오기 (1) | 2023.11.27 |