Data Engineering(Pipeline, Hadoop...)/Docker

Docker 컨테이너(jupyter)로 khaiii 형태소분석기 실행해보기

dtstory 2022. 9. 21. 18:34

 

# 도커 컨테이너(tensorflow jupyter) 생성

docker run -d -p [포트 번호]:8888 --name [컨테이너 이름] tensorflow/tensorflow:latest-jupyter

 

# 컨테이너 커맨드 접속

docker exec -it [컨테이너 이름] /bin/bash

 

# cmake(빌드 도구) 설치 - 다양한 운영체제에서 문제없이 빌드하기 위해 필요

pip install cmake

 

# git 저장소 clone

git clone https://github.com/kakao/khaiii.git
cd khaiii
mkdir build
cd build

CXXFLAGS="-Wno-error=deprecated-copy" cmake ..

 

# cmake로 khaiii, 리소스 빌드

make all
make resource

 

# locale 지정

apt-get update -y
apt-get install locales-all
apt-get install -y language-pack-ko
locale-gen ko_KR.UTF-8
update-locale LANG=ko_KR.UTF-8

 

# python 바인딩

ctest
make install
make package_python
cd package_python
pip install .

 

# jupyter notebook 토큰 값 확인

jupyter notebook list

 

# GCP 방화벽 [포트 번호] 허용

VPC 네트워크 - 방화벽 - 방화벽  규칙 만들기 - [포트번호] 허용 설정


# http://[외부ip]:[포트 번호] 접속
복사된 토큰 값 으로 인증하기

# py_script.py 파일 생성

from khaiii import KhaiiiApi

api = KhaiiiApi()
for word in api.analyze('오늘은 도커 컨테이너를 이용한 형태소 분석기를 실행해보았습니다'):
    print(word)


# py_run_test.ipynb 파일 생성 및 실행

run -i py_script.py


  

728x90