Cloud Computing/GCP

GCP + Docker + Airflow 를 이용한 데이터 파이프라인 구축 1

dtstory 2022. 9. 21. 22:00

 

# [컨테이너 이름] 을 지정한 후, linux 커맨드에서 아래 명령어를 실행

-v 명령을 이용해, 폴더 마운트 (복수 허용)
docker run -it -p 8080:8080 \
	-v /home/airflow/dags:/opt/airflow/dags \
	-v /home/airflow/data:/opt/airflow/data \
	--entrypoint=/bin/bash \
	--name [컨테이너 이름] \
	apache/airflow:2.0.0-python3.8 \
	-c '( \
		airflow db init && \
		airflow users create --username admin --password admin --firstname Anonymous --lastname Admin --role Admin --email admin@example.org \
	); \
airflow webserver & \
airflow scheduler \
'

 

# 웹 접속

http://[외부 ip]:8080 

 

username : admin

password : admin 

초기에는 어떠한 dags도 추가하지 않았기 떄문에, 비어있는 것이 정상이다.

다시, 리눅스 커맨드로 돌아가 보자

 

 

# 계정 추가

초기에 셋팅한, admin 계정 이외에도 아래의 커맨드를 이용해, 사용자 계정을 추가할 수 있다.

airflow users create \
          --username [유저명] \
          --firstname [이름] \
          --lastname [성] \
          --role Admin \
          --email [이메일]

사실, firstname, lastname, email 은 등록에 있어 크게 중요하지는 않은 것 같다.

이제 다시, http://[외부 ip]:8080 로 웹에 접속한 후, 등록한 [유저명]으로 접속을 해보자. 새로운 [유저명]으로 접속이 될 것이다.

 

다음 포스트에서는 docker 컨테이너 내에서 dag 를 작성하고 실행하는 것을 진행해보겠다.

 

 

 

 

 

 

 

728x90