Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- Python
- 아기동화
- 인자 힌트
- 인컨텍스트 러닝
- Compute
- UDF
- 프롬프트 튜닝
- Docker
- 파라미터 힌트
- AI 동화
- 모험
- Cognitive Service
- Cognitive Search
- Redshift
- 동화책
- Azure
- FOR
- 도커
- 반복문
- dask
- 퓨샷
- 대스크
- 제로샷
- Ai
- 컨텍스트 매니져
- GPT
- 검색
- 조건문
- 파이썬
- 토끼
Archives
- Today
- Total
호랭이 분석가
Dask #0. 대스크 시작하기 본문
반응형
1. Dask 설치
Dask는 파이썬을 기반으로, Pandas를 사용하는 데이터 분석가, 엔지니어는 쉽게 사용할 수 있도록 구현되어 있으며 대량의 데이터를 다루는데 특화되어있습니다.
# 전체 설치
pip install "dask[complete]"
# 부분 설치
pip install "dask[array]"
pip install "dask[dataframe]"
pip install "dask[diagnostics]"
pip install "dask[distributed]"
Dask는 pip로 설치 및 제거가 가능하기에 Spark와 비교하였을 때 설정과 관리가 매우 용이한 장점이 있습니다.
아래 링크에는 conda 설치법과 소스를 공유하고 있으니 참고하면 됩니다.
Install Dask — Dask documentation
.rst .pdf to have style consistency -->
docs.dask.org
2. 시각화 설치
Dask는 Tensorflow와 delayed를 사용하여 DAG라는 개념을 사용합니다.
DAG 시각화 이미지처럼 데이터의 흐름을 시각화하기 위하여 graphviz 라이브러리를 설치해야 합니다.
저는 Mac 환경이기 때문에 brew를 사용하여 설치합니다.
brew install graphviz
Linux, Window 사용자께서는 아래의 링크를 참조하여 설치하시면 됩니다.
Download
Graph Visualization Software
graphviz.org
라이브러리가 설치가 되었다면 pip를 사용하여 파이썬에 설치를 해줍니다.
pip install graphviz
이로써 Dask를 시작할 준비가 되었습니다.
'Python > Dask' 카테고리의 다른 글
Dask #4. 대스크 Dataframe과 keras(기초) (0) | 2022.05.10 |
---|---|
Dask #3. 대스크 compute()와 persist() (0) | 2022.05.09 |
Dask #2. 대스크 Redshift 및 DB, S3, HDFS, parquet, csv 데이터 불러오기 (0) | 2022.04.12 |
Dask #1. 대스크 Delayed 를 사용한 병렬화와 visualize, compute (0) | 2022.04.10 |
Comments