PY-002 Anaconda bản phân phối Python

Bài viết này giới thiệu về Anaconda (một bản phân phối Python gồm python và nhiều package hổ trợ cho khoa học dữ liệu), bạn có thể bỏ qua bài viết này nếu như bạn thật sự hiểu việc cài đặt môi trường, biên dịch thư viện,…

1. Anaconda là gì?

Anaconda là một bản phân phối miễn phí và mã nguồn mở của Python (và thậm chí cả R) phụ vụ cho khoa học dữ diệu, học máy và các ứng dụng tương tự (xử lí dữ liệu lớn, phân tích dự đoán, tính toán khoa học,…). Anaconda hướng đến việc quản lí các package một cách đơn giản, phù hợp với mọi người. Hệ thống quản lí package của Anaconda là Conda. Bản phân phối Anaconda tính đến nay được sử dụng hơn 6 triệu người, và đính kèm hơn 250 gói package khoa học dữ liệu phù hợp cho Windows, Linux và MacOS.

Nguồn Anaconda

2. Cài đặt Anaconda Distribution:

  • Tải Anaconda (Python 3) về tại: https://www.anaconda.com/download/
  • Hiện tại phiên bản Python mà ThetaLog sử dụng là python3 bản phân phối Anaconda 5.2.0

2.1 Windows:

Ở bước này:

  • Hãy thận trọng với việc thêm PATH vào môi trường của bạn vì có thể xảy ra xung đột với một số phần mềm khác. Do Anaconda có hổ trợ Anaconda Prompt nên cũng không hẳn cần thiết. Còn khi cần dùng linh động thì Windows đã có hàm set PATH=%PATH%;C:\something nên không cần phải lo nghĩ nhiều.
  • Thiết lập mặc định không ảnh hưởng gì đâu.

2.2 Linux

Với Linux thì dù bạn dùng shell nào đi chăng nữa (bash, zsh, fish,…) thì luôn luôn phải dùng lệnh:

bash [tên tập tin cài đặt Anaconda tải về].sh

Mình không khuyến khích thêm path của Anaconda vào tập tin .bashrc (hoặc các shell khác như .zshrc,…). Bởi vì khác với Windows rất nhiều ứng dụng trên Linux chạy trên python hệ thống, việc thêm path vào hệ thống đôi lúc sẽ gây ra bất ổn định.

Trên Linux để kích hoạt môi trường của Anaconda các bạn có thể đơn giản sử dụng lệnh source (ví dụ minh họa này mình cài Anaconda ở thư mục home của user hiện tại):

source ~/anaconda3/bin/activate