Trong bài viết này mình sẽ hướng dẫn cho các bạn cài đặt Hadoop trên windows dùng WSL.

Chọn Distribution WSL

  1. Cài đặt WSL (nếu chưa có) và kiểm tra version

Untitled

  1. Cài distribution. Ở đây mình dùng Ubuntu 22.04.2 LTS (GNU/Linux 5.15.90.1-microsoft-standard-WSL2 x86_64). Các bạn có thể cài phiên bản khác nếu thích.
$ wsl --distribution Ubuntu-22.04

Prerequisites

Required software

  1. SSH
$ sudo apt-get install ssh
  1. PDSH
$ sudo apt-get install pdsh

Cài đặt Open JDK

Apache Hadoop được viết bằng Java nên ta cần tải JDK (Java Development Kit) để có thể chạy.

  1. Update package index.
$ sudo apt update
  1. Kiểm tra xem Java đã được cài chưa.
$ java -version

Nếu chưa cài thì các bạn có thể cài đặt Java thông qua:

$ sudo apt install default-jre              // or
$ sudo apt install openjdk-11-jre-headless  // or
$ sudo apt install openjdk-8-jre-headless