-
windows10 에 hdfs 설치하기spark 2021. 7. 10. 21:05
https://blog.naver.com/PostView.nhn?isHttpsRedirect=true&blogId=gladiator67&logNo=222106281290
설치 후 아래처럼 root 를 public 으로 만들어 http://localhost:9870/explorer.html#/ 를 통해 자유롭게 파일을 업로드 할 수 있도록 한다.
hdfs dfs -chmod -R 777 /
http://localhost:9870/explorer.html#/ 이외에 windows CMD 창에서도 아래처럼 파일을 local hdfs 에 업로드 할 수 있다.
hdfs dfs -put c:\temp\test.txt /.
spark program 에서는 아래 처럼 local hdfs 에 있는 파일에 접근할 수 있다.
spark.read.textFile("hdfs://localhost:9000/test.txt")
'spark' 카테고리의 다른 글
spark tables - managed vs unmanaged(external) tables (0) 2021.07.25 데이터의 partition 수와 partition 별로 레코드 수 확인 방법 (0) 2021.07.18 spark 에서 schema 를 적용해 데이터 읽기 (0) 2021.07.18 spark 에서 groupByKey 로 특정 column 기준 unique row 만 남기기 (0) 2021.07.16 spark 을 local, cluster mode 에서 실행하기 위한 JVM option, log4j.properties 설정 (0) 2021.07.10