- HDFS : Hadoop DIstributed File Sys
- 컴퓨터의 C드라이브 같은 역할.
- 어떤 서버에 문제가 생겨도 3개의 저장본이 있어 운영면에서 편하다.
- 1개가 문제가 생기면 다른 곳에 저장을 해둔다.
- yarn : 메모리와 같은 역할, 메모리 클러스터.
- partition을 이용해 속도를 빠르게 한다.
- Zookeeper : 어떤 서버가 메인으로 활동해야할지 거수기 역할을 해줌.
- 셋탑 → kafka → 하둡 → 스파크 → 제플린. → 추천 → 몽고 → UI P/F
LG : customer 360 → 고객의 정보를 360도로 바라보겠다.