GitHub - bumbac/BIG-Data-ELK: Big data project on CTU in Prague 2020. Evaluate dataset of road quality dataset (linescan) using ELK stack: Logstash for collecting and parsing in pipeline for ElasticSearch indexing and later data-visualization and analytics using Kibana. Apache Spark (distributed analytics engine) was used for preprocessing of dataset.

Clone this repository to your project path.

Download datafiles to "your project path"/work.

cd "your project path"

docker run -it -v "your project path"/work:/work -v "your project path"/notebook:/usr/zeppelin/zeppelin-0.8.1-bin-all/notebook/ -p 18080:18080 -p 8088:8080 -d babubabu/spark-zeppelin-docker:v1

docker-compose up

After all containers are up:

Access zeppelin notebook @ http://localhost:8088/
Access Kibana @ http://127.0.0.1:5601/
Create index from global
Go to Managment/Save Objects/Import
Use index global
Import all objects from "your project path"/kibana/export/export.json

EXAMPLE:

cd C:\Users\laco\Documents\SCHOOL\BIG\sem

docker run -it -v C:\Users\laco\Documents\SCHOOL\BIG\sem\work:/work -v C:\Users\laco\Documents\SCHOOL\BIG\sem\notebook:/usr/zeppelin/zeppelin-0.8.1-bin-all/notebook/ -p 18080:18080 -p 8088:8080 -d babubabu/spark-zeppelin-docker:v1

docker-compose up

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
elasticsearch/config		elasticsearch/config
kibana		kibana
logstash		logstash
notebook/2FS3RCH48		notebook/2FS3RCH48
work		work
.gitignore		.gitignore
BI-BIG, semestrálna práca, sutymate, 2020.pdf		BI-BIG, semestrálna práca, sutymate, 2020.pdf
README.md		README.md
docker-compose.yml		docker-compose.yml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Releases

Packages

bumbac/BIG-Data-ELK

Folders and files

Latest commit

History

Repository files navigation

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages