- SIC: Samsung Innovation Campus
- IT/BD/IoT: là tên chương trình học
- Buổi học của chương trình
- Số file được tạo ra trong buổi học
- Tìm hiểu và ứng dụng KNN và Binary Classification
- Doc2Vec/UnderTheSea
- Anomaly Detection
- Làm Web crawler
- Lọc tất cả file có #box_comments ra khỏi kích thước phần tử
- Lọc được giới sao trong web và trích xuất ra file.
- Lưu vào file với cấu trúc Date, Content, Source