331 - Machine Learning on Big Data Register

“Büyük Veriden Yapay Öğrenme", veri toplama yöntemlerinden model değerlendirmelerine kadar, tüm Veri Bilimi adımlarını kapsayan 3 günlük bir eğitim programıdır. Program, Büyük Veriyi matematiksel veri yapılarına dönüştürme, regresyon, sınıflandırma ve tavsiye sistemi modellerini dağıtık mimarilerde öğrenme algoritmaları, bu algoritmaları Apache Mahout ve Apache Spark üzerinde gerçekleştirme, model değerlendirme adımlarını içerir.

“Büyük Veriden Yapay Öğrenme", veri toplama yöntemlerinden model değerlendirmelerine kadar, tüm Veri Bilimi adımlarını kapsayan 3 günlük bir eğitim programıdır. Program, Büyük Veriyi matematiksel veri yapılarına dönüştürme, regresyon, sınıflandırma ve tavsiye sistemi modellerini dağıtık mimarilerde öğrenme algoritmaları, bu algoritmaları Apache Mahout ve Apache Spark üzerinde gerçekleştirme, model değerlendirme adımlarını içerir.

Bu program birçok Büyük Veri Madenciliği/Yapay Öğrenme modeli ve ölçeklenebilir öğrenme algoritmasını kapsar:

- Genelleştirilmiş Doğrusal Modeller: Doğrusal Regresyon ve Lojistik Regresyon
- Karar Ağaçları 
- Kümeleme
- Karma Üyelik Modeli: (Latent Dirichlet Allocation)
- Benzerlik Analizi
- Matris Ayrıştırma
- Öğrenme Toplulukları: Random Forests

Katılımcılar, Büyük Veriden Yapay Öğrenme kütüphanelerini tanır,
Analytics Center tarafından kendilerine sağlanan Hadoop / Spark kümelerinde Veri Bilimi adımlarını gerçekleştirirler.

Uygulamalı Alıştırmalar

Katılımcılar ekosistem araçlarını kullanarak aşağıdaki amaçlarla uygulamalı alıştırmalar gerçekleştirir, örnekleri takip ederler:

- Büyük ölçekli veri analizi için bir interaktif geliştirme ortamı hazırlamak,
- Büyük Veriyi Yapay Öğrenmeye uygun veri yapılarına dönüştürmek,
- Ölçeklenebilir Yapay Öğrenme algoritmalarını anlamak,
- Denetimli öğrenme (Supervised Learning) modellerini öğrenmek ve değerlendirmek için program yazmak, - Veri kümelemesi (Clustering) için program yazmak,

- Kümelerdeki karışık üyelikleri (Mixed Membership) bulmak için program yazmak (konu modelleme/topic modeling) - Öneri (tavsiye) sistemi (Recommender System) modellerini öğrenmek ve değerlendirmek için program yazmak,
- Tipik bir veri analizi / Yapay Öğrenme hattı adımlarını tasarlamak.

Dersin Ön Koşulları

"Büyük Veri Üzerinde Yapay Öğrenme", Veri Bilimcisi eğitim programının temel dersidir. Yapay Öğrenme ile
ilgili genel bir anlayışın yanı sıra, katılımcıların Büyük Veri İşleme teknolojilerinin genel olarak nasıl çalıştığına dair genel bilgi sahibi olmaları beklenmektedir.

Katılımcıların Scala veya Python ile basit programlar yazabilmesi beklenmektedir. 

machine learning, big data