Genel

Makine öğrenmesi ile büyü mü yapılıyor?

Tabii ki hayır. Bugüne kadar hala makine öğrenmesi algoritmalarını uygulamaya başlamamış olmanızın arkasında böyle bir düşünce olabilir. Evet, makine öğrenmesi algoritmalarının arkasında istatistik, olasılık, lineer cebir, optimizasyon gibi birçok konu var. Ama başlamak için bunlar size engel olmasın. Makine öğrenmesi temelde zor bir konu diyebiliriz ama programcılık yapan herkes altından kalkabilir. Biraz deney, biraz deneme yanılma, biraz sabır, gerisi kendiliğinden geliyor.

Makine öğrenmesi birtakım algoritmalarla elimizdeki verileri modelleyebileceğimiz ve oluşturduğumuz bu modellerle yeni gelen veriler üzerinden tahminler yapabileceğimiz fikrinden ibaret. Buradaki en önemli nokta elimizdeki veri ile bir model oluşturabileceğimiz varsayımı. Yani İstanbul’daki ev fiyatlarını tahmin etmek için metrekare ve konum bilgisi işe yarayabilir. Ancak evin bulunduğu sokaktaki lamba sayısı, lambalardaki ampullerin kaç watt’lık olduğu bilgisi ya da gökteki yıldız sayısı, evin fiyatı hakkında pek de fikir vermeyecektir. Zaten bu bilgilerle mantıklı bir tahmin yapabiliyor olsaydık o zaman büyülü bir şey olurdu.

Makine öğrenmesi büyülü bir şey olmadığına göre, başlamadan önce bu algoritmalarla ne tür problemleri çözebileceğimizi bilmekte yarar var. Temelde bu algoritmalar iki ana gruba ayrılıyor: Gözetimli öğrenme ve gözetimsiz öğrenme algoritmaları.

Gözetimli öğrenmede bir emlakçı size geliyor ve diyor ki: “Elimde İstanbul’da satıştaki 1000 adet evin metrekare bilgisi, konumları ve fiyatları var. Bu bilgilere bakarak bir evin metrekare ve konumunu söylediğimde bana tahmini bir fiyat söyleyebilir misin?” Siz de bu verilerle bir model oluşturmaya çalışıyorsunuz.

Gözetimsiz öğrenmede ise emlakçı şunu soruyor: “Elimde İstanbul’daki 1000 adet evin metrekare ve konum bilgisi var, bunlarla ne yapacağımı bilmiyorum ama belki bunların içinde bir düzen vardır, sen de bir baksan?” Bu veriden belki de belli bir semtteki evlerin metrekarelerinin daha büyük olduğu sonucuna ulaşarak, bu semtteki evleri ailelere pazarlamanın daha uygun olabileceği konusunda emlakçıya pazarlama tavsiyesi veriyor olabilirsiniz.

Ya da verideki anormal büyük evleri tespit ederek emlakçıya bu evlerle ilgili veriyi bir kontrol etmesini, doğru olduğunu teyit ediyorsa bunların lüks sınıfa giriyor olabileceğini ve bunları pazarlarken bu durumu göz önünde bulundurarak hareket etmesini söyleyebilirsiniz. “Tamam, bu ev fiyat tahmini olayını daha önce duymuştum, başka ne tür problemler çözebilirim?” diyenlerin şu siteye göz atmasında yarar var: Kaggle. Belki bir gün siz de yarışmalardan birisine katılmayı düşünürsünüz.

Makine öğrenmesine yeni başlayacaklar için gözetimli öğrenme güvenli liman gibi görünüyor, ancak bu durum, gözetimsiz öğrenmenin kıymetsiz olduğunu düşündürmesin. İnternette oluşmuş ve oluşmakta olan verinin büyük bölümü, önceden sınıflandırılmamış ve belki içinde bir düzen olma potansiyeli olan veriler.

Artık makine öğrenmesi ile büyü yapılmadığını öğrendiğinize göre elinizi çamura bulaştırmaya az kaldı. Bir sonraki yazıdan önce ise Anaconda indirmiş olmanız gerekiyor. Böylece Python programlama diline, harika bir makine öğrenmesi kütüphanesi olan Scikit-learn’e ve programlama yapmak için kullanacağımız Jupyter Notebook’a tek bir seferde kavuşmuş olacaksınız.

Not: Tabii ki Python2 değil güncel versiyon olan Python3’ü seçmeniz gerekiyor.

Paylaş
Etiketler

İlgili yazılar

Close