Dark

Light

Dark

Light

Scroll to top
İletişime Geçelim
4. Levent, İstanbul
iletisim@oguzerdogan.com
Skype: obadus
İş Teklifleri
work@oguzerdogan.com

Veri Bilimi Çaylağının Yol Haritası

Önceki yazımda Derin’in 15 dakikalık otobüs yolculuğunda başına neler geldiğinden ve hangi şirketlerin sadece otobüste seyahat eden bir kişi ile nasıl kazanç sağlayabildiklerinden bahsetmiştim. Eğer ilk önce bu yazıma denk geldiysen serinin başlangıç yazısını okumanı tavsiye ederim.

Serinin başlangıç yazısı : Bir Çaylağın Dijital Ayak İzleri

Yazının sonunda yeni düzendeki bakış açımdan ve oyunun hangi tarafında olmak istediğimden bahsetmiştim. Veri Bilimi & Yapay Zekanın tanımını bildiğini varsayıyorum çünkü bu içerikte daha çok bu alanda çalışırken neler yapacağımdan, nelerin gerekli olacağından bahsedeceğim. Konunun bütünlüğünü bozmamak adına bunlardan burada bahsetmiyorum. Eğer konu hakkında bilgin yoksa ufak bir araştırma yapabilirsin.

Yazı Serisinin amacı ne, nereye gidiyor ?

İki ay kadar süredir bu alanı detaylıca araştırıyor ve çalışıyorum. Amacım önümdeki 2 ve 3 ay gibi bir sürede doğru bir strateji ve projelerimin olduğu yoğun çalışmayla Makine Öğrenmesi ve Veri Biliminde başlangıç pozisyonu için gereken çoğu yetkinliğimi kanıtlamak. Sonrasında sektörde istediğim şartlarda bir işe girmek olacak. Bir nevi sizin canlı simülasyonunuzum.

Bu fikir nereden çıktı ?

İnternette veri bilimi ile ilgili bir çok güzel kaynak var ve bu kadar fazla kaynağın olması bir süre sonra dezavantaja dönüşebiliyor. Bu alanda herkes arkasında alanın teorik bilgileriyle, programlama dersleriyle, proje aşamalarıyla ilgili bir iz bırakmış fakat ortada başarıya giden yoldaki adımlarıyla alakalı bir şey göremedim. Bunları öğrenirken neler yaptılar, hangi kaynaktan nasıl çalıştılar ve en önemlisi daha kısa sürede öğrenebilirler miydi ? İşte bu soruları yanıtlayan NET bir yol haritası olmadığından sizlere kendi izimi bırakmak istiyorum. Başarılı olursam gelecekte bunu okuyan insanlar için bir motivasyon kaynağı olabileceğini düşünüyorum.

Şunu tekrar belirtmek istiyorum, benim an itibariyle bu yazı serisinde Veri Bilimi & Yapay Zeka ile ilgili size eğitim verecek bir yetkinliğim yok. Size süreç içerisindeki çalıştığım konuları, çalışma şeklimi, yaşayacabileceğim sorunlara olan alternatif çözümlerimi ve bu alanda yeni uzmanlaşmış kişilerin tavsiyelerini kendi üzerimde uyguladığım bir ” Rookie Road Map ” sunacağım. Ve bu yolculukta bilet ve ikramlar tamamen ÜCRETSİZ.

Belirtmek istediğim diğer şey iki ay kadar süredir bu alanı detaylıca araştırıyor ve çalışıyorum. Fakat geçen hafta geri dönüp sağlam bir temel atmayı düşündüm, bunun detaylı sebeplerinden yazı içerisinde bahsedeceğim. Bu düşüncemi uygulamaya başladıktan sonra çok güzel bir tesadüfle karşılaştım.

#66daysofdata

Lütfen twitterını aç ve arama yerine #66daysofdata yaz.

Ne yapıyor bu kadar insan ? Nedir bu 66daysofdata

Şuan hali hazırda Data Scientist olan ve bu konuyla Youtube üzerinde içerikler üreten benden kat ve kat daha tecrübeli olan Ken Jee kardeşimiz bütün bilgilerini tazelemek ve süreç sonunda daha iyi olacağını düşündüğünden bütün konulara 66 gün boyunca baştan çalışmaya başlamıştı. Onun yeniden başlama sebeplerini anlattığı video için buraya bakabilirsiniz.

Ve onun başlattığı bir akım sayesinde dünyada Data Science ile uğraşan çaylaklarından tut bu işi yalayıp yutmuşlarına kadar çoğu kişi yaklaşık bir ay önce benim de düşündüğüm fikri canlı olarak uyguluyor, temellerini baştan daha temiz bir şekilde atıyorlar.

Aradaki tek fark en iyileri bunun için günün 15 – 20 dakikasını harcarken bizim gibi çaylakların daha fazla harcaması olacak. Daha da güzel olanı ne biliyor musun ? Bu olay sadece bir ay önce başladı, yani benim gibi bir sürü canlı simülasyon var ve eğer sen bu yazıyı bundan bir yıl sonra okuyacaksan muhtemelen senin de örnek alabileceğin canlı simülasyonlar olacak. Çünkü bu bir ZİNCİR!

“2 aylık süreçten sonra bu işin teoriden çok pratikte olacağını kavrayıp geri dönmeyi göze almışken benden çok daha tecrübeli birisinin de bunu yapması doğru yolda olduğumu hissettirdi.”


Hazırsan başlıyoruz.

Hazırsan başlıyorum, sektörün gerektirdiklerini daha önceden öğrendim fakat bu yazı serisi senin için. Daha önce çok detaylı bir şekilde ve benden çok daha tecrübeli birisi Vahit Keskin Hocamız tarafından Nasıl Veri Bilimci olunur makalesini okumanı tavsiye ederim. Ben burada daha çok neler yapacağımdan bahsedeceğim.

Ne kadar çok şey istiyorlar değil mi ?

Bu kadar şeyi nasıl öğreneceğim ?

Öncelikle hepsinin bir sırası var ve planlarıma göre hepsi ip söküğü gibi birbirini takip eden bir süreçte olacak. Eğitimlerde gördüğüm ve yabancı kaynaklardan araştırdıklarıma göre öncelik sıram şu şekilde;

Mavi ile işaretlediğim alanlar üzerinde çalışacaklarım, yeşiller zaten mavilere çalışırken gelişecek şeyler.

Kırmızı ? MATEMATİK ?

Matematik bu işin hamuru, bu işin doğası evet ama 1950’lerde yaşamıyoruz artık. Zorlayıcı matematik teorileriyle, formülleriyle süreç içerisindeki motivasyonumu kaybetmek istemiyorum. Sadece bilmem gereken temel istatistik bilgilerini alacağım. Tabi ki sonrasında merak edip işin matematiğine de gireceğim.

Python ve İstatistik eş zamanlı

Pythonun hemen ardından öğreneceğimiz

Numpy & Pandas kütüphaneleri, Veri Analizi & Makine Öğrenmesi Modelleri


Çaylakların ve Jr Data Scientistlerin yeni hayatı şuandan itibaren başlamıştır hocam. Bir plan anlatıyorum sana dinle.

  1. Python kaynaklarını açıyorum
  2. İstatistikle aramı düzeltiyorum
  3. Projelerimi de githubıma repoluyorum

Olay bitmiştir. Her şey çok güzel olacak.

Eğer zor gibi görünüyorsa hiç korkmayın çünkü hepsi zaman ayırarak çözülebilecek BASİT şeyler. Ama bunlardan çok daha önemli şeyler var. Neye nasıl çalışacağız?


TEKRAR

İlk başladığımda eğitimleri o kadar iyi anlıyordum ki her seferinde yeni şeyler öğrenmenin güzelliğiyle o videodan diğer videoya geçiyordum. Sanırım bu yüzden Data Science’ı bu kadar sevdim.

Yapabildiğimin farkındaydım ve bu hoşuma gidiyordu. Öğrendiğim konuları tekrar etmem gerektiğini düşündüğüm zamanlarda bile vazgeçip bir şekilde yeni şeyler öğrenmeye çalışırken buluyordum kendimi ve en kötüsü de ne biliyor musunuz?

Bütün bunların tekrarını yapmamış olmam. Bu iş uzun bir süreç olduğu için her yeni şey öğrendiğimde eski öğrendiklerimi tam olarak uygulayamıyordum çünkü üstünde yeterince pratik yapmamıştım.

KENDİ TEKRAR METODUNU BUL

İŞTAH

Bu yol içerisindeki motivasyonumun temel taşlarından olacak. Bu yol tek başına kaynaklardan ve kitaplardan çalışıp ertesi güne geçiş yapılarak gitmiyor.

Linkedin, Github, Kaggle

Farkettim ki etrafımda benim gibi yeni öğrenen kişilerin yaptıkları çalışmaları gördüğüm zaman eksik kalmamak için harekete geçiyorum ve daha fazla üretmeye başlıyorum. Bunun için Linkedin’de bu alana yeni başlamış kişileri ekliyorum ve yaptığı çalışmaları belli periyotlarda takip ediyorum. İleride bahsedeceğim Github ve Kaggle platformları da bize çok iyi gelecek.

Linkedin : Türkler ile sınırlı kalma

#66daysofdata bu durumu zaten aşıyor fakat Linkedin üzerinde yabancı data scientistler bu iş için bir başka güzel iştah noktası. Çok güzel içerikler paylaşıyorlar. Onları takibe alacağım hatta bağlantı kurmak daha mantıklı. Eğer onlarla bağlantı kuracaksam paylaşımlarımı da ingilizce dilinde yapmalıyım, kimse anlamadığı bir dil hakkında yazan kişileri akışında görmek istemez.

#66daysofdata

Sadece bu hashtage özel bir twitter hesabı açtım ve canım sıkılıp elim telefona gittiği zaman bu alana maruz kalıyorum. Hepsi o gün, önceki gün, o hafta zinciri bozmamak adına bir şeyler yapan insanlar! Ve hepsi bizimle aynı işi yapıyor. Buradaki güzel nokta bu insanların çoğu görüntü işleyen, chat botu yapan ileri seviye projeler değil işi en başından yapan insanlar, yani sıfırdan başlayacak birisinin başlangıç derslerinde yabancılık çekme durumu çok az.

KENDİ ÇAYLAK SİMÜLASYONLARINI BUL VE STALKLA

Evet STALK. Hadi ama çoğumuz 90 nesliyiz yapabildiğimiz en iyi şeylerden birini neden burada kullanmayalım?

Elimizde twitter var ve sadece len(#66daysofdata) kadar karakterli bir hashtagin içinde koskoca bir veri madeni yatıyor, günün sonunda Data Scientist olmak istiyorsak, o madeni kazmamız gerek. Hem gereksinimlerde “Data Mining” de vardı.

Açıkçası tecrübelerinden dolayı ve bu alanda çok fazla içerik ürettiği için Ken Jee nin adımlarını takip etmekte fayda var. Tabi diğerleri de neler çalışıyor hangi kaynakları çalışıyorlar gözlemleyeceğim.

GÖZÜNDE BÜYÜTME

Bu merdivenleri ayağımız yere basa basa tek tek çıkacağız. Bu konuyu öğrenmeye başlayınca ister istemez herkes ile denk geliyorsun ve tavsiye istiyorsun. Eğer anlamadığın çok fazla yabancı terim kullanıyorlarsa bir süre onlardan uzak dur önce öğrenmen gerekenleri öğren, motivasyonunu kaybetmemek için bu çok önemli. Bu yolda tek başınaysan bilmediğin başka yollara hemen sapmamak gerekiyor.

Data Science içerisindeki kelimeler büyüleyici ve aynı zamanda korkutucu olabiliyor. O yüzden anlamadığın şeyler duyarsan, vaktini bekle,o terimler sandığın kadar uzakta değil.

MARUZ KAL

Başlangıçta az bir İngilizce ile bu işi yürütebiliriz fakat yolun sonunda İngilizcemizin iyi olması gerekiyor. Bu yüzden yabancı kaynaklardan da çalışacağım.

Benim gözlemlediğim ve en etkili dil geliştirme yöntemi maruz kalmak. Hazırlıktayken derste ingilizce dışında bir şey konuşmayan, konuşturtmayan hocalara anlam veremezdim. Fakat şuan çok iyi anlayabiliyorum. Gerçekten de zorunda olduğumuz durumlarda kendimizi daha iyi geliştiriyoruz. Almanya’daki gurbetçilerimizi düşün, hangisi giderken Almanca biliyordu? Maruz kaldılar ve öğrendiler.

Nasıl maruz kalabilirim ?

Twitterdan bahsetmiştim, benim yöntemim şunlar olacak: #66daysofdata içerisindeki herkesi takip edeceğim ve belli zamanlarda timelinedaki yazıları okuyacağım, belki bir kaçıyla sohbet etme girişimleri de deneyebilirim. Hazır söz konusu gelmişken: Data Science alanı kadar birbirlerine yardım eden başka bir alan daha görmedim. Kimle denk gelsem hep yardımcı olmaya çalıştı.

Bir diğer yöntem hem İngilizcem için hem de CV’imi doldurmam gerektiğinden yabancı dildeki eğitimlerden tercih edeceğim. Sana da başlangıçta hem Türkçe hem İngilizce eş zamanlı takip edebileceğin kaynakları önereceğim.

Ayrıca Linkedin akışımda da İngilizce kullanmaya özen göstereceğim, sebebinden bahsetmiştim ve İngilizce dökümantasyonları okumaya çalışacağım.

KENDİ SORUNUNU ÖNCE KENDİN ÇÖZMEYE ÇALIŞ

Veri Bilimi içerisindeki insanlar çok yardımsever evet, yardım ediyorlar fakat nereye kadar? Sonuna kadar bizle olamazlar, sorunları nasıl çözeceğimizi öğrenmemiz lazım.

İçerisinde bulunduğumuz alan en başından sonuna kadar sorunlarla karşılaşacağımız bir alan. Sorunlara karşı nasıl cevaplar bulmamız gerektiğini bilmemiz lazım.

Kimse sizden bu alandaki her ayrıntıyı ezberlemenizi beklemiyor. Maharet, bu konudaki tüm ayrıntıları bilmekte değil, bir konuya dair nasıl araştırma yapacağını ve kaynaklardan nasıl faydalanacağını bilmekte. Bu süreç içerisinde en büyük dostumuz Google.

Bu alanda karşılaştığınız hatalarla mutlaka daha önce birileri karşılaşmış oluyor ve Stackoverflow tarzı sitelerde bu cevapları bulabiliyoruz.


KAYNAKLAR

İçeriklerin tamamen ücretsiz olacağından bahsetmiştim. Arada bazı mâkul ücretli içerikler de paylaşabilirim. Bu alan sürekli güncellenecek.

Öncelikle başlangıçta bu konu hakkında sizin fikir edinmeniz benimse bilgilerimi tazelemek amaçlı sizi şuraya alalım.

Turkcell Geleceği Yazanlar platformunda Vahit Keskin Hocamız bu konuyu çok güzel ve ücretsiz bir şekilde açıklıyor.

İlk olarak Veri Bilimi ve Yapaz Zekaya Giriş ardından Veri Okuryazarlığı kurslarını bitireceğim.

Author avatar
Oğuz
https://www.oguzerdogan.com
Merhaba ben Oğuz. Kişisel web siteme hoşgeldin. Burada Veri Bilimi & Makine Öğrenmesi çalışmalarımı paylaşıyorum.

Post a comment

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Size en iyi deneyimi sunabilmek için çerezleri kullanıyoruz.