Veri bilimi günümüzün en parlak ve gelecek vadeden alanlarının başında geliyor. Büyük veri hazinelerinin üzerinde oturan şirketler veri bilimiyle her zamankinden daha büyük hedeflere ulaşmak istiyor ve veri bilimcilerin önemi günbegün artıyor.
Veri bilimi ve veri bilimi projeleri yapay zekanın bir alt kümesidir. İstatistik, bilimsel yöntemler ve veri analizinin örtüşen alanlarını ifade eder. Bunların tümü verilerden anlam çıkarmak ve içgörü elde etmek için kullanılır.
Dünyadaki verilerin yüzde 90’ının son iki yılda oluşturulduğu tahmin ediliyor. Örneğin, Facebook kullanıcıları her saat 10 milyondan fazla fotoğraf yüklüyor. Ancak bu veriler çoğu zaman veritabanlarında kullanılmadan saklanıyor.
Veri bilimi, Türkiye de dahil olmak üzere tüm dünyada, son on yılda hayatın her alanını değiştirecek kadar büyüdü. Şimdiyse hükümetler, genetik bilimciler, mühendisler ve gökbilimciler tarafından kullanılıyor. Veri biliminin evriminde büyük verinin tek rolü verilerin ölçeklendirilmesi değildi. Baş edilemeyecek kadar büyük verileri işlemek için yeni sistemlere geçişin, verilerin incelenme ve analiz edilme yöntemlerinin değişimini de içeriyordu.
Veri bilimi, modern çağda iş ve akademik araştırmaların önemli bir parçası haline geldi. Teknik olarak buna makine çevirisi, robotik, konuşma tanıma, dijital ekonomi ve arama motorlarını dahil edebiliriz. Veri biliminin araştırma alanları biyoloji, sağlık hizmetleri, tıbbi bilişim, beşerî bilimler ve sosyal bilimleri kapsayacak şekilde genişledi.
Veri bilimi nasıl yapılır?
Verileri analiz etme ve bu temelde hareket etme süreci doğrusal değil, kademeli ilerleyen bir süreçtir. Bir veri modelleme projesi için tipik akış şu şekildedir:
- Planlama: Projeyi ve potansiyel sonuçlarını tanımlayın.
- Veri modeli oluşturma: Veri bilimcileri, makine öğrenimi modelleri oluşturmak için genellikle çeşitli açık kaynak kitaplıklarını veya veritabanı araçlarını kullanır. Kullanıcılar genellikle API’lerin veri alımı, veri profili oluşturma, görselleştirme veya özellik mühendisliğine yardımcı olmasını isterler. Doğru verilere ve bilgi işlem gücü gibi diğer kaynaklara erişimin yanı sıra doğru araçlara da ihtiyaçları olur.
- Modeli değerlendirme: Veri bilimcilerinin, kendilerinden emin biçimde konuşlandırmadan önce modelleri için yüksek bir doğruluk yüzdesi elde etmeleri gerekir. Model değerlendirmesi, model performansını yeni verilere göre ölçmek için genellikle kapsamlı değerlendirme metrikleri ve görselleştirme seti oluşturur. Ayrıca üretimde optimum davranışı sağlamak için bunları zaman içinde sıralar. Model değerlendirmesi, beklenen temel davranışı hesaba katmak için ham performansın ötesine geçer.
- Modeli açıklama: Makine öğrenimi modellerinin ürettiği sonuçların iç mekaniklerini insani anlamda açıklamak her zaman mümkün olmadı ama bu giderek daha önemli hale geliyor. Veri bilimcileri, tahmin oluşturmakta rol oynayan faktörlerin göreli ağırlığı ve önemi hakkında otomatik açıklamaların yanı sıra model tahminleriyle ilgili modele özgü açıklayıcı ayrıntılar istiyor.
- Modeli konuşlandırma: Eğitilmiş bir makine öğrenimi modelini alıp doğru sistemlere yerleştirmek genellikle zor ve zahmetli bir süreçtir. Bu, modelleri ölçeklenebilir ve güvenli API’ler olarak çalıştırarak veya veritabanı içi makine öğrenimi modelleri kullanarak daha kolay hale getirilebilir.
- Modeli izleme: Düzgün çalıştıklarından emin olmak için modellerin konuşlandırmadan sonra sürekli izlenmeleri gerekiyor. Modelin eğitiminde kullanılan veriler, belirli bir süre sonra gelecekteki tahminler için geçerli olmayabilir. Örneğin, dolandırıcılık tespiti alanında suçlular hesapları ele geçirmek için her zaman yeni yollar buluyor.
VERİ BİLİMCİSİNİN GÖREVLERİ NELERDİR?

Veri bilimcilerin görevleri arasında verileri analiz etmek için stratejiler geliştirme, verileri analiz için hazırlama, verileri keşfetme, analiz etme ve görselleştirme, Python ve R gibi programlama dillerini kullanarak verilerle birlikte modeller oluşturma ve modelleri uygulama yazılımlarına konuşlandırma sayılabilir.
Veri uzmanları tek başına çalışmaz. Hatta en etkili veri bilimi, ekipler halinde yapılır. Bu ekip veri bilimciye ek olarak, sorunu tanımlayan bir iş analistinden, verileri hazırlayan ve verilere nasıl erişileceğini belirleyen bir veri mühendisinden, altta yatan süreçlere ve altyapıya ilişkin gözetim faaliyetlerini yürüten bir BT mimarından ve modelleri veya analiz sonuçlarını uygulama yazılımlarına ve ürünlere konuşlandıran bir uygulama yazılımı geliştiricisinden oluşur.
Ülkemizden bahsedecek olursak Türkiye de artık pek çok kurum ürünlerini geliştirmek için veri biliminden yararlanıyor. Bu kurumlar veri bilimine ciddi bir şekilde yatırım yapıyorlar. Ülkemizde bu alanın hızla gelişmesi ile birlikte birçok veri bilimcisine ihtiyaç duyuluyor.