PCA reduces the dimensionality of data points that are in many spaces. Some ready codes and libraries allow coders to create PCA easily, however, do you know what is PCA and how does it work mathematically?

Photo by Evie S. on Unsplash

The main idea of principal component analysis (PCA) is to reduce the dimensionality of a data set consisting of many variables correlated with each other, either heavily or lightly, while retaining the variation present in the dataset, up to the maximum extent.”

Intuitively, Principal Component Analysis allows us to see the position of data-points with a lower-dimensional picture. It can be called a projection or “shadow” of these data points when the user looks from its most informative viewpoint, as a shadow of the diamond picture above.

If someone asks you what is PCA, these are the first things that…


We can not ignore how the sight affects our decision-making process and using it as a cross-check mechanism for all other senses. However, what if this powerful way of communicating the message, can be the most dangerous input providers for our decision-making process?

Photo by Campaign Creators on Unsplash

Over the years, there are many scientific discussions about which sense is the most important sense in the human body… According to the Stanford Encyclopedia of Philosophy “touch” is thought to be the first sense that humans develop. However, when we consider the complexity of sight or perceiving things through the eyes, the sight can beat the other senses. Of course, everything about the brain is not discovered yet, but even with empirical observation, we can not ignore how sight affects our decision-making process and using it as a cross-check mechanism for our all other senses.

When we consider the…


Source : https://www.congruentsoft.com/aws-consulting-services.aspx
Source : https://www.congruentsoft.com/aws-consulting-services.aspx

Today, AWS is the most popular cloud service provider and in terms of market share, being way ahead of Google Cloud and Microsoft Azure, which are its two closest competitors.


Lets start with an example:

When I flip a fair coin now, what is the probability of getting a tail? Frequentist approach says, you have 50% chance of getting a tail and 50% of getting a head.

If I tell you that my last 100 flips by using the same coin have resulted in a head, what is the probability of getting a tail when I flip this coin now? Can you say 50%? Or would you like to say less than 50% by considering the additional information about the flip history of this coin? …


Scrum Developer sınavına hazırlanırken maalesef tüm bilgileri bir arada bulabileceğim bir döküman bulamadım ve sınavın konseptini anlamak, örnek soruları bulmak için fazlaca zaman harcadım. Sonunda %96 doğruluk oranı ile sınavı geçtim. Benden sonrakiler için yararlı bir yazı olması adına tüm linkleri ile paylaşıyorum. Biraz İngilizce biraz Türkçe bir yazı olacak ki terimler yabancı gelmesin diye :) keyifli okumalar! Haziran-2020

Scrum Nedir?

Scrum, şu an için Agile (Çevik) çalışma yöntemlerinin en yaygını olan framework’tur. Kısaca, urun geliştirme ve yaratma süreçlerini etkin bir şekilde yönetmek için kullanılan çalışma çerçevesi dersek Türkçeye güzelce çevirmiş olabiliriz. …


Source: https://www.kayako.com/blog/assets/Kayako-Customer-Retention-Strategies.png

Şirketler için mevcuttaki ürün kullanıcılarını devam ettirmek, yeni kullanıcılar/müşteriler bulmaktan çoğu zaman daha az maliyetlidir. Frederick Reichheld (Net Tavsiye Skor’u bulan kişi) çalışmalarında gösteriyor ki kullanıcılarınızı elde tutma oranını %5 arttırırsanız, şirketinizin karlılığığını %5 ile %95 arasında arttırabilirsiniz.

Bu bahsedilen kullanıcı devamlılığını arttırmak için de kullanıcılarınızla iletişime geçmek üzere bazı stratejiler oluşturmanız gerekir. eğer kullanıcılarınızı (bunu yazının her yerinde müşterileriniz olarak da düşünebilirsiniz.) doğru anlayıp analiz edebildiyseniz, potansiyel olarak kullanıcınız olabilecek diğer kişileri de markanıza çekebilirsiniz.

Bu çalışmanın da ilk aşaması kullanıcılarınızı anlamakla başlıyor.

Neden bu ürünü kullanıyor, ne zaman kullanıyor, ne sıklıkla kullanıyor, neden başka ürünü kullanmıyor da sizinkini…


Sınıflandırma (Clustering) algoritmalarını kullanırken farklı başarı kriterlerini değerlendirmemiz gerekebilir. Genel olarak kullanılan doğruluk (accuracy) oranları, bazı datasetlerinde anlamlı olmayabilir. Özellikle de elinizde dengesiz dağılmış bir veri seti varsa (imbalanced data-set) daha dikkatli davranmalısınız.

Örneğin siz bir bankada çalışıyorsunuz ve elinizde kredi kartı kullanımına dair 10.000 satırlık datasetiniz var. Bu datasetini kullanarak dolandırıcılıkla yapılan kredi kart işlemlerini tespit etmeye çalışıyorsunuz. Bu datanın içerisinde sadece 10 adet işlem dolandırıcılığa ait olsun.

Bu durumda model yazmadan, bütün işlemlere “güvenli işlemdir” derseniz bile doğruluk oranınız:

Oldukça yüksek. Fakat bu doğruluk oranı hiç bir işe yaramayacaktır, çünkü kart işlemleri içerisindeki dolandırıcılığa ait olan 10 adet…

Sera Giz Ozel

Data Science and all related topics..

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store