İçindekiler
Veri Analizinde 8 Temel Konu
İstatistikte verileri anlamak için bazı temel kavramlar kullanılır. Aritmetik ortalama (mean) verilerin genel seviyesini gösterirken, mod en çok tekrar eden değeri ifade eder. Medyan ise sıralı verilerin ortasındaki değerdir ve uç değerlerden etkilenmez. Frekans, her bir değerin kaç kez görüldüğünü açıklar. Açıklık, en büyük ve en küçük değer arasındaki farktır. Varyans ve standart sapma, verilerin ortalamadan ne kadar uzaklaştığını ölçerek dağılımın yaygınlığını gösterir. Çeyreklerarası açıklık (IQR) ise verilerin orta bölümündeki yayılmayı tanımlar. Bu kavramlar birlikte veri analizinin temelini oluşturur.

1. Frekans
Frekans, bir değerin veri grubunda kaç kez tekrar ettiğini ifade eder. Bir şeye “ne kadar sık rastladığımızı” gösterir. Frekans tabloları, verileri düzenli ve anlaşılır hale getirir. Örneğin bir sınıfta sevilen meyve sonuçları şöyle olsun: Elma (8 kişi), Muz (5 kişi), Portakal (3 kişi). Burada elmanın frekansı 8’dir. Frekans; sayımlar, anketler, istatistik ve veri analizinde sıkça kullanılır.
2. Açıklık
Açıklık, bir veri grubundaki en büyük ve en küçük değer arasındaki farktır. Verilerin ne kadar geniş bir aralıkta dağıldığını gösterir. Açıklık büyüdükçe veriler daha farklıdır, küçüldükçe birbirine yakındır. Örneğin bir spor takımının boyları 160, 170, 175, 165, 180 ise en büyük değer 180, en küçük değer 160’tır. Açıklık = 180 – 160 = 20 cm olur. Bu değer dağılımın genişliğini özetler.
3. Mod
Mod, bir veri grubunda en çok tekrar eden değerdir. Yani bir veri setinde hangi sayı en sık görülüyorsa o moddur. Mod özellikle anket, satış ve seçim sonuçlarında yaygın olarak kullanılır. Örneğin bir marketin bir günde sattığı ekmek sayıları şöyle olsun: 5, 7, 5, 6, 5, 8. Bu durumda mod 5’tir çünkü en çok 5 ekmek satılmıştır. Mod, “en popüler” veya “en sık tekrar eden” değeri gösterir.
4. Medyan
Medyan, sıralı bir veri setinin tam ortasında yer alan değerdir. Verileri küçükten büyüğe dizeriz ve ortadaki sayı medyandır. Medyan, uç değerlerden etkilenmediği için genellikle daha güvenilir bir ortalama türü olarak görülür. Örneğin sayılar 3, 5, 7, 10, 20 olsun. Sıralı veri zaten bu şekilde ve ortadaki sayı 7’dir. Bu yüzden bu veri setinin medyanı 7’dir. Medyan, özellikle gelir ve fiyat analizlerinde çok kullanılır.
5. Çeyreklerarası Açıklık (IQR)
Çeyreklerarası açıklık, verilerin orta kısmının ne kadar yayıldığını gösterir. Veri dörde bölünür: alt çeyrek (Q1), medyan (Q2) ve üst çeyrek (Q3). IQR = Q3 – Q1 şeklinde hesaplanır. Uç değerlere karşı dayanıklı bir ölçüdür. Örneğin veriler 2, 4, 5, 7, 9, 10, 12 olsun. Q1 = 4, Q3 = 10’dur. IQR = 10 – 4 = 6 olur. Bu değer, orta kısmın ne kadar geniş olduğunu gösterir.
6. Mean (Aritmetik Ortalama)
Mean yani aritmetik ortalama, tüm değerlerin toplamının veri sayısına bölünmesiyle bulunur. Günlük hayatta en çok kullanılan merkezi eğilim ölçüsüdür. Örneğin bir kişinin haftalık adım sayıları 6000, 7000, 6500, 8000, 9000 ise ortalama = (6000+7000+6500+8000+9000) / 5 = 7300 adım olur. Ortalama, genel eğilimi kısa ve net bir şekilde göstermesi nedeniyle yaygın olarak kullanılır.
7. Varyans
Varyans, standart sapmanın kareli halidir ve verilerin ortalamadan ne kadar uzaklaştığını matematiksel olarak ölçer. Standart sapmanın temelini oluşturur. Yüksek varyans verilerin çok dağınık olduğunu, düşük varyans ise birbirine yakın olduğunu belirtir. Örneğin notlar 60, 62, 61 ise varyans düşüktür; 40, 80, 95 olsa varyans yüksektir. Varyans, veri analizi ve bilimsel araştırmalarda çok kullanılan bir yayılma ölçüsüdür.
8. Standart Sapma
Standart sapma, bir veri grubundaki değerlerin ortalamadan ne kadar uzaklaştığını gösterir. Eğer standart sapma küçükse, veriler birbirine yakındır; büyükse veriler daha dağınıktır. Örneğin bir sınıfta öğrencilerin sınav notları 70, 72, 71, 69, 70 ise standart sapma küçüktür çünkü herkes benzer notlar almıştır. Ama notlar 40, 70, 95, 30, 100 olsaydı standart sapma büyük olurdu. Standart sapma, verilerin “ne kadar değişken” olduğunu anlamamıza yardımcı olur.
Standart sapma, ortalamanın söylediğini doğrular, tamamlar ve derinleştirir.
Eğer R Programını indirmek isterseniz buraya tıklayınız : R: The R Project for Statistical Computing – https://www.r-project.org/
Eğer R Studio Programını indirmek isterseniz buraya tıklayınız: RStudio Desktop – Posit – https://posit.co/download/rstudio-desktop/
Eğitimlerimize katılarak bu ve diğer projeleri uygulamalı olarak öğrenebilirsiniz. Eğitimlerimize ve diğer bilgilere buradaki linkten (https://www.facadium.com.tr/) ulaşabilirsiniz. Detaylı bilgi için lütfen bizlere 0553 377 29 28 numaralı telefondan ya da info@facadium.com.tr mail adresinden ulaşınız.
