Veri analizi denildiğinde akla hemen Excel, Minitab, SPSS; E-views gibi diğer paket programlama dilleri gelmektedir. Bu paket programlar kendi içlerinde bazı kodlama imkanları sağlasalar da temelde menüler ve sezgisel arayüzler aracılığı ile komut veya kod yazmaya neredeyse hiç gerek kalmaksızın veri işleme imkanları sunarlar. Bu noktada R anılan bu paket programlarla da kesişen amaçlara sahiptir. R’ın anılan iki farklı çözüm kümesi ile amaçsal kesişimi olmasına rağmen kendisinden beklenen işleri daha farklı bir yolla yapar. Bu farklılıklardan en temel olanları aşağıdaki gibi sıralanmıştır:
- R komutlarla çalışır: R’da tüm işlemler komutlarla çalışır. Ancak bu komutlar oldukça basittir. Excel’de herhangi bir hücre içine yazılan formüller düzeyinde kolay komutlarla bir çok iş gerçekleştirilebilmektedir. Ancak R’da Excel’de olduğu gibi bir hücre yapısı yoktur. Neticede hücre yapısı da kullanıcının verileri konumlandırırken daha kolay çalışmasın için sağlanan bir arayüzdür. R’da ise tamamen girdi, komutlar (veya kodlar) ve çıktılar vardır. Bu ilk başta bir çok kişi için soyut ve zor gelse de bir kez öğrenildikten sonra R’ın veri işleme felsefesinin çok daha esnek ve pratik olduğu görülecektir.
- R açık kaynaklıdır: R tamamen ücretsiz ve açık kaynaklı bir dildir. Bu son kullanıcı için sınırsız bir bilgi erişimi ve geniş bir kullanıcı topluluğu anlamına gelmektedir. Yaygınlık ve geniş kullanıcı topluluğu hususu emektar Excel için de geçerlidir ancak Excel açık kaynak kodlu değildir. Bir uygulama veya yazılım dilinin açık kaynak kodlu olması mutfağı kullanıcıların görüşüne hatta müdahalesine açık bir restorana benzer. Nelerin geliştiği, nelerin eklendiği, nelerin eleştirildiği açıkça görülebilir. Bu durum sadece bu faydayla sınırlı değildir. Açık kaynak kodlu yazılımların ücretsiz olmasının da bir garantisidir çünkü R herhangi bir firmanın kaderine veya sınırlarına sahip değildir. Oysa, söz gelimi Excel’in bir Microsoft ürünü olması nedeniyle örneğin Linux işletim sistemi altında çalıştırılması mümkün değildir. Ancak R tüm işletim sistemlerinde çalışabilmektedir.
- R bir çok amaca hizmet eder: R denince akla istatistik ve ekonometri gelir. Bu yönü ile SPSS, Minitab ve E-Views gibi programlara alternatif oluşturmaktadır. Aynı şekilde R, Matlab için de bir alternatif olarak algılanmaktadır. Genel olarak bu bakış doğrudur. Ancak R standart bir istatistik programından daha fazla özelliğe ve derinliğe sahiptir. Örneğin Rmarkdown ile Microsoft Word’e ve akademik kaynak ve alıntı yönetimi programları Mendeley, Zotero, EndNote gibi programlara alternatif teşkil ederken, RPresentation ve IOSlides modülleri ile Microsoft Powerpoint’e alternatif olmaktadır. R’ın az veya çok yaygın bir çok böye özelliği vardır. Bu ise gerek açık kaynaklı olmasından ötürü sürekli geliştirilmesi ve sonradan çeşitli amaçlar için geliştirilen kütüphanelerin kullanımına kolayca olanak vermesinden kayanaklanmaktadır. Örneğin yapay zeka için geliştirilmiş e1071 kütüphanesi ile Naive Bayes, SVM gibi makine öğrenme kütüphanelerini kolayca kullanabilirsiniz.
- R tekrarlanabilir çalışmalar yaratır: Bir çok paket programın aksine R’da yapabileceğiniz işleri art arda programlayarak bunu tek seferde tekrar çalıştırabilir ve aynı işlemi farklı verilerle ilerleyen zamanlarda tekrar kullanabilirsiniz. R kodlarının da ‘tekrar kullanılabilir’ (reusable) formda yazılması ile çok ciddi bir emek ve zaman tasarrufu gerçekleşmiş olmaktadır. Örneğin R kodları ile aşağıdaki işlemleri yapan kodlar yazabilir hale geleceksiniz:
- Merkez bankası web sayfasına git
- Euro kurlarını kaydet
- Kaydedilen kurlardan regresyon modeli kur
- Sonuçları bir dosyaya kaydet
- Eğer regresyon tahminleri çok güçlü çıkarsa ayrı dosyaya kaydet
Burada R’ın sadece istatistik özelliklerinin kullanıldığı kısım regresyon modelinin gerçekleştirildiği kısımdır. Bu kısım dışındaki kısımlar özellikle de web sayfalarından veri derleme ve modelin sonuçlarını işleme gibi özellikler bilinen bir çok istatistik programından beklenmeyecek, beklense bile kullanımı pratik ve yaygın olmayan özelliklerdir. Oysa R ile bu işlemler kolayca gerçekleştirilebilmektedir.
Bu eğitim programı ile R ekosistemine giriş yapmış olacaksınız. Kurs temel R programlama dili eğitimi içermekte olup daha sonra istatistiksel fonksiyonların kullanabilecek düzeyi sağlamaktadır.
Hedef Organizasyonlar/Kişiler
- Araştırma Merkezleri
- Ensititüler
- Kurumların Araştırma Departmaları
- Ar-ge departmanları
- İstatistik, Ekonmetri veya Finans alanında çalışan akademisyenler/araştırmacılar
- Biyoistatistik alanında çalışan akademisyenler/araştırmacılar
- Ekonomi alanında çalışan akademisyenler/araştırmacılar
- Veri bilim üzerine yoğunlaşmak isteyen lisans, yüksek lisans veya doktora öğrencileri
Ön Gereksinimler
- Windows veya Linux İşletim sistemi kullanıyor olma
- Excel, SPSS, Minitab veya MATLAB dillerinden birini kullanmış olma
