Bugün veri bilimi dünyasının en popüler dillerinden R’da veri analizlerinde en sık kullanılan paketleri madde madde listeleyeceğiz.
- tidyverse: bir koleksiyon paket. Aşağıdaki paketleri (ve daha fazlasını) içeriyor:
- ggplot2: verilerin görselleştirilmesi için esas bir paket.
- dplyr: veri manipülasyonu için kullanılır.
- readr: csv ya da tsv gibi dikdörtgen şeklindeki veri tablolarının okunması için kullanılır.
- stringr: karakterden oluşan verilerin manipülasyonu için kullanılır
- Tüm hepsini ve daha fazlasını tek seferde indirmek için bu kodu çalıştırabilirsiniz: install.packages(“tidyverse”)
- sqldf: R üzerinde SQL sorgularını çalışmak için
- tseries: zaman serisi objelerini (ts) analiz etmek için esas bir paket, özellikle finansal veri analizinde oldukça kullanışlı.
- zoo: düzensiz (ve tabi ki düzenli) zaman serisi objelerinin analizinde kullanılır.
- forecast: ARIMA gibi modelleri kullanarak zaman serisi verilerinden tahmin yapmak için kullanılır.
- randomForest: Random Forest (Rastgele Orman) yöntemi kullanarak sınıflandırma ve regresyon modelleri oluşturmak için kullanılır.
- tree: sınıflandırmak ve regresyon ağaçları oluşturmak için kullanılır.
- gam: düz bir çizgi şeklinde olmayan veri ilişkilerini daha iyi açıklamak için ihtiyaç duyulan regresyon modellerini oluşturmak için kullanılır.
- e1071: içerisinde çeşitli ve oldukça önemli istatistik modelleri bulundurur.
- xml2: xml dosyalarının R’ın içerisine aktarılmasında ve doğru parçalarak ayrılarak okunmasında kullanılır.
- ggmap: ggplot2 içerisinde görsel olarak etkileyici haritalar oluşturmak için kullanılır.
- caret: regresyon ve sınıflandırma modellerin öğretilme sürecinde kullanılır.
- pls: Principal component regression da dahil olmak üzere çok değişkenli regresyon modelleri oluşturmak için kullanılır.
- plotly: interaktif grafikler oluşturmak için kullanılır.