1. Principles, Statistical and Computational Tools for Reproducible Science
Başlangıç Tarihi — 17 Nisan 2020
Zorluk seviyesi – Orta
Süre — 8 hafta uzunluğunda
Öğrenecekleriniz:
- Tekrarlanabilir bilimin temellerini öğrenin ve tekrarlanabilir araştırmaların neden önemli olduğunu, tanımları, kavramları ve tekrarlanabilirliği etkileyen faktörleri anlayın
- Veri kaynağı ve tekrarlanabilir deneysel tasarım için gerekli temel unsurlar
- Tekrarlanabilir veri analizi için istatistiksel yöntemler
- Katılımcılar, tekrarlanabilir araştırma yöntemlerinin bilimsel keşif üzerindeki önemli etkisini gösteren çeşitli vaka çalışmalarını içeren altı modüle katılacaklar.
- R ve Rstudio, Python kullanarak Tekrarlanabilir Bilim için Hesaplamalı Araçlar
- Yeniden üretilebilir veri analizi ve sürüm kontrolü (Git/GitHub, Emacs/RStudio/Spyder), yeniden üretilebilir veriler (Veri havuzları/Dataverse) ve yeniden üretilebilir dinamik rapor oluşturma (Rmarkdown/R Notebook/Jupyter/Pandoc) ve iş akışları için hesaplama araçları.
Eğitmenler
Curtis Huttenhower, Associate Professor of Computational Biology and Bioinformatics, Harvard University
John Quackenbush, Professor of Computational Biology and Bioinformatics, Harvard University
Lorenzo Trippa, Associate Professor of Biostatistics, Harvard University
Christine Choirat, Research Associate, Harvard University
2. Data Science: Linear Regression
Başlangıç Tarihi — 28 Ocak 2020
Zorluk seviyesi – Başlangıç
Süre — 8 hafta uzunluğunda
Öğrenecekleriniz:
- Galton, lineer regresyonu ilk olarak nasıl geliştirdi?
- Karıştırma ve tespit tekniklerinin temelleri
- R’nin Temelleri
- R’de doğrusal regresyon uygulayarak değişkenler arasındaki ilişkileri nasıl inceleyeceğinizi öğrenin
Eğitmenler
Rafael Irizarry, Professor of Biostatistics, Harvard University
3. Data Science: Machine Learning
Başlangıç Tarihi — 28 Ocak 2020
Zorluk seviyesi – Başlangıç
Süre — 8 hafta uzunluğunda
Öğrenecekleriniz:
- Makine öğreniminin temellerini öğrenin
- Overtraining’den kaçınmak için çapraz doğrulama nasıl yapılır?
- Popüler makine öğrenimi algoritmaları
- Düzenlemenin temelleri
- Sıfırdan bir öneri sisteminin nasıl oluşturulacağını öğrenin
Eğitmenler
Rafael Irizarry, Professor of Biostatistics, Harvard University
4. Data Science: Visualization
Başlangıç Tarihi — 28 Ocak 2020
Zorluk seviyesi – Başlangıç
Süre — 8 hafta uzunluğunda
Öğrenecekleriniz:
- Veri görselleştirme ilkelerinin temellerini ve bunları ggplot2 kullanarak nasıl uygulayacağınızı öğrenin.
- Veriye dayalı bulguları iletin, analizleri motive edin ve kusurları tespit edin
- Değerli içgörüleri ortaya çıkarmak ve kariyerinizi ilerletmek için verilerden nasıl yararlanacağınızı öğreneceksiniz.
Eğitmenler
Rafael Irizarry, Professor of Biostatistics, Harvard University
5. Data Science: Probability
Başlangıç Tarihi — 28 Ocak 2020
Zorluk seviyesi – Başlangıç
Süre — 8 hafta uzunluğunda
Öğrenecekleriniz:
- Rastgele değişkenler ve bağımsızlık dahil olmak üzere olasılık teorisindeki önemli kavramları ve Monte Carlo simülasyonunun nasıl yapıldığını öğrenin
- Beklenen değerlerin anlamı, standart hatalar ve bunların R’de nasıl hesaplanacağı
- Merkezi Limit Teoreminin Temelleri ve Önemi
Eğitmenler
Rafael Irizarry, Professor of Biostatistics, Harvard University
6. Data Science: Inference and Modeling
Başlangıç Tarihi — 28 Ocak 2020
Zorluk seviyesi – Başlangıç
Süre — 8 hafta uzunluğunda
Öğrenecekleriniz:
- Popülasyonların, parametrelerin, tahminlerin ve standart hataların tahminlerini ve hata paylarını tanımlamak ve bunları nispeten iyi tahminler yapmak için nasıl kullanabileceğinizi öğrenmek ve ayrıca tahmininizin kesinliği hakkında bir tahmin sağlamak için gerekli olan önemli kavramlar.
- Verileri toplamak için modeller nasıl kullanılır?
- Bayes istatistiklerinin temelleri ve tahmine dayalı modelleme
Eğitmenler
Rafael Irizarry, Professor of Biostatistics, Harvard University
7. Data Science: R Basics
Başlangıç Tarihi — 28 Ocak 2020
Zorluk seviyesi – Başlangıç
Süre — 8 hafta uzunluğunda
Öğrenecekleriniz:
- R’de bir temel oluşturun ve verileri nasıl tartışacağınızı, analiz edeceğinizi ve görselleştireceğinizi öğrenin.
- Veri türleri, vektör aritmetiği ve indeksleme gibi temel kavramlar — R programlama
- Sıralama, dplyr kullanarak veri karıştırma ve grafik oluşturma gibi R kullanan işlemler
Eğitmenler
Rafael Irizarry, Professor of Biostatistics, Harvard University
8. Introduction to Linear Models and Matrix Algebra
Başlangıç Tarihi — 17 Nisan 2020
Zorluk seviyesi – Orta
Süre — 4 hafta uzunluğunda
Öğrenecekleriniz:
- Gösterimler ve işlemler dahil olmak üzere matris cebirinin temelleri
- Matris cebirinin veri analizine uygulanmasını öğrenin
- Doğrusal modeller nasıl oluşturulur ve bunlarla çalışılır
- QR ayrıştırma hakkında bilgi edinin
Eğitmenler
Rafael Irizarry, Professor of Biostatistics, Harvard University
Michael Love, Assistant Professor, Departments of Biostatistics and Genetics, UNC Gillings School of Global Public Health
9. Statistics and R
Başlangıç Tarihi — 17 Nisan 2020
Zorluk seviyesi – Orta
Süre — 4 hafta uzunluğunda
Öğrenecekleriniz:
- Kavramlar ve uygulama arasında bağlantı kurmanıza yardımcı olacak örneklerle öğrenin
- Rastgele değişkenler, Dağılımlar, Çıkarım: p değerleri ve güven aralıkları, Parametrik olmayan istatistikler hakkında derinlemesine bilgi edinin
- R kullanarak Keşifsel Veri Analizi yapmayı öğrenin
- Verileri analiz etmek için R komut dosyalarını nasıl kullanacağınızı ve tekrarlanabilir araştırmanın temellerini öğrenin.
Eğitmenler
Rafael Irizarry, Professor of Biostatistics, Harvard University
Michael Love, Assistant Professor, Departments of Biostatistics and Genetics, UNC Gillings School of Global Public Health
10. High-Dimensional Data Analysis
Başlangıç Tarihi — 17 Nisan 2020
Zorluk seviyesi – Orta
Süre — 4 hafta uzunluğunda
Öğrenecekleriniz:
- Uzaklığın matematiksel tanımını ve yüksek boyutlu veri kümelerinin boyut indirgemesi için tekil değer ayrıştırmasının (SVD) kullanımını ve çok boyutlu ölçeklendirmeyi ve bunun temel bileşen analiziyle bağlantısını öğrenin.
- Makine Öğreniminin temellerini öğrenin
- Faktör Analizinin temellerini ve Toplu Etkilerle nasıl başa çıkılacağını öğrenin
- Kümeleme ve Isı Haritalarını nasıl uygulayacağınızı öğrenin
Eğitmenler
Rafael Irizarry, Professor of Biostatistics, Harvard University
Michael Love, Assistant Professor, Departments of Biostatistics and Genetics, UNC Gillings School of Global Public Health