Intro2R: Introduzione a R per la manipolazione efficace di dati (biomedici e non)
- Lug 20, 2018
- By Elena Mentasti
- In
Obiettivi
In generale: Acquisire le basi del linguaggio R e far proprio il nuovo moderno paradigma di gestione efficiente dei dati; intraprendere il cammino di illuminazione verso l’autonomia gestionale dei propri dati.
In particolare: Imparare come manipolare, trasformare, e gestire in maniera efficiente dati di tipo tabellare e dati di tipo biologico con le funzioni avanzate di R e RStudio. Filtrare, estrarre righe e colonne, fare operazioni complesse in maniera automatica e semiautomatica, pulire i datasets per prepararli alle analisi; superare le limitazioni di Excel nella gestione di file grandi (big data). Imparare come evitare i limiti imposti dai software commerciali e l’uso di metodi per lo sfruttamento delle piene potenzialità del proprio computer.
Contenuti
- Come installare ed usare R e RStudio. Le basi del linguaggio e le strutture dati.
- Concetti di pulizia dei dati (data tidyness).
- Manipolazione di dati tabulari: come leggere, trasformare, filtrare, aggregare, fare calcoli semplici (o complessi) su dati tabellari da poche fino a milioni di righe e/o colonne.
- Come automatizzare le operazioni per risparmiare tempo (e fare meno errori) nel proprio lavoro di manipolazione dati.
- Grafica: come produrre grafici avanzati (e accattivanti) quali box plots, violin plots, scatters, heatmaps e come iterare in automatico la loro produzione su molti dati.
- Reporting: come redigere rapporti testuali che includano codice e grafici e che siano fruibili nei formati HTML e PDF per una facile condivisione.
Per chi è questo corso
Questo è un corso introduttivo al linguaggio R rivolto principalmente a BIOLOGI, TECNICI di LABORATORIO, ANALISTI, CLINICI e MEDICI; in generale ogni PROFESSIONISTA delle scienze della vita ne beneficerebbe. NON è richiesta una conoscenza pregressa del linguaggio R, ma occorre avere le capacità minime di utilizzo del computer e dotarsi di un computer portatile recente da portare in aula durante il corso.
Durante il corso, altamente pratico, verranno utilizzati dati provenienti dal dominio biomedico (dati di espressione genica, tabelle cliniche), ma le metodologie e il razionale di utilizzo del software esposti sono del tutto generali e sono applicabili a qualsiasi altro dominio. Per questo motivo il corso è adatto anche a chiunque, provenendo da altri settori quali finanza, amministrazione, scienze sociali, volesse avere una introduzione pratica ed efficace al linguaggio R.
Il corso prevede inoltre un periodo iniziale – precedente alle due giornate di aula – durate il quale sarà richiesto al partecipante di eseguire da casa esercizi propedeutici all’interno della piattaforma online (circa 6-10 ore nell’arco di una decina di giorni).
Alla fine del corso verrà rilasciato ai partecipanti l’attestato di partecipazione, l’intero materiale didattico (slides e codice R usato) e una serie di consigli, esercizi e compiti finalizzati a consolidare nel tempo quanto appreso in aula.
Quota individuale di partecipazione
Utilizziamo il sistema wired experience per le iscrizioni online
ISCRIVITI
Durata
12 ore