SCIENZE PROPEDEUTICHEModulo INFORMATICA
Anno accademico 2023/2024 - Docente: ALFREDO PULVIRENTIRisultati di apprendimento attesi
Descrizione generale sintetica
Il corso mira a far acquisire i principali concetti di base del calcolo delle probabilità e della statistica.
Obiettivi formativi generali dell'insegnamento in termini di risultati di apprendimento attesi:
- Conoscenza e capacità di comprensione (knowledge and understanding): Il corso mira a far acquisire agli studenti abilità in merito alla descrizione di dati statistici; Comprendere i termini di base (popolazione, campione, variabile ecc); Calcolo e presentazione di distribuzioni di frequenza; Descrizione di dati con metodi grafici; Calcolo degli indici di tendenza centrale e variabilità; Comprendere i fondamenti della valutazione di probabilità di un evento e di una variabile aleatoria; Acquisire i concetti legati alla statistica inferenziale quali stime per intervall di confidenza e test di ipotesi.
- Capacità di applicare conoscenza e comprensione (applying knowledge and understanding): identificare le distribuzioni idonee a rappresentare la conoscenza sottostante; risolvere problemi di statistica inferenziale e calcolo delle probabilità.
- Autonomia di giudizio (making judgements): Attraverso esempi concreti e casi di studio, lo studente sarà in grado di elaborare autonomamente soluzioni a determinati problemi e valutare l’idoneità della soluzione di un problema di statistica inferenziale e probabilità.
- Abilità comunicative (communication skills): lo studente acquisirà le necessarie abilità comunicative e di appropriatezza espressiva nell'impiego del linguaggio tecnico nell'ambito generale dell’analisi dei dati attraverso metodi statistici
- Capacità di apprendimento (learning skills): il corso si propone, come obiettivo, di fornire allo studente le necessarie metodologie teoriche e pratiche per poter affrontare e risolvere autonomamente problemi nell’ambito dell’analisi statistica dei dati.
Modalità di svolgimento dell'insegnamento
Le lezioni sono tenute in aula con l'ausilio di slide, messe a disposizione degli studenti sul portale
Studium. Le slide non sostituiscono i testi di riferimento, ma, oltre che agevolare la comprensione della
lezione, forniscono un dettaglio puntuale sul programma svolto.
Le lezioni frontali teoriche sono intervallate da esercitazioni pratiche, svolte nella
stessa aula di lezione. Gli studenti sono invitati a formare piccoli gruppi di lavoro (massimo 2-3 persone)
per lo svolgimento delle esercitazioni proposte.
Qualora l'insegnamento venisse impartito in modalità mista o a distanza potranno essere introdotte le necessarie variazioni rispetto a quanto dichiarato in precedenza, al fine di rispettare il programma previsto e riportato nel syllabus.
Prerequisiti richiesti
Conoscenze di matematica presenti in tutti i programmi delle scuole superiori.
Frequenza lezioni
La frequenza delle lezioni è obbligatoria.
Contenuti del corso
Le tecniche di campionamento: il campione casuale semplice, sistematico, stratificato, a grappoli, a stadi.
Statistica descrittiva. Distribuzioni di frequenza. Tabelle. Grafici, istogrammi, diagramma a barre. Indici di tendenza centrale. Indici di dispersione.
Cenni di calcolo delle probabilità. Definizione di probabilità; Eventi; Probabilità condizionata; Teorema di Bayes; Principio delle probabilità totali; Variabili aleatorie discrete; Media, varianza e deviazione standard; Distribuzioni discrete notevoli: Bernoulli, binomiale, uniforme, geometrica, Poisson; Distribuzioni continue: uniforme, normale esponenziale.
Distribuzioni di campionamento: distribuzione t-student, distribuzione di Fisher;
Inferenza statistica: stima puntuale e stima di intervallo. Intervallo di confidenza: per una media, per la differenza tra due medie, per una proporzione, per la differenza tra due proporzioni.
Principi della verifica di ipotesi (l’ipotesi nulla. Gli errori di I tipo e II tipo. La potenza di un test).
Test parametrici per le verifica di ipotesi: una media; confronto tra due medie nel caso di campioni indipendenti e appaiati.
Testi di riferimento
Testi di riferimento:
Lantieri PB, Risso D, Ravera G: Statistica medica per le professioni sanitarie, II ed. McGraw-Hill
Programmazione del corso
Argomenti | Riferimenti testi | |
---|---|---|
1 | Introduzione alla bioinformatica: tipi di dati, problemi, strumenti. | Capitolo 1 + materiale didattico integrativo fornito dal docente |
2 | Sequenze, ricerca tramite BLAST, allineamento pairwise e multiplo. Algoritmi. | Capitoli 3 e 4 + materiale didattico integrativo fornito dal docente |
3 | Attività pratica su allineamento di sequenze | Capitolo 3 + Appendice A +materiale didattico integrativo fornito dal docente |
4 | Banche dati biologiche presenti sul sistema dell'NCBI: nucleotide, protein, OMIM, PUBMED, GENE, SNP | Capitolo 2 + materiale didattico integrativo fornito dal docente |
5 | Attività pratica su banche dati | Capitolo 2 + Appendice A + materiale fornito dal docente |
6 | Banca dati UNiPROT | Capitolo 7 +materiale didattico fornito dal docente |
7 | Cenni sulla programmazione R | https://cran.r-project.org/doc/contrib/manuale.0.3.pdf |
8 | Introduzione, statistica descrittiva | Capitoli 1 e 3 + materiale didattico integrativo |
9 | Raccolta e organizzazione dei dati, Indici di tendenza centrale e dispersione | Capitoli 4 5 e 6 + materiale didattico integrativo |
10 | calcolo delle probabilità e distribuzioni di probabilità | Capitolo 8 + materiale didattico integrativo |
11 | Rappresentazione grafica dei dati | Capitolo 7 + materiale didattico integrativo |
12 | Campionamento e inferenza statistica | Capitolo 10 + materiale didattico integrativo |
13 | Stime di parametri per intervallo | Capitolo 9 + materiale didattico integrativo |
14 | Test di ipotesi | Capitolo 10 + materiale didattico integrativo |
Verifica dell'apprendimento
Modalità di verifica dell'apprendimento
L'esame finale consiste in una prova scritta ed un colloquio orale.
La prova scritta è costituita da esercizi e domande di teoria.
Chi non supera la prova scritta, non può sostenere l'orale. La prova scritta può essere visionata prima delle prove orali.
Salvo diversa comunicazione:
- l'esame scritto si svolge alle ore 9:00
Note:
- Per sostenere gli esami è obbligatorio prenotarsi utilizzando l'apposito modulo del portale CEA.
- Non sono ammesse prenotazioni tardive tramite email. In mancanza di prenotazione, l'esame non può essere verbalizzato.
La verifica dell’apprendimento potrà essere effettuata anche per via telematica, qualora le condizioni lo dovessero richiedere.
Esempi di domande e/o esercizi frequenti
Sul portale studium.unict.it saranno messi a disposizione esercizi svolti.