` `

Geavanceerde statistische methoden

30 januari - 23 oktober 2018

Deze opleiding wil een praktisch inzicht geven in een aantal geavanceerde en veelgebruikte statistische methoden voor de analyse van uitgebreide datasets. Een keuze maken uit dit ruime aanbod van methoden berust op een grondige kennis van de voorwaarden waaronder de analysemethode ontwikkeld is. Eens deze selectie werd gemaakt, kan de uitvoering van de analyse worden aangevat met behulp van publiektoegankelijke software pakketten zoals R.

De opleiding start met een aantal lessen rond het pakket R, dat tevens het software pakket is dat in de ganse lessenreeks wordt gebruikt. Daarna komen de niet-parametrische en de meest gebruikte multivariate statistische methoden aan bod. Tijdens iedere les komen er tal van oefeningen aan bod (50% theorie en 50% oefeningen). In de laatste les van de modules 1 en 2 worden er enkel oefeningen gegeven.

Iedere module kan apart gevolgd worden.


De cursus richt zich tot personen in de bedrijfswereld, de dienstensector, de overheid, de sector gezondheidszorg en de farmaceutische wereld maar ook tot mensen uit het onderwijs en alle ondersteunende disciplines die gebruik maken van statistische methoden en modellen.

De cursus is toegankelijk voor iedereen die door zijn basisvorming of door zijn ervaring voldoende met het onderwerp vertrouwd is om met interesse en motivatie de opleiding te volgen.

Door het modulaire karakter van de opleiding kan de cursist de modulekeuze aanpassen aan zijn interesseprofiel en specifieke voorkennis.



Getuigschrift van Permanente Vorming van de Universiteit Gent

U ontvangt een getuigschrift, indien u deelneemt aan minstens 2 van de 3 modules en slaagt de bijbehorende examens (per module wordt een afzonderlijk examen voorzien).


Wetenschappelijke coördinatie

Em. Prof. Jean-Pierre Ottoy, Vakgroep Wiskundige Modellering, Statistiek en Bio-Informatica, Universiteit Gent

Lesgevers

  • Prof. Tim De Meyer, Vakgroep Wiskundige Modellering, Statistiek en Bio-Informatica, Universiteit Gent
  • Prof. Jan De Neve, Vakgroep Data-analyse, Universiteit Gent
  • Dhr. Joris Meys, Vakgroep Wiskundige Modellering, Statistiek en Bio-Informatica, Universiteit Gent
  • Annelies Tourny, Statter (spin-off UGent)
  • Dr. Karel Vermeulen, Vakgroep Wiskundige Modellering, Statistiek en Bio-Informatica, Universiteit Gent

Modules


R is een krachtige en vrij beschikbare programmeertaal gericht op dataverwerking en analyse. De grote kracht van R ligt in de uitgebreide mogelijkheden voor automatisering van het analyseproces en de talloze uitbreidingen in de vorm van R packages. Om de kracht van R goed te kunnen toepassen, moet men echter een goed begrip hebben van hoe R functioneert als programmeertaal. In deze cursus gaan we daar dieper op in.

In een eerste les overlopen we RStudio en de mogelijkheden die het biedt om je werk te organiseren. We kijken naar het gebruik van projecten, de verschillende opties en introduceren RMarkdown documenten.

In een tweede les bekijken we object types, hun eigenschappen en toepassingen. De focus ligt op een optimaal begrip van principes zoals vectorizatie en recycling.

In een derde les bekijken we functies. We gaan dieper in op de verwerking van argumenten en het toevoegen van foutmeldingen en waarschuwingen. Dit vormt de basis om in een vierde les dieper in te gaan op geavanceerde manipulatie van datasets. Hier komen zowel transformaties van variabelen als van volledige datasets aan bod.

De vijfde les bespreken we de mogelijkheden voor grafische weergave van de data aan de hand van R en het pakket geplot. Al deze onderwerpen worden gecombineerd in de oefeningenles op het einde van de cursus. Hierin werken we een voorbeeldanalyse uit inclusief automatische rapportering met RMarkdown.

Deze cursus bouwt voort op de introductie tot R in het basispakket statistiek. Een goede voorkennis van R is vereist. Basisfuncties voor inlezen van data, dataverwerking en grafische weergave worden verondersteld gekend en enige vertrouwdheid met de RStudio omgeving is wenselijk.

Lesgevers: Joris Meys en Annelies Tourny
Data: 30 januari, 6, 20 en 27 februari, 5 en 13 maart 2018


Niet-parametrische methoden worden gekenmerkt door hun algemene geldigheid, zonder dat distributionele veronderstellingen (zoals normaliteit) over de data moeten gemaakt worden.

In de eerste les worden enkele klassieke niet-parametrische testen besproken. De Wilcoxon en de Mann-Whitney rank testen zijn de niet-parametrische alternatieven voor de t-testen, terwijl de Kruskal-Wallis test de niet-parametrische tegenhanger is van de F-test in een ANOVA. Deze testen maken gebruik van de asymptotische approximatie of van de exacte permutatiedistributie.

In de tweede les bespreken we hoe we volledige distributies met elkaar kunnen vergelijken. Op die manier kunnen varianties en scheefheden vergeleken worden. In een niet-parametrische statistische analyse is deze stap van gemiddelden naar volledige distributies eenvoudig te zetten.

In de derde les worden een aantal niet-parametrische testen besproken voor meer complexe studies (factoriële proeven met meerdere factoren en blokkenproeven), terwijl in de vierde les, de niet-parametrische tegenhangers van de lineaire regressieanalyse worden toegelicht, zoals smoothers (bv. LOESS en splines) en GAMs (generalized additive models). Vermits deze minder restrictief zijn, zijn ze breder toepasbaar.

In de vijfde les komt een algemene niet-parametrische methode aan bod voor het bekomen van approximatieve varianties en betrouwbaarheidsintervallen: de bootstrap. Deze methode wordt geïllustreerd aan de hand van enkele voorbeelden zoals regressie en correlatiecoëfficiënt.

Aangezien de oefeningen met het pakket R worden gemaakt is een grondige kennis van het gebruik van dit pakket vereist. Verder is er ook een grondige kennis van basisstatistiek vereist (t-toetsen, ANOVA en regressie).

Lesgever: Jan De Neve
Data: 17 en 24 april, 8, 15, 22 en 29 mei 2018


Deze module handelt over enkele van de meest gebruikte multivariate statistische analysetechnieken, die dicht aanleunen bij datamining (clustering, classificatie, ...). Veelal is men niet in staat om een studie statistisch optimaal op te zetten en wordt men geconfronteerd met observationele studies. Men dient hierin een structuur te herkennen om tot een interpretatie en een besluit te komen.

Een eerste techniek waarmee de dimensionaliteit van een dataset gereduceerd kan worden is de principale componentenanalyse. Er wordt gezocht naar de belangrijkste (combinatie van) variabelen. Een stap verder is de factoranalyse. Dit soort analyses komt zowel voor in industrie als in marktgerichte diensten.

De canonische correlatieanalyse, die op dezelfde principes gebaseerd is, is een multivariate methode die gebruikt kan worden om verbanden op te sporen tussen twee multivariate subsets. Vervolgens wordt de clusteranalyse besproken. Deze heeft o.a. tot doel groepen te onderscheiden in een multivariate gegevensset.

Indien er reeds meer a-priori kennis is omtrent de groepen, kan een discriminantanalyse of een classificatieboom toegepast worden om een criterium te bepalen dat gebruikt kan worden om nieuwe observaties in één van de groepen onder te verdelen.

Aangezien de oefeningen met het pakket R worden gemaakt is een grondige kennis van het gebruik van dit pakket vereist.

Lesgever: Karel Vermeulen
Data: 18 en 25 september, 2, 9, 16 en 23 oktober 2018

Praktisch


Deze omvat lesgeld, hand-outs, frisdranken, koffie en broodjes.
Betaling geschiedt na ontvangst van de factuur. Alle facturen zijn betaalbaar dertig dagen na dagtekening. Alle vermelde bedragen zijn vrij van BTW.

 Module 1: Cursus R voor gevorderden  € 900
 Module 2: Niet-parametrische methoden  € 900
 Module 3: Multivariate methoden  € 900

Kortingen

  • Bij het volgen van 2 modules ontvangt u 5% korting op de modulaire prijzen . Bij het volgen van 3 modules ontvangt u 10% korting.
  • Indien minstens één deelnemer van een bedrijf inschrijft voor de volledige opleiding, wordt voor alle bijkomende gelijktijdige inschrijvingen van hetzelfde bedrijf een korting van 20% verleend. Facturatie geschiedt dan d.m.v. een gezamenlijke factuur.
  • Leden van AIG (Alumnivereniging van Ingenieurs afgestudeerd aan de Universiteit Gent) en VBIG (Verbond Afgestudeerde Bio-ingenieurs van de Universiteit Gent) genieten een korting van 10% op de in de tabel vermelde prijzen.
  • Personeelsleden van de UGent genieten bijzondere voorwaarden, mail ons voor meer informatie.
  • Voor personeelsleden van de associatie UGent gelden andere voorwaarden, mail ons voor meer informatie.
Kortingen zijn niet cumuleerbaar.


Handboeken

De opleiding wordt ondersteund door de handboeken
  • 'R for Dummies' van Andrie De Vries en Joris Meys: € 27,86 (incl. BTW) (optioneel bij module 1)
  • 'Multivariate Statistical Methods' van Bryan F.J. Manly: € 44,96 (incl. BTW) (optioneel bij module 3)
Deze handboeken zijn optioneel . Deze zijn niet inbegrepen in de deelnameprijs en worden apart gefactureerd door de boekhandel.


Annulering

Bij annulering tot uiterlijk één week voor de start van de cursus blijft 25% van de deelnemingsbijdrage verschuldigd. Bij latere annulering wordt het volledig bedrag aangerekend, wat dan wel recht geeft op alle documenten die aan de deelnemers ter beschikking werden gesteld tijdens de cursus. Vervanging van aangemelde personen is enkel mogelijk voor deelnemers die geen getuigschrift van postacademische opleiding beogen.

KMO-portefeuille

Universiteit Gent aanvaardt betalingen via de KMO-portefeuille. Gebruik de authorisatie-ID: DV.O103194
U vindt alle info op www.kmo-portefeuille.be.

Betaald educatief verlof

Deze opleiding geeft recht op betaald educatief verlof.

Inschrijven

* verplicht

Persoonlijke gegevens

M ♂        V ♀

Naam*
Voornaam*  
E-mail cursist*  
Telefoon*  
Facturatie op privé- of bedrijfsadres?*  

Privé-adres

Straat en nummer
Postcode
Gemeente
Land*

Bedrijfsgegevens

Onderneming
Functie
Email administratie (indien van toepassing)
Straat en nummer
Postcode
Gemeente
Land*
Telefoon
Fax
BTW-nummer

SAP (enkel voor UGent)
AIG-lidnummer (INFO)
VBIG-promotiejaar (INFO)

Inschrijving

Ik schrijf in voor de opleiding 'Geavanceerde statistische methoden'

Module 1: Cursus R voor gevorderden
Module 2: Niet-parametrische methoden
Module 3: Multivariate methoden

Handboeken

De handboeken zijn optioneel, ze zijn niet inbegrepen in de deelnameprijs en worden apart gefactureerd door de boekhandel.

R for Dummies van Andrie de Vries en Joris Meys | € 27,86 incl. BTW (optioneel bij module 1)
Multivariate Statistical Methods van Bryan F.J. Manly | € 44,96 incl. BTW (optioneel bij module 3)

Info

Ik wens blijvend geïnformeerd te worden over toekomstige opleidingen van het UGAIN.

Op welke manier heeft u kennis genomen van deze opleiding?

Via de UGAIN folder

Via de UGAIN e-mailing

Via een advertentie in (tijdschrift invullen aub):

Anders, met name via (ander infokanaal invullen aub):


Annulatievoorwaarden

Ik heb kennis genomen van de annulatievoorwaarden en ik verklaar mij hiermee akkoord.*



Zodra u op 'verzenden' heeft geklikt én alle verplichte velden zijn ingevuld, ontvangt u altijd een mail ter bevestiging van uw inschrijving.

Indien u deze mail niet heeft ontvangen, gelieve contact op te nemen met de webmaster, steven.deneef@ugent.be

Laptop

Deelnemers dienen hun eigen laptop mee te brengen, dit voor het gebruik van het publieke statistisch softwarepakket R: https://cran.r-project.org/ en R Studio: https://www.rstudio.com/products/rstudio/download3/.

Tijdstip en locatie

De lessen worden gegeven van 16u30 tot 20u, in 2 delen, gescheiden door een broodjesmaaltijd.

De lessen vinden plaats aan de Universiteit Gent, UGent Academie voor Ingenieurs, UGAIN leszaal, Technologiepark 904, 9052 Zwijnaarde.

Data onder voorbehoud van wijzigingen om onvoorziene omstandigheden.

Bijkomende inlichtingen

Universiteit Gent
UGent Academie voor Ingenieurs
Secretariaat
Els Van Lierde
Technologiepark 904
9052 Zwijnaarde
Tel.: +32 9 264 55 82
fax: +32 9 264 56 05
ugain@UGent.be

Deze opleiding kan in de doctoraatsopleiding opgenomen worden, op voorwaarde dat de doctorandus beschikt over een goedgekeurde aanvraag tot erkenning (application for recognition, download hier).

Wie over een goedgekeurde 'application' beschikt, kan deze opleiding meerekenen als 'specialist course' en kan rekenen op terugbetaling van het inschrijvingsgeld, op voorwaarde dat er een aanwezigheidsattest kan voorgelegd worden (de doctorandus dient minstens 15 lesuren van één opleiding te hebben gevolgd).


U kunt u de folder hier downloaden.