` `

Basisstatistiek voor onderzoekers

3 oktober - 12 juni 2017

Een goede keuze maken uit het ruime aanbod van statistische methoden voor het analyseren van data is geen eenvoudige opdracht. Het berust immers op een grondige kennis van de voorwaarden waaronder de statistische methode werd ontwikkeld. Ook bij de interpretatie van de resultaten is inzicht in de kracht en de tekortkomingen van de gebruikte statistische techniek onontbeerlijk. Om tot een geldige statistische analyse en een verantwoord besluit te komen, dient men ook aandacht te besteden aan de opzet van de studie (Design of Experiment). Op die manier kan men met een minimum aan experimenten tot een maximale kennis over het onderzoek komen.

Deze lessenreeks gaat op deze verschillende fasen in en tijdens de begeleide oefeningen zullen de cursisten zelf gegevens kunnen analyseren en interpreteren. Er wordt gebruik gemaakt van het statistisch softwarepakket R. De voorbije jaren is R uitgegroeid van een veelgebruikte tool voor wetenschappelijk onderzoek tot een standaard in de industrie. Zeker nu Revolution Analytics door Microsoft werd opgekocht, heeft R ook de zakenwereld veroverd. R wordt veelvuldig gebruikt voor analyse van data (Microsoft, Google, Facebook, ...), marktanalyses (ANZ Bank, Bank of America, ...), visualisatie van data (New Scientist, NY Times) en zoveel meer. R is bij uitstek geschikt voor het opstellen van unieke oplossingen en automatisatie van de analyse processen in onderzoek en de zakenwereld. R leren vraagt -zeker in het begin- enige inspanning, maar daarvoor krijg je een goed gestructureerde en gedocumenteerde tool met een onwaarschijnlijk grote ondersteunende gebruikersgemeenschap.

De deelnemers zullen tijdens de cursus over de vereiste software licenties met handleiding beschikken. Iedere module wordt afgesloten met een lesavond waarin alleen oefeningen aan bod komen.


De cursus richt zich niet alleen tot onderzoekers aan Universiteiten en Hogescholen, maar ook tot mensen uit de dienstensector, de overheid en de bedrijfswereld die in ondersteunende disciplines gebruik maken van statistische methoden en modellen.

De cursus is toegankelijk voor iedereen die door zijn basisvorming of door zijn ervaring voldoende met het onderwerp vertrouwd is om met interesse en motivatie de opleiding te volgen. Door het modulaire karakter van de opleiding kan de cursist de modulekeuze aanpassen aan zijn interesseprofiel en specifieke voorkennis. Deze opleiding kan - mits deelname aan het examen - opgenomen worden in de doctoraatsopleiding van de Universiteit Gent.

Voor alle cursussen is een basiskennis R vereist met uitzondering natuurlijk van de basiscursus R zelf.



Getuigschrift van Permanente Vorming van de Universiteit Gent

U ontvangt een getuigschrift, indien u deelneemt aan minstens 2 van de 4 modules en slaagt in het bijbehorende examen (per module wordt een afzonderlijk examen voorzien).


Wetenschappelijke coördinatie

Em. Prof. Jean-Pierre Ottoy, Vakgroep Wiskundige Modellering, Statistiek en Bio-Informatica, Universiteit Gent

Lesgevers

  • Prof. Jan De Neve, Vakgroep Data-Analyse, Universiteit Gent
  • Dhr. Joris Meys, Vakgroep Wiskundige Modellering, Statistiek en Bio-Informatica, Universiteit Gent
  • Em. Prof. Jean-Pierre Ottoy, Vakgroep Wiskundige Modellering, Statistiek en Bio-Informatica, Universiteit Gent
  • Mevr. Annelies Tourny, Vakgroep Wiskundige Modellering, Statistiek en Bio-Informatica, Universiteit Gent
  • Dr. Karel Vermeulen, Vakgroep Wiskundige Modellering, Statistiek en Bio-Informatica, Universiteit Gent
  • Ir. Matthijs Vynck, Vakgroep Wiskundige Modellering, Statistiek en Bio-Informatica, Universiteit Gent

Modules


De populariteit van het pakket R heeft de voorbije jaren een vlucht genomen. Microsoft, Google en Facebook gebruiken R al langer in hun analyses. Maar ook bedrijven die niks met software te maken hebben, schakelen steeds vaker over naar R. Zo gebruiken bvb ANZ Bank en Bank of America de software voor marktanalyses, en de New York Times gebruikt R voor visualisatie van data.

De cursus begint bij een verkenning van R en de interface RStudio. Daarna komen de verschillende stappen in werken met data aan bod: inlezen en opslaan van data, het uitvoeren van extra berekeningen, het omvormen van data naar de gewenste structuur voor analyse en het grafisch weergeven van data. Daarnaast ligt de focus op de tools in R die nodig zijn voor het volgen van de andere cursussen in deze module. Doorheen de cursus worden extra tips gegeven om vlotter te werken met R en RStudio.

R heeft de kracht en de mogelijkheden van een programmeertaal, maar daardoor ook een zwaardere leercurve. Daarom worden alle belangrijke concepten in R aan de hand van praktische voorbeelden en oefeningen uitgelegd.

Voorafgaande kennis van programmeren is niet vereist. De cursisten worden wel verwacht vlot met een computer te kunnen werken.

Duur: 4 avonden met 50% demonstratie en 50% oefeningen
Lesgevers: Joris Meys en Annelies Tourny
Datum: 3, 10, 17 en 24 oktober 2016

Er wordt gestart met een herhaling van de meest voorkomende distributies (normale, t, F, ...), de principes van een statistische toets, de constructie van hypothesen, betrouwbaarheidsintervallen, steekproeven, ...

Vervolgens komen de klassieke statistische technieken aan bod: de t- en de F-toets en de variantieanalyse met 1 of met meerdere factoren.

Nadruk wordt gelegd op het probleemoplossend vermogen van de statistische technieken, de voorwaarden voor toepassing, de interpretatie en de opzet van experimenten. Reële voorbeelden worden uitgewerkt.

Duur: 6 avonden met 50% theorie en 50% oefeningen (R) en 1 extra avond met 100% oefeningen
Lesgevers: Jean-Pierre Ottoy, Annelies Tourny en Karel Vermeulen
Data: 7, 14, 21 en 28 november, 5,12 en 19 december 2016


De regressieanalyse is één van de bekendste en meest gebruikte statistische technieken, zowel in onderzoek als in het bedrijfsleven. Niettegenstaande de techniek redelijk eenvoudig is in gebruik, worden er in de praktijk toch veel problemen ondervonden. Aan welke veronderstellingen moeten de gegevens voldoen? Wat zijn de gevolgen als ze daar niet aan voldoen? Hoe worden betrouwbaarheids- en predictie-intervallen geïnterpreteerd? Hoe wordt het beste regressiemodel met meerdere predictoren geconstrueerd? Kan een discrete variabele als predictor gebruikt worden?

Deze en vele andere problemen worden in deze module uitvoerig behandeld, steeds met de nadruk op de toepassingen. Zowel de enkelvoudige lineaire regressie, de meervoudige lineaire regressie als de logistische en de niet-lineaire regressie komen aan bod.

Duur: 6 avonden met 50% theorie en 50% oefeningen (R) en 1 extra avond met 100% oefeningen
Lesgevers: Jean-Pierre Ottoy, Karel Vermeulen en Matthijs Vynck
Data: 23 en 30 januari, 6, 13 en 20 februari, 6 en 13 maart 2017


Dagelijks worden experimenten uitgevoerd, maar vaak zijn de resultaten beperkt, is het moeilijk om een zinvol en betrouwbaar besluit te vormen en staan de resultaten niet in verhouding tot de tijd, energie en kosten die erin gestoken worden.

Een goede statistische proefopzet, ook bekend als Design Of Experiment (DOE), zorgt ervoor dat de statistische analyse correct interpreteerbaar en betrouwbaar is. Het is noodzakelijk dat de probleemstelling vooraf goed geformuleerd wordt en dat het meest geschikte statistische model gekozen wordt om zo de beoogde informatie te verkrijgen met een minimum aantal experimenten. Een goed ontworpen experiment heeft vaak een substantiële invloed op de efficiëntie van het onderzoek in termen van kosten en precisie.

De cursus is opgebouwd vertrekkende van de theorie van regressie analyse en ANOVA. Niettegenstaande het ontwerp (d.i. het design) van een experiment de statistische analyse voorafgaat, wordt een design steeds opgesteld in functie van deze toekomstige data analyse. Een goede kennis van de lineaire statistische modellen is daarom noodzakelijk.

Het doel van deze module is tweeledig. Enerzijds wordt er inzicht verworven in het opstellen van designs voor verschillende studies/ onderzoeksvragen en anderzijds wordt er dieper ingegaan op de relatie tussen het design en de statistische analyse. Dit laatste laat toe om het paradigma van statistische inferentie beter te begrijpen.

In de eerste les komen algemene concepten zoals randomisatie, stratificatie, vertekening (bias) en confounding aan bod. Centraal staat hierbij het grondig begrijpen van deze concepten. Dit wordt verwezenlijkt door intensief gebruik te maken van simulatiestudies in R - deze laten toe om abstracte begrippen (zoals herhaalde steekproefnamen) tastbaar te maken.

Bepaling van de steekproefgrootte is het onderwerp van de tweede les waarin zowel exacte als approximatieve methoden gebruikt worden. Naast het beroep doen op steekproefformules, wordt ook sterk de nadruk gelegd op hoe eenvoudige simulaties in R kunnen helpen bij de bepaling van de steekproefgrootte. Dit laat toe om voor een veelheid van designs en analysetechnieken de steekproefgrootte te bepalen, zelfs indien de wiskundige uitwerking te complex is.

In de derde en vierde les worden optimale designs besproken. Deze techniek maakt gebruik van intensieve computersimulaties om designs te optimaliseren. Dit maakt de techniek zeer breed inzetbaar en ze laat toe om designs om maat op te stellen zonder gebruik te maken van complexe wiskunde - de computer doet immers het harde werk. Omwille van het belang van deze techniek, zal er een substantieel deel de tijd hieraan besteed worden.

In de vijfde les komen enkele klassieke designs aan bod: screening designs, (fractionele) factoriële designs, split-plot designs, Latijnse vierkant design en centrale compositie designs.

In de laatste les wordt een case-study in detail uitgewerkt en worden verschillende technieken geïllustreerd.

Een goede kennis van Anova en Regressie is vereist (en noodzakelijk) als voorkennis. Zowel de syllabus als de oefeningen maken intensief gebruik van R, een basiskennis van deze software is noodzakelijk om de cursus te kunnen volgen. Tijdens de cursus wordt er beperkt gebruik gemaakt van matrices.

Er is een syllabus beschikbaar waar theorie en R door elkaar verweven zijn - dit om de kracht van het computerpakket te illustreren bij het construeren van designs en het opzetten van proeven. Zowel de syllabus en de oefeningenopgaven zijn in het Engels. De lessen worden gegeven in het Nederlands.

Duur: 6 avonden met 50% theorie en 50% oefeningen (R) en 1 extra avond met 100% oefeningen
Lesgever: Jan De Neve
Data: 24 april, 8, 15, 22 en 29 mei, 6 en 12 juni 2017



Praktisch


Deelnameprijs omvat lesgeld, hand-outs, frisdranken, koffie en broodjes. Betaling geschiedt na ontvangst van de factuur. Alle facturen zijn betaalbaar dertig dagen na dagtekening. Alle vermelde bedragen zijn vrij van BTW.

Voor iedere module kan er afzonderlijk ingeschreven worden.

 Module 1: Basiscursus R  € 600
 Module 2: Basiscursus statistiek  € 1.050
 Module 3: Regressieanalyse  € 1.050
 Module 4: Proefopzet  € 1.050

Kortingen

  • Bij het volgen van 2 modules ontvangt u 5% korting. Bij het volgen van 3 of 4 modules ontvangt u 10% korting.
  • Indien minstens één deelnemer van een bedrijf inschrijft voor de volledige opleiding, wordt voor alle bijkomende gelijktijdige inschrijvingen van hetzelfde bedrijf een korting van 20% verleend. Facturatie geschiedt dan d.m.v. een gezamenlijke factuur.
  • Leden van AIG (Alumnivereniging van Ingenieurs afgestudeerd aan de Universiteit Gent) en VBIG (Verbond Afgestudeerde Bio-ingenieurs van de Universiteit Gent) genieten een korting van 10% op de in de tabel vermelde prijzen.
  • Personeelsleden van de UGent genieten bijzondere voorwaarden, mail ons voor meer informatie.
  • Voor personeelsleden van de associatie UGent gelden andere voorwaarden, mail ons voor meer informatie.

Kortingen zijn niet cumuleerbaar.

Annulering

Bij annulering tot uiterlijk één week voor de start van de cursus blijft 25% van de deelnemingsbijdrage verschuldigd. Bij latere annulering wordt het volledig bedrag aangerekend, wat dan wel recht geeft op alle documenten die aan de deelnemers ter beschikking werden gesteld tijdens de cursus. Vervanging van aangemelde personen is enkel mogelijk voor deelnemers die geen getuigschrift van postacademische opleiding beogen.



KMO-portefeuille

Universiteit Gent aanvaardt betalingen via de KMO-portefeuille.
U vindt meer info op www.kmo-portefeuille.be.

Gebruik de volgende authorisatie-ID:

DV.O103194

Inschrijven

* verplicht

Persoonlijke gegevens

M ♂        V ♀

Naam*
Voornaam*  
E-mail*  
Telefoon*  
Facturatie op privé- of bedrijfsadres?*  

Privé-adres

Straat en nummer
Postcode
Gemeente
Land*

Bedrijfsgegevens

Onderneming
Functie
Straat en nummer
Postcode
Gemeente
Land*
Telefoon
Fax
BTW-nummer

SAP (enkel voor UGent)
AIG-lidnummer (INFO)
VBIG-promotiejaar (INFO)
Lid van Agoria
Lid van FeWeb

Inschrijving

Ik schrijf in voor de opleiding 'Basisstatistiek voor onderzoekers '

Module 1
Module 2
Module 3
Module 4
Alle Modules

Handboeken

De handboeken zijn optioneel en zijn niet inbegrepen in de deelnameprijs.

Optimal design of experiments: a case study approach van Goos Peter en Bradley Jones | € 88,99 incl. BTW
R for Dummies van Joris Meys | € 32,36 incl. BTW
Applied Linear Statistical Models van Neter, Wasserman en Kutner (module 2 en 3) | € 82,76 incl. BTW
Design and Analysis of Experiments van Montgomery (module 4) | € 89,95 incl. BTW

Info

Ik wens blijvend geïnformeerd te worden over toekomstige opleidingen van het UGAIN.

Op welke manier heeft u kennis genomen van deze opleiding?

Via de UGAIN folder

Via de UGAIN e-mailing

Via een advertentie in (tijdschrift invullen aub):

Anders, met name via (ander infokanaal invullen aub):


Annulatievoorwaarden

Ik heb kennis genomen van de annulatievoorwaarden en ik verklaar mij hiermee akkoord.*



Zodra u op 'verzenden' heeft geklikt én alle verplichte velden zijn ingevuld, ontvangt u altijd een mail ter bevestiging van uw inschrijving.

Indien u deze mail niet heeft ontvangen, gelieve contact op te nemen met de webmaster, steven.deneef@ugent.be

Laptop

Deelnemers dienen hun eigen laptop mee te brengen, dit voor het gebruik van het publieke statistisch softwarepakket R: https://cran.r-project.org/ en R Studio: https://www.rstudio.com/products/rstudio/download3/.

Tijdstip en locatie

De lessen worden gegeven van 16u30 tot 20u, in 2 delen, gescheiden door een broodjesmaaltijd.

De lessen vinden plaats aan de Universiteit Gent, UGent Academie voor Ingenieurs, UGAIN leszaal, Technologiepark 904, 9052 Zwijnaarde.

Data onder voorbehoud van wijzigingen om onvoorziene omstandigheden.

Bijkomende inlichtingen

Universiteit Gent
UGent Academie voor Ingenieurs
Secretariaat
Els Van Lierde
Technologiepark 904
9052 Zwijnaarde
Tel.: +32 9 264 55 82
fax: +32 9 264 56 05
ugain@UGent.be

Deze opleiding kan in de doctoraatsopleiding opgenomen worden, op voorwaarde dat de doctorandus beschikt over een goedgekeurde aanvraag tot erkenning (application for recognition, download hier).

Wie over een goedgekeurde 'application' beschikt, kan rekenen op terugbetaling van het inschrijvingsgeld, op voorwaarde dat er een bewijs van slagen kan voorgelegd worden.
Deze opleidingsonderdelen worden als volgt erkend als onderdeel van de Doctoraatsopleiding Universiteit Gent:
  • Basiscursus R: 4 lessen van telkens 3 uur: transferable skills, research and valorization, mits slagen voor examen
  • Basiscursus statistiek: 7 lessen van telkens 3 uur: gespecialiseerd, mits slagen voor examen
  • Regressieanalyse: 7 lessen van telkens 3 uur: gespecialiseerd, mits slagen voor examen
  • Proefopzet: 7 lessen van telkens 3 uur: gespecialiseerd, mits slagen voor examen


U kunt u de folder hier downloaden.