|
|
| |  |
Atelier sur la modélisation de données 05-10-2009 |
Durée : 5.0 jour(s) | |
|
| |
:: Description généraleCet atelier de 5 jours offre aux participants la chance de devenir familiers avec les méthodes de modélisation classiques – régression linéaire, non-linéaire, logistique - ainsi que des méthodes alternatives et de puissantes techniques récentes – incluant la régression PLS, les modèles Lasso et les "Random forests". L'emphase sera mise sur les applications des méthodes et l'interprétation des résultats. Les participants sont invités à utiliser leurs propres logiciels ainsi que leurs jeux de données. Chaque jour un atelier spécial portant sur les aspects spéficiques à la modélisation de données aura lieu et des sessions pratiques sont prévues afin d'intégrer les méthodes couvertes pendant la semaine.:: Objectifs pédagogiquesL'objectif principal de cette formation consiste à fournir aux participants une connaissance pratique des méthodes de modélisation les plus répandues ainsi que les alternatives développées récemment qui sont déjà reconnues comme puissantes.
A la fin de cet atelier, les participants sauront :
Comment mettre en place une stratégie de modélisation qui couvre une variété de situations;
Ajuster un éventail de modèles statistiques adaptés à la nature des données disponibles;
D'identifier les problèmes qui sont susceptibles d'affecter la validité des résultats;
D'évaluer la qualité du modèle ajusté aux données, que ce soit en termes d'adéquation ou de capacité de prédiction;
De comparer différents modèles entre eux et de sélectionner le plus approprié selon le contexte;:: Public cibleComme pour la plupart des sessions offertes par Creascience, le contenu mathématique de la session est maintenu à un niveau minimum afin de mettre l'emphase sur les problèmes pratiques, l'interprétation des sorties des logiciels et l'utilisation des résultats. Par conséquent, cette formation s'adresse autant à des statistisciens que des non-statisticiens qui font face à des problèmes de modélisation et qui désirent améliorer leurs pratiques et devenir familiers avec les plus récentes techniques. Les chercheurs, les analystes financiers, les ingénieurs, les analystes en général font partie de l'auditoire cible pour cet atelier.:: Pré-requisPour suivre cette formation, les participants doivent:
Posséder certaines notions de bases en statistique : outils de la statistique descriptive, notions de variables continues et discrètes, d'objets. C'est-à-dire avoir suivi la formation Les outils essentiels de la statistique ou avoir un niveau correspondant.
Avoir une bonne connaissance appliquée des concepts de base en statistique: statistiques descriptives (moyenne, écart-type, coefficients de corrélation, etc.) et les différents types de variables (continues vs. discrètes).
Une connaissance de la régression linéaire est désirable mais non essentielle. Toutefois la bonne compréhension des objectifs de la contruction d'un modèle peut être utile afin de maximiser l'apprentissage des techniques couvertes dans l'atelier.
Il est impératif que les participants soient familiers avec la manipulation de données dans leur logiciel statistique. | | |
:: Plan du coursJour 1
- Introduction générale à la modélisation de données
- Régression linéaire simple et multiple
- Atelier spécial: les graphiques en régression
- Évaluation de la qualité du modèle et l'adéquation du modèle aux données
- Détection de données extrêmes et influentes
- Validation des hypothèses sous-jacentes du modèle
Jour 2
- Modélisation de données binaires: régression logistique, analyse discriminante et alternatives
- Généralisation à tout type de variable réponse discrète
- Régression logistique ordinale
- Régression logistique polytomique
- Atelier spécial: la construction de modèles de prédiction>
- Qu'est-ce qui diffère de l'approche classique de construction de modèles?
- La validation croisée et des alternatives plus robustes
Jour 3
- La gestion de la multicollinéarité dans les modèles de régression:" quelques options
- Régression sur les composantes principales
- Régression PLS 'Partial Least Squares'
- Régression LASSO
- Régression Ridge
- Atelier spécial: Les logiciels statistiques pour la modélisation de données>
Jour 4
- Les méthodes altermatives modernes pour la modélisation de données
- Arbres de régression
- Fôrets aléatoires 'Random Forests'
- Atelier spécial: Une stratégie générale pour la construction de modèles>
Jour 5
- Modèles de régression non-linéaire
- Un aperçu d'autres techniques de modélisation
- Atelier spécial: La gestion des données manquantes
- Atelier pratique sur la modélisation de données
:: Thèmes abordésInstructeurs
La session est dirigée par deux formateurs expérimentés. Ils partagent leur expérience pratique des méthodes en utilisant des exemples et applications réels et en suggérant des applications originales des méthodes.
Classe de petite taille
Le nombre de participants est limité à 12 personnes. De plus, étant donné que 2 instructeurs sont présents, ceci assure un suivi personnalisé de chacun des participants tout en maintenant un rythme qui conviendra autant aux novices qu'aux participants plus expérimentés.
Participants
Cet atelier offre aux participants une chance unique d'améliorer leurs pratiques et compréhention de la modélisation de données dans un environnement multidisciplinaire. Selon notre expérience, la présence de participants provanant de différents champs d'applications et utilisant différents logiciels statistiques permet de partager des préoccupations et objectifs communs et permet aux participants d'obtenir un perspective plus large des sujets traités pendant l'atelier ainsi que des outils et solutions disponibles.
Études de cas et analyse de données
Une autre particularité de la formation est le temps consacré à l'analyse de données. Tout d'abord, les participants reproduisent une analyse présentée par un formateur. Ensuite, les participants sont invités à appliquer l'analyse sur un de leurs jeux de données. Des jeux de données supplémentaires sont fournies dans la mesure ou ceux des participants ne serait pas appropriés pour l'application des certaines techniques de modélisation. De manière générale, l'emphase ne se limite pas simplement à l'analyse de données et l'interprétation des résultats, mais aussi sur la spécification adéquate de la question de recherche en termes statistiques. Tous les participants qui s'inscrivent à la formation seront contactés quelques semaines avant la tenue de la formation afin de discuter des jeux de données qu'ils entendent utiliser pendant les ateliers.
| |
|
|
|
 |
Prochaines sessions publiques |
| Aucune session inter-entreprise n'est prévue pour le moment. Si vous êtes intéressé, n'hésitez pas à nous contacter en nous précisant le lieu où vous préféreriez assister à cette formation : Contactez nous |
|
Commentaires des participants |
Il n'y a pour l'instant aucun commentaire pour cette formation. Si vous y avez assisté et que vous souhaitiez partager votre expérience avec d'autres, suivez ce lien: Écrire une critique Si vous souhaitez avoir une appréciation générale de nos formations, veuillez consulter la page Critiques de ce site. |
|
|
|
|
|
|
|
|
|
|
|
|
 |
Techniques de régression linéaire simple et multiple |
 |
|
|
|
|
|
|
| |