Modele de regresie neliniare

Faites des recherches sur ce que les autres ont fait et intégrez ces résultats dans la construction de votre modèle. Avant de commencer l`analyse de régression, développez une idée de ce que les variables importantes sont en même temps que leurs relations, signes de coefficient, et grandeurs d`effet. En s`appuyant sur les résultats des autres, il est plus facile de collecter les données correctes et de spécifier le meilleur modèle de régression sans nécessiter d`exploration de données. C`est ce qu`on appelle la ligne de régression et elle est dessinée (à l`aide d`un programme de statistiques comme SPSS ou STATA ou même Excel) pour afficher la ligne qui correspond le mieux aux données. En d`autres termes, explique Redman, “la ligne rouge est la meilleure explication de la relation entre la variable indépendante et variable dépendante.” Bien que son analyse mathématique a été correcte, l`explication biologique de Galton pour le phénomène de régression qu`il a observé est maintenant connu pour être incorrect. Il a déclaré: «un enfant hérite en partie de ses parents, en partie de ses ancêtres. Parlant généralement, plus sa généalogie remonte, plus ses ancêtres deviendront nombreux et variés, jusqu`à ce qu`ils cessent de différer de tout échantillon tout aussi nombreux pris au hasard de la course en général. [11] Ceci est incorrect, puisqu`un enfant reçoit son maquillage génétique exclusivement de ses parents. Il n`y a pas de génération-sautant dans le matériel génétique: n`importe quel matériel génétique des ancêtres antérieurs doit avoir passé par les parents (bien qu`il n`ait peut-être pas été exprimé en eux).

Le phénomène est mieux compris si nous supposons que le caractère hérité (par exemple, la hauteur) est contrôlé par un grand nombre de gènes récessifs. Les individus exceptionnellement grands doivent être homozygotes pour des mutations de hauteur accrues à une grande proportion de ces loci. Mais les loci qui transportent ces mutations ne sont pas nécessairement partagés entre deux grands individus, et si ces individus s`accouplent, leur progéniture sera en moyenne homozygote pour les mutations «grandes» sur moins de loci que l`un de leurs parents. En outre, la hauteur n`est pas entièrement génétiquement déterminée, mais aussi sujette à des influences environnementales pendant le développement, ce qui rend les descendants de parents exceptionnels encore plus susceptibles d`être plus proches de la moyenne que leurs parents. Ignorez le terme d`erreur pour le moment. Il se réfère au fait que la régression n`est pas parfaitement précise. Il suffit de se concentrer sur le modèle: l`exemple ci-dessus utilise une seule variable pour prédire le facteur d`intérêt, dans ce cas, la pluie pour prédire les ventes. En général, vous démarrez une analyse de régression voulant comprendre l`impact de plusieurs variables indépendantes. Ainsi, vous pourriez inclure non seulement la pluie, mais aussi des données sur la promotion d`un concurrent.

“Vous continuez à faire cela jusqu`à ce que le terme d`erreur est très faible,” dit Redman. “Vous essayez d`obtenir la ligne qui correspond le mieux à vos données.” Bien qu`il puisse y avoir des dangers pour essayer d`inclure trop de variables dans une analyse de régression, les analystes compétents peuvent minimiser ces risques. Et compte tenu de l`impact de plusieurs variables à la fois est l`un des plus grands avantages de la régression. Choisir le bon modèle de régression est autant une science qu`un art. Les méthodes statistiques peuvent aider à vous orienter dans la bonne direction, mais en fin de compte, vous aurez besoin d`incorporer d`autres considérations. Chaque fois que vous travaillez avec une analyse de régression ou toute autre analyse qui essaie d`expliquer l`impact d`un facteur sur un autre, vous devez vous rappeler l`adage important: la corrélation n`est pas la causalité. C`est essentiel et Voici pourquoi: il est facile de dire qu`il existe une corrélation entre la pluie et les ventes mensuelles. La régression montre qu`ils sont en effet liés.

Mais c`est une chose tout à fait différente de dire que la pluie a causé les ventes. Sauf si vous vendez des parapluies, il peut être difficile de prouver qu`il ya cause et effet. Revenons maintenant au terme d`erreur. Vous pourriez être tenté de dire que la pluie a un grand impact sur les ventes si pour chaque pouce vous obtenez cinq ventes de plus, mais si cette variable vaut votre attention dépendra du terme d`erreur. Une ligne de régression a toujours un terme d`erreur car, dans la vie réelle, les variables indépendantes ne sont jamais des prédicteurs parfaits des variables dépendantes.