Friday 17 February 2017

Différence Entre La Régression Linéaire Et La Moyenne Mobile

Quelles sont les relations et les différences entre les séries chronologiques et la régression Pour les modèles et les hypothèses. Est-il correct que les modèles de régression supposent l'indépendance entre les variables de sortie pour différentes valeurs de la variable d'entrée, tandis que le modèle de série chronologique ne fait pas? Quelles sont quelques autres différences Il existe un certain nombre d'approches à l'analyse des séries chronologiques, La méthode de régression et la méthode Box-Jenkins (1976) ou ARIMA (AutoRegressive Integrated Moving Average). Ce document introduit la méthode de régression. Je considère la méthode de régression très supérieure à ARIMA pour trois raisons principales, je ne comprends pas très bien ce que la méthode de régression pour les séries chronologiques est sur le site, et comment il est différent de la méthode Box-Jenkins ou ARIMA. J'apprécie que quelqu'un puisse donner un aperçu de ces questions. Merci et salutations Je pense vraiment que c'est une bonne question et mérite une réponse. Le lien fourni est écrit par un psychologue qui prétend que certains home-brew méthode est une meilleure façon de faire des séries chronologiques analyse que Box-Jenkins. J'espère que ma tentative de réponse encouragera les autres, qui connaissent mieux les séries chronologiques, à contribuer. De son introduction, il semble que Darlington est champion de l'approche de juste montage d'un modèle AR par les moindres carrés. C'est-à-dire que si vous voulez adapter le modèle zt alpha1 z cdots alphak z varepsilont à la série temporelle zt, vous pouvez simplement régresser la série zt sur la série avec lag 1, lag 2, et ainsi de suite jusqu'à lag k, en utilisant un Régression multiple ordinaire. Cela est certainement permis dans R, son même une option dans la fonction ar. Je l'ai testé dehors, et il tend à donner des réponses semblables à la méthode par défaut pour adapter un modèle d'AR dans R. Il préconise également la régression de zt sur des choses comme t ou des puissances de t pour trouver des tendances. Encore une fois, c'est absolument parfait. Beaucoup de livres de séries chronologiques parlent de cela, par exemple Shumway-Stoffer et Cowpertwait-Metcalfe. En règle générale, une analyse de séries chronologiques peut se dérouler comme suit: vous trouvez une tendance, retirez-la, puis ajustez un modèle aux résidus. Mais il semble aussi qu'il préconise un ajustement excessif, puis en utilisant la réduction de l'erreur quadratique moyenne entre les séries ajustées et les données comme preuve que sa méthode est meilleure. Par exemple: Je sens que les corrélogrammes sont maintenant obsolètes. Leur but principal était de permettre aux travailleurs de deviner quels modèles s'adapteraient mieux aux données, mais la vitesse des ordinateurs modernes (au moins dans la régression si ce n'est dans le modèle de montage en série) permet à un travailleur de simplement ajuster plusieurs modèles et de voir exactement comment Chacune correspond à l'erreur quadratique moyenne. La question de la capitalisation sur le hasard n'est pas pertinente pour ce choix, puisque les deux méthodes sont également sensibles à ce problème. Ce n'est pas une bonne idée parce que le test d'un modèle est censé être à quel point il peut prévoir, et non pas comment il correspond aux données existantes. Dans ses trois exemples, il utilise l'erreur quadratique moyenne ajustée comme critère pour la qualité de l'ajustement. Bien sûr, l'ajustement d'un modèle va rendre une estimation de l'échantillon inférieure à l'erreur, donc sa prétention que ses modèles sont meilleurs parce qu'ils ont un RMSE plus faible est faux. En bref, puisqu'il utilise le mauvais critère pour évaluer la qualité d'un modèle, il arrive à des conclusions erronées au sujet de la régression contre ARIMA. Id parier que, s'il avait testé la capacité prédictive des modèles à la place, ARIMA serait sorti sur le dessus. Peut-être quelqu'un peut-il essayer si ils ont accès aux livres qu'il mentionne ici. Supplémentaire: pour en savoir plus sur l'idée de régression, vous voudrez peut-être consulter des livres de séries chronologiques plus anciennes qui ont été écrits avant que ARIMA devienne le plus populaire. Par exemple, Kendall, Time-Series. 1973, chapitre 11 a un chapitre entier sur cette méthode et les comparaisons à ARIMA. Autant que je sache, l'auteur n'a jamais décrit sa méthode de brassage à la maison dans une publication revue par les pairs et les références à la littérature statistique et à celles-ci semblent minimes et ses principales publications sur les sujets méthodologiques remontent aux années 70. À strictement parler, rien de tout cela prouve quoi que ce soit, mais sans suffisamment de temps ou d'expertise pour évaluer les revendications moi-même, je serais extrêmement réticents à utiliser tout cela. Ndash Gala Juin 18 13 à 11: 31mike, première installation R (si vous ne l'avez pas déjà), exécutez R et installez le paquet TeachingDemos (exactement comment dépend de votre système), chargez le paquet avec la bibliothèque (TeachingDemos) puis tapez loess. demo Pour faire apparaître la page d'aide pour voir comment l'exécuter, vous pouvez faire défiler jusqu'au bas où l'exemple sont et copier et coller ce code à la ligne de commande R39s pour voir les exemples, puis exécutez avec vos propres données pour explorer plus loin. Ndash Greg Snow Mar 23 12 à 17:15 Voici une réponse simple mais détaillée. Un modèle linéaire correspond à une relation à travers tous les points de données. Ce modèle peut être de premier ordre (un autre sens de linéaire) ou polynomial pour tenir compte de la courbure, ou avec des splines pour tenir compte de différentes régions ayant un modèle de gouvernance différent. Un ajustement LOESS est une régression pondérée localement basée sur les points de données d'origine. Qu'est-ce que cela signifie? Un réglage LOESS ajoute les valeurs X et Y d'origine, plus un ensemble de valeurs de sortie X pour lesquelles on calcule de nouvelles valeurs Y (habituellement les mêmes valeurs X sont utilisées pour les deux, mais on utilise souvent moins de X pour les paires XY ajustées En raison du calcul accru requis). Pour chaque valeur X de sortie, une partie des données d'entrée est utilisée pour calculer un ajustement. La partie des données, généralement 25 à 100, mais typiquement 33 ou 50, est locale, ce qui signifie que c'est la partie des données originales la plus proche de chaque valeur X de sortie particulière. C'est un ajustement en mouvement, car chaque valeur de sortie X nécessite un sous-ensemble différent des données d'origine, avec des poids différents (voir paragraphe suivant). Ce sous-ensemble de points de données d'entrée est utilisé pour effectuer une régression pondérée, les points les plus proches de la valeur de sortie X étant donné un poids plus important. Cette régression est habituellement de premier ordre ou de deuxième ordre est possible, mais nécessitent une plus grande puissance de calcul. La valeur Y de cette régression pondérée calculée à la sortie X est utilisée comme valeur Y des modèles pour cette valeur X. La régression est recalculée à chaque valeur X de sortie pour produire un ensemble complet de valeurs Y de sortie. La fonction Différence de la moyenne mobile (série temporelle) calcule la différence entre une valeur et sa moyenne mobile de la série temporelle. Paramètres ------------------ Données Les données à analyser. Il s'agit généralement d'un champ d'une série de données ou d'une valeur calculée. Période Nombre de barres de données à inclure dans la moyenne, y compris la valeur actuelle. Par exemple, une période de 3 comprend la valeur courante et les deux valeurs précédentes. Valeur de la fonction ------------------------ La moyenne mobile de la série chronologique est calculée en ajustant une droite de régression linéaire sur les valeurs pour la période donnée, puis en déterminant La valeur actuelle pour cette ligne. Une droite de régression linéaire est une droite qui est aussi proche de toutes les valeurs données que possible. La moyenne mobile des séries chronologiques au début d'une série de données n'est pas définie jusqu'à ce qu'il y ait suffisamment de valeurs pour remplir la période donnée. Il est à noter qu'une moyenne mobile de la série chronologique diffère considérablement des autres types de moyennes mobiles en ce que la valeur actuelle suit la tendance récente des données, et non une moyenne réelle des données. De ce fait, la valeur de cette fonction peut être supérieure ou inférieure à toutes les valeurs utilisées si la tendance des données est en général croissante ou décroissante. La différence par rapport à la moyenne mobile est la moyenne mobile soustraite de la valeur actuelle. Utilisation ----------- Moyennes mobiles sont utiles pour lisser les données bruyantes brut, comme les prix quotidiens. Les données de prix peuvent varier considérablement d'un jour à l'autre, ce qui obscurcit si le prix augmente ou diminue au fil du temps. En regardant la moyenne mobile du prix, on peut voir un tableau plus général des tendances sous-jacentes. Puisque les moyennes mobiles peuvent être utilisés pour voir les tendances, ils peuvent également être utilisés pour voir si les données sont contrer la tendance. Cela fait la différence de la moyenne mobile utile pour mettre en évidence où les données sont rupture de la tendance.


No comments:

Post a Comment