Chapitre 1 : Description des séries chronologiques

 

1.     Pourquoi étudier les séries chronologiques?

2.     Portefeuille de séries chronologiques : flux, stock, fréquence, etc.

3.     Caractéristiques des séries et transformations usuelles

4.     Saisonnalité et désaisonnalisation

 

Annexe : Transformation logarithmique et taux de croissance

Programme : trimes.prg

 

1. Pourquoi étudier les séries chronologiques?

 

De façon détournée, les séries chronologiques font partie de notre quotidien.  Par exemple, le journal télévisé rapporte tous les jours la valeur du TSE300 ou du taux de change du dollar canadien.  On fait même de magnifiques graphiques dans nos quotidiens.  Au-delà de l’information véhiculée, il faut chercher à modéliser les mécanismes sous-jacents pour éventuellement mieux comprendre la variable en question et ... qui sait, mieux la prévoir!

 

Définition : Une série chronologique est une suite ordonnée d’observations notée yt , t=1,...T.

 

2. Portefeuille de séries chronologiques : flux, stock, fréquence, etc.

 

Les graphiques joints illustrent toutes sortes de séries chronologiques.  On peut les représenter à l’aide du tableau suivant :

 

Données

Flux : mesuré au cours de la période

Stock : mesuré à un moment précis de la période (photographie)

Prix : mesuré à un moment précis

Quinquennales

 

 

 

Annuelles

 

 

 

Trimestrielles

GDP US (PIB)

 

 

Mensuelles

 

Taux de chômage

IPC

Hebdomadaires

 

 

Taux d’intérêt

Quotidiennes

 

 

SP500

 

 

 

 

 

·       Idéalement, on devrait utiliser les séries sous leur fréquence naturelle;

·       En pratique, on procède à des conversions des données d’une fréquence à une autre (ex. mensuel vers trimestriel);

·       Il faut exercer une grande prudence dans les méthodes de conversion et les relations qu’on établira par la suite entre plusieurs variables (ex. calcul du taux d’intérêt réel ex post);

 

 

3. Caractéristiques des séries et transformations usuelles

 

transformation logarithmique

 

Notons tout d’abord que dans la grande majorité des cas, la transformation logarithmique est très utile : i. la pente de la série transformée correspond au taux de croissance ; ii. la première différence de la série est plus stable et iii. la différence entre deux séries s’interprète aussi comme une distance en pourcentages.  En fait, la transformation logarithmique (en pratique ln)  nous libère des unités de mesure et introduit des unités de pourcentage qui sont relatives, une caractéristique bien utile quand les données couvrent de longues périodes.  Voir les graphiques en niveau et en log dans le programme TRIMES.PRG.

 

trois transformations usuelles

 

Les séries chronologiques sont rarement utilisées comme telles dans des travaux économétriques.  Pour toutes sortes de raisons qui seront étudiées durant le cours, on applique essentiellement trois types de transformation (en plus de la transformation logarithmique) :

 

i.                 on estime une tendance qui est ensuite retranchée de la série : la résultante est une série en déviations par rapport à sa tendance;

ii.               on prend la première différence de la série;

iii.             dans le cas de deux séries, on s’intéresse à la différence entre les deux séries.

 

Idéalement, les séries finales (après transformation) obtenues devraient avoir un comportement plus «stable».

 

tendance linéaire

 

Pour trouver un estimé de la pente i.e. le taux de croissance instantané d’une série, on estime la régression suivante :

 

log yt = a + b t + ut      où t=1,2,..., T 

 

 

Variable dépendante

Variables indépendantes

Période

ln yt

constante

T

1991 :1

ln y1991 :1

1

1

1991 :2

ln y1992 :2

1

2

...

..

...

...

1993 :4

ln y1993 :4

1

12

 

L’échelle de la variable t n’est pas importante en autant que t augmente de façon régulière.  L’estimé de b, la pente de la droite de régression,  correspond au taux de croissance instantané de yt  et s’avère ainsi une approximation du taux de croissance discret (yt-yt-1)/yt-1.  

 

La valeur prédite est donnée par a* +b*t où le symbole * indique un estimé (i.e. a* =  â des livres d’économétrie).   Celle valeur prédite correspond à la partie tendancielle de ln yt i.e. le potentiel en macroéconomie.   Les résidus estimés, ln yt - a* +b*t, correspondent à la partie cyclique, c’est-à-dire la déviation en pourcentage de ln yt par rapport au potentiel (le GAP en macroéconomie).

 

tendance linéaire avec brisure

 

Dans bien des cas, la série n’a pas de tendance stable et des points de rupture sont observés.  Ainsi, supposons que le taux de croissance de la série (la pente) change à partir d’un point donné t0.  Comment estimer ce nouveau modèle qui devrait inclure deux tendances : une avant et une après!

 

Supposons une rupture à la période t0, le modèle suivant permet de capter les deux tendances :

 

ln yt     = a + bt + b1(t-t0)Dt

 

où Dt = 1 si t>t0 et 0 autrement .

 

Si t  est plus petit ou égal à  t0 alors  Dt = 0 et

 

ln yt     = a + bt (comme avant).

 

Si t > t0  alors

 

ln yt     = a+bt +b1(t-t0)

= (a-b1t0) + (b+b1) t

 

La nouvelle pente ou taux de croissance après la rupture t0 est égale à  b+b1.  Supposons la rupture à la période 1992 :3, i.e. t0=7, alors

 

 

Variable dépendante

Variables indépendantes

Période

ln y

constante

t

(t-t0)Dt

1991 :1

ln y1991 :1

1

1

(1-7)0=0

1991 :2

ln y992 :2

1

2

(2-7)0=0

...

..

...

...

...

1992 :2

 

1

6

(6-7)0=0

1992 :3

 

1

7

(7-7)0=0

1992 :4

 

1

8

(8-7)1=1

 

 

 

 

(8-7)1=2

...

...

...

...

...

1993 :4

ln y1993 :4

1

12

(12-7)1=5

 

On voit bien ici que nous avons deux tendances : la première [1,2,3,4 ...]débute à la période 1991 :1.  La deuxième [1,2,3 ...] débute à la période 1992 :4.

 

tendance lisse : hodrick-prescott

 

Poussé à l’extrême, on pourrait imaginer une situation où la tendance (la pente de la valeur prédite) change souvent,  à la limite continuellement.  Ainsi, toute série serait composée de deux éléments :

 

ln yt     = composante tendancielle + composante cyclique

 

ln y      =  tt + (ln yt - tt )

 

Au lieu de supposer que tt suit un modèle linéaire en t, on peut supposer comme les actuaires que tt change continuellement à une vitesse donnée par le coefficient l.  Conséquemment, on pourra «estimer» tt en minimisant le critère suivant (voir aussi RATS 5.0, UG, p. 376):

 

 

La première partie de la formule représente les déviations de  la série par rapport à la tendance :   plus les déviations sont grandes, plus le critère augmente.  La deuxième partie correspond au changement des changements, i.e. la dérivée seconde.  Ainsi, il y a trois possibilités intéressantes :

 

·       l =  très grand.  On pénalise fortement la dérivée seconde.  Pour minimiser le critère, on gardera la dérivée seconde à zéro, donc la pente (dérivée première) sera fixe.  Ceci correspond au cas linéaire.

·       l =  0.  Aucune pénalité pour la dérivée seconde qui pourra varier de façon importante.  La tendance sera égale à la valeur de la série observée, i.e. ln yt = tt .

·       l =  1600.  cas intermédiaire choisi par Kydland et Prescott (1990).

 

Une fois la tendance estimée, on peut trouver la portion cyclique de façon usuelle.

 

la premièrre différence

 

À la recherche d’une certaine «stabilité», on peut aussi transformer notre série initiale en prenant la première différence

 

D ln yt = ln yt – ln yt-1 = 

 

La première différence du log d’une série est en fait une approximation de son taux de croissance discret.

 

Pour estimer la moyenne du taux de croissance, on peut estimer la régression suivante :

 

D ln yt =  a + ut

 

où a représente le taux de croissance moyen.

 

 

Variable dépendante

Variable indépendante

Période

Dln yt

constante

1991 :2

Dln y1991 :2

1

...

..

...

1993 :4

Dln y1993 :4

1

 

 

comment capter le changement du taux de croissance d’une série

 

Supposons que votre série en première différence i.e. D ln yt semble évoluer selon deux paliers différents.  On aurait alors deux taux de croissance : un avant et un après! Pour estimer les deux taux de croissance, on peut effectuer la régression suivante :

 

D ln yt =  a0 + a1 + ut

 

où a0 représente le taux de croissance moyen de la première période et a1 celui de la deuxième période.

 

 

Variable dépendante

Variable indépendante

Période

Dln yt

Constante a0

Constante a1

1991 :2

Dln y1991 :2

1

0

...

..

...

1992 :3

Dln y1992 :2

1

0

1992 :4

Dln y1992 :3

0

1

 

1993 :4

Dln y1993 :4

0

1

 

 

l’écart par rapport à deux séries

 

Soit deux séries yt et xt : au lieu de transformer chaque série individuellement, on s’intéresse à la série zt = yt - xt qui sera dans la plus part des cas beaucoup plus sable.   

 

 

 

4. Saisonnalité et désaisonnalisation

 

Se référer à la discussion en classe.

 

D ln yt =  Q1 + Q2 + Q3 + Q4 + ut

 

 

 

Variable dépendante

Variables indépendantes

Période

D ln yt

Q1

Q2

Q3

Q4

1992 :1

 

1

0

0

0

1992 :2

 

0

1

0

0

1992 :3

 

0

0

1

0

1992 :4

 

0

0

0

1

...

 

...

...

...

...

1993 :4

 

0

0

0

1

 

 

Annexe : Transformation logarithmique et taux de croissance

 

La notion de taux de croissance est omniprésente dans l’analyse des séries chronologiques tout comme dans les calculs financiers usuels.  Ainsi, on sait qu’une somme initiale A placée pendant n années à un taux R rapportera

 

Montant final = A(1+R)n .

 

De la même façon, une économie ayant un PIB initial de y0 et qui croît à un taux g pendant t années atteindra le niveau

 

(1)       yt = y0(1+g)t.

 

Afin de simplifier les calculs, il est souvent préférable de procéder à la transformation suivante

 

(2)       ln yt = ln y0 + ln(1+g)t

 

qui donne une équation linéaire, donc plus simple et estimable par les méthodes usuelles.  Par exemple, on peut effectuer la régression

 

(3)       ln yt = a + bt

 

et obtenir un estimé de g en utilisant l’identité b = ln(1+g)  i.e. g=eb-1.  Si les données sous-jacentes sont trimestrielles, le taux de croissance annuel est calcul de façon usuelle comme (1+g)4.   Si les données sous-jacentes  étaient annuelles, alors le taux de croissance trimestriel serait donné par (1+TauxTrimestriel)4=1+g.

 

L’équation (3) peut aussi être dérivée en faisant appel à la notion de fréquence de capitalisation.  On sait une somme initiale A placée pendant n années à un taux annuel R capitalisé m fois par année rapportera

 

Montant final = A(1+R/m)mn .  À titre d’exemple,

 

R=0,1, n=1, A=100

A(1+R/m)mn

M=1 (annuel)

110

M=2 (bi-annuel)

110,25

M=4 (trimestriel)

110,38

M=12 (mensuel)

110,47

M=52 (hebdomadaire)

110,51

M=365 (quotidien)

110.52

 

Une capitalisation quotidienne correspond grosso modo à une capitalisation continue où

 

            Montant final = AeRn.

 

De la même façon, une série qui augmente à un taux continu (ou instantané) de b peut être représentée par

 

(4)       yt = y0ebt.

 

En appliquant la transformation logarithmique, on obtient l’équation (3) de tout à l’heure

 

(5)            ln yt = a + bt

 

où a = ln y0.  Le coefficient b de la régression peut donc être interprété comme le taux de croissance instantané ou continu de la série y.  Il s’agit là d’une simplification qui sera fort utile.

 

En utilisant l’approximation ln(1+x) » x, on peut monter que b = ln(1+g) » g.  Par exemple, si g = 0,05, ln(1+0,05)=0,0487.

 

Par exemple, il arrive souvent que les chercheurs aient recours au taux de croissance d’une série.  On peut bien sûr le calculer de façon usuelle à l’aide de la formule

 

            (yt – yt-1)/yt-1

 

i.e. le taux de croissance discret g. On peut obtenir une approximation fort utile en notant que

 

ln yt = ln y0 + bt

ln yt-1 = ln y0 + b(t-1)   et que

ln yt – ln yt-1 = ln y0 + bt – ln y0 – b(t-1)

(6)       ln yt – ln yt-1 = b(t-t+1) = b

 

La première différence du log naturel de y (ln) nous donne le taux de croissance instantané directement! 

 

Finalement, la régression (3) ou (5) permet d’isoler la valeur ajustée de la régression (fit)

 

ln yt = a*+b*t + u*t.

 

ln yt = fitt + erreurt.

 

où * indique un coefficient ou une variable estimée. Comme lnyt – lnyt-1 correspond à un taux (le taux de croissance), ln yt - fitt correspond aussi à un taux mais un taux différent.  En fait, erreurt peut être interprété comme la déviation en pourcentage par rapport à la tendance linéaire captée par le fit de la régression.  Suite à une transformation logarithmique, la plupart des calculs ou des nombres en présence peuvent être ramenée à des unités de pourcentage.  Pour vous en convaincre, l’exemple ci-dessous est fort utile.

 

 

 

*   Transformation logarithmique

*

ALLOCATE 20

SET TREND = T

SET Y = 0

SET Y 1 20 = 1.0*EXP(.1*TREND)

SET LN_Y 1 20 = LOG(Y)

GRAPH(HEADER='Transformation logarithmique',KEY=UPLEFT) 2

# Y

# LN_Y

SET DIFF_Y 2 20 = LN_Y(T)-LN_Y(T-1)

PRINT 2 5 DIFF_Y

 

 ENTRY        DIFF_Y

      2  0.1000000000000

      3  0.1000000000000

      4  0.1000000000000

      5  0.1000000000000