Archive pour août 2009

Comparaison entre Data Merge et Hash (Hashing)

Présentation.

Bien souvent en SAS nous sommes amené à traiter des volumes d’information très important, aussi il est nécessaire de pouvoir optimiser le code de nos programmes SAS, afin de diminuer les temps de traitement.

Dans cette article nous allons nous pencher sur une technique de traitement des données SAS optimisant de manière importante la résolution de la problématique « Performance » lors de la fusion de données SAS

Le Code HASH

Le code HASH ou le souvent nommé « hashing » est disponible depuis la version SAS®9. Il nous fournit des méthodes très rapides et plus efficaces pour stocker, rechercher et plus généralement manipuler des données dans des tables basées sur des clés d’identification.

Fonctionnement, démarche avec le Code Hash

Pour un néophyte, le code hash de SAS, apparait comme étant plus compliqué à assimiler que le langage SAS base. Toutefois cela n’est pas très vrai et quand bien même ! Le jeu en vaut la chandelle.

Le code Hash est un code objet permettant de gérer une table en mémoire, avec comme toute autre table SAS, des lignes et des colonnes (variables, observations).

Lire la suite de cette entrée »