UNA PROPUESTA DE EMPALME
DE LAS ENCUESTAS DE HOGARES
BASADA EN LA TASA DE DESEMPLEO*
JUAN BYRON CORREA F.**, JAVIER ANDRÉS CASTRO H.***
** Matemático y Magister en Economía de la Universidad de Antioquia. Profesor asistente del departamento de economía, Universidad del Valle, Cali, Colombia.
jbcorrea@univalle.edu.co.
*** Economista y Magister en Economía de la Universida Nacional de Colombia. Profesor auxiliar del departamento de economía, Universidad del Valle, Cali, Colombia.
jacastro@univalle.edu.co.
**, ***Integrantes del Grupo de Investigación de Economía Laboral y Sociología del Trabajo,
de la Facultad de Ciencias Sociales y Económicas de la Universidad del Valle.
Este artículo se recibió el 5-4-2006 y se aceptó el 8-8-2006.
RESUMEN
El análisis acerca de los cambios de metodología entre la Encuesta Nacional de Hogares (ENH) y la Encuesta Continua de Hogares (ECH), permite ver una ruptura en el estudio de los indicadores del mercado laboral que justifica el desarrollo de una propuesta de empalme para las variables utilizadas en el cálculo de los indicadores del mercado laboral. Particularmente, este artículo trabaja el empalme de la serie de la tasa de desempleo nacional a siete Áreas Metropolitanas desde marzo de 1985 hasta diciembre de 2003, basándose en el cálculo de un factor de corrección definitivo que es el producto de dos factores de corrección: uno por definición y otro por recolección, tal como lo presentaron Suárez y Buriticá (2004). Los resultados del empalme muestran que la serie corregida disminuye aproximadamente 0.46 puntos porcentuales, con respecto a la serie original. Asimismo, muestran que sólo es posible utilizar las ECH del año 2000 y el primer trimestre del 2001 para empalmar las series.
PALABRAS CLAVE
Quiebres estructurales, empalme de series, encuestas de hogares, tasa de desempleo, mercado laboral.
ABSTRACT
An analysis of the changes in the methodology for conducting the National Household Survey (NHS) and the Continuous Household Survey (CHS) reveals a divergence in the approaches to reviewing labor market indicators, thus warranting the development of a proposal for consolidating variables used in calculating labor market indicators.
This article specifically discusses the consolidation of a series of national unemployment rates in seven metropolitan areas in Colombia from March 1985 to December 2003. This consolidation is based on the calculation of a definitive correction factor that results from multiplying two different correction factors, i.e. one by definition and the other one by collection as presented by Suárez and Buriticá (2004).
The consolidation results show that the corrected series decreases approximately 0.46 percentage points with respect to the original series. The results also show that only Continuous Household Surveys conducted in 2000 and in the first quarter of 2001 can be used in consolidating the above mentioned series.
KEY WORDS
Structural breaks, joint of serieses, household survey, unemployment rate, labour market.
1. INTRODUCCIÓN
Colombia presenta una alta y persistente tasa de desempleo a partir de la segunda mitad de la década de los años noventa, lo anterior no obstante, el cambio de metodología en las encuestas de hogares, insumo fundamental para cuantificar y caracterizar el mercado laboral colombiano. A partir de 1970, el Departamento Nacional de Estadística (DANE) viene realizando la Encuesta Nacional de Hogares (ENH); sin embargo, en 1996 este organismo impulsó un plan tendiente a mejorar la calidad de las Encuestas de Hogares que culminaría con la adopción del sistema de recolección continuo, al cual se le denominó Encuesta Continua de Hogares (ECH). Este sistema entró en vigencia a partir del año 2000, siendo este un periodo de prueba, aplicándose simultáneamente con la ENH, y se implementó de forma permanente desde enero de 2001.
La transición de la ENH a la ECH implicó tres importantes cambios. Primero, se amplió el objetivo principal, permitiendo estimaciones acerca de temas demográficos y características socioeconómicas, además de profundizar en el análisis del mercado laboral. En segundo lugar, se redefinieron las poblaciones que conforman la PET (Población en Edad de Trabajar), en particular afectando los stocks de ocupados, desocupados e inactivos. Tercero, se modificó el sistema de recolección de información, pasando de una periodicidad trimestral a una semanal.1 Los dos últimos cambios sugieren que sin un previo ajuste los indicadores laborales no son comparables, por tanto, surge la necesidad de empalmar las series de los indicadores que provienen de las Encuestas de Hogares para permitir un análisis ininterrumpido de la situación del mercado laboral en el país.
Lasso (2002) y Suárez y Buriticá (2004) desarrollan dos diferentes metodologías de empalme. Por una parte, Lasso (2002), propone capturar las nuevas preguntas y sus flujos en el módulo de fuerza de trabajo, y observar los efectos sobre las poblaciones objetivo con la nueva ECH. Para esto implementa dos modelos jerárquicos con distribución binomial de probabilidad, donde cada modelo busca estimar los desplazamientos que se generan en las poblaciones dadas las nuevas definiciones de ocupados y desocupados. Además, Lasso construye dos modelos probit, uno para los nuevos ocupados y otro para los nuevos inactivos, para corregir las variaciones generadas por el nuevo sistema de recolección.
Por otra parte, Suárez y Buriticá (2004), proponen el cálculo de un factor de corrección para ambos cambios metodológicos. El factor tiene dos componentes: un factor de corrección por el cambio en la definición y un factor de corrección por el cambio en el sistema de recolección.
Ahora bien, la importancia de analizar la tasa de desempleo radica en que tiene componentes tanto de oferta como de demanda laboral. La tasa de desempleo se define como la relación entre la población económicamente activa no empleada pero que está buscando trabajo y la población económicamente activa (ocupados más desocupados). Esta última contiene la tasa de ocupación la cual refleja la demanda en el mercado laboral y la tasa global de participación que representa la oferta laboral. Lo anterior justifica el tratamiento de la tasa de desempleo como la variable relevante en el estudio del mercado laboral.
Este artículo tiene como objetivo presentar una propuesta de empalme para la Tasa de Desempleo (TD) nacional a siete Áreas Metropolitanas entre 1985-2003, siguiendo el trabajo de Suárez y Buriticá (2004). Además de esta introducción, el artículo en la siguiente sección analiza la metodología de la ENH y sus principales conceptos. La tercera sección muestra la metodología de la ECH y los nuevos conceptos que introduce. Las principales diferencias entre la ENH y la ECH se presentan en la cuarta sección. Por último, se explica la metodología de empalme de la serie TD y se analizan los resultados.
2. ENCUESTA NACIONAL DE HOGARES
La Encuesta Nacional de Hogares empezó a realizarse desde 1970, con el propósito de hacer estimaciones intercensales sobre demografía y características socio-económicas de los hogares. Inicialmente, entre 1970 y 1975 se realizaron nueve etapas con diferente periodicidad, cobertura y diseño muestral. En 1976, año en que se unificaron los anteriores criterios la cobertura se redujo a las ciudades más representativas de las condiciones urbanas del país (DNP, 1995). Además, se definen los elementos básicos de acuerdo con las recomendaciones que produce la Conferencia Internacional de Estadísticos del Trabajo (CIET) de la Oficina de la Organización Internacional del Trabajo (OIT). En un principio, se investigaban las cuatro principales ciudades (Santafé de Bogotá, Cali, Medellín y Barranquilla) trimestralmente, y semestralmente Bucaramanga, Manizales y Pasto.
A partir de 1984, se estudian las siete ciudades mencionadas como Áreas Metropolitanas con una mayor uniformidad en cobertura, periodicidad y diseño muestral. No obstante, un poco antes de este año se empezaron a incluir otras ciudades con diferente frecuencia: Cartagena se investigó anualmente desde septiembre de 1982; Cúcuta, Villa del Rosario, Los Patios, El Zulia, Pereira y Dosquebradas, se investigaron en junio de 1982 y luego por semestres (junio y diciembre) a partir de junio de 1983; Villavicencio se investigó anualmente en junio, desde 1982; Ibagué y Montería, se investigaron anualmente en diciembre, desde 1983.
Cada trimestre de la ENH corresponde a una etapa, hasta diciembre de 2000 se realizaron 110 etapas. El método de muestreo de esta encuesta se caracterizó por ser probabilístico, estratificado, multietápico, por conglomerados, autoponderado y por tener un diseño de muestra de corte transversal. Estas características son definidas en el Cuadro 1.
Además, la ENH está conformada por módulos que pueden ser de carácter permanente o transitorio. Los módulos permanentes son aquellos que aparecen en todas las etapas, tales como: identificación, características generales del individuo, fuerza de trabajo, ocupados, desocupados e inactivos. Los módulos transitorios son aquellos que aparecen esporádicamente y buscan capturar las características estructurales de la población, entre ellos se encuentran los módulos de salud, vivienda, informalidad, transporte y lugares de compra.
2.1 Módulo Fuerza de Trabajo: Conceptos
3. ENCUESTA CONTINUA DE HOGARES
Se viene realizando desde el año 2000 de manera continua, semana a semana. El tipo de muestreo de la ECH es probabilístico, de conglomerados desiguales, estratificado y trietápico (ver Cuadro 2). Su objetivo principal es obtener indicadores de la fuerza de trabajo, capturando sus variaciones estacionales, cíclicas y de tendencia en el trimestre. Al igual que la ENH está conformada por módulos permanentes y transitorios.
Dado que la principal característica de esta Encuesta es la recolección ininterrumpida a lo largo del año, se tiene que la semana de referencia es móvil y diferente para cada uno de los hogares encuestados, lo que depende de la fecha de la Encuesta.
El tamaño de la muestra en esta Encuesta es equivalente al de la ENH para el trimestre, sin embargo, en la ECH la muestra se distribuye uniformemente en cada una de las semanas que hacen parte del trimestre. En la ECH es posible hacer estimaciones con los siguientes niveles de desagregación geográfica: indicadores mensuales representativos del mercado laboral para el conjunto de grandes ciudades y total nacional; bimestrales para grupos de grandes ciudades; trimestrales por ciudad, y para el total del país por zona (Cabecera - Resto); semestrales por ciudad, grandes regiones y zona; y, anuales por ciudad, por región y zona, y por departamento. Lo anterior implica que a medida que aumenta el tamaño de muestra acumulado (semana, mes, trimestre) el error de dichos indicadores es menor.
3.1 Módulo Fuerza de Trabajo: Nuevos conceptos
4. DIFERENCIAS EN LAS ENCUESTAS DE HOGARES: ANTES Y AHORA
Entre 1970 y el 2000 se realizó la ENH y actualmente se aplica la ECH que se viene realizando desde el año 2000. En las dos Encuestas el módulo fuerza de trabajo se caracteriza por mostrar flujos de población que permiten distinguir entre ocupados, desocupados e inactivos.
Sin embargo, existen tres importantes diferencias entre la ENH y la ECH. La primera, el objetivo para el cual se diseña. La ENH tenía como propósito hacer estimaciones ínter-censales sobre demografía y caracterizar las condiciones socioeconómicas de los hogares, mientras que ahora la ECH tiene como objetivo principal obtener indicadores de la fuerza de trabajo. La segunda, varían algunas de las definiciones que permiten identificar las poblaciones objetivo (ocupados y desocupados) de la fuerza de trabajo. En la ENH no se tenían en cuenta los TFSR entre una y catorce horas a la semana, ni el criterio de disponibilidad para empezar a trabajar ni las razones de desaliento que incorpora la ECH. La tercera diferencia se presenta en el sistema de recolección. La ENH se realizaba cada trimestre durante dos semanas, mientras que la ECH se realiza en forma ininterrumpida, cada semana del año, generando un periodo de referencia móvil y diferente para cada uno de los hogares encuestados. Estas dos últimas diferencias pueden catalogarse como cambios metodológicos.
En relación con el primer aspecto metodológico, es posible afirmar que la modificación de algunas de las preguntas del módulo fuerza de trabajo influyeron principalmente en la medición de la población ocupada y desocupada. La pregunta que modifica la definición de ocupados es la referente a los TFSR (indirectamente reduce los desocupados), ya que la ENH sólo incluía entre los ocupados aquellos que laboraran más de quince horas semanales, mientras que ahora en la ECH se consideran como ocupados a los TFSR que trabajan mínimo una hora a la semana. Para adoptar este cambio se presentaron varias modificaciones en la pregunta que captura los TFSR, por ejemplo:
Los anteriores cambios tenían como objetivo unificar el rango de horas (una hora o más) que una persona debe trabajar a la semana para clasificarse como ocupado, independientemente de si es o no remunerado. En consecuencia, se produce un desplazamiento de Población Económicamente Inactiva (PEI) a la PEA y de los desempleados a los ocupados genera un incremento en la población ocupada.
El cambio en la medición de los desocupados se da por las recomendaciones aprobadas en las resoluciones de la OIT desde 1982 (CIET, 1982), principalmente en los siguientes puntos:
De acuerdo con lo anterior, se exige incluir la disponibilidad para empezar a trabajar en la semana de referencia, modificando la definición del desempleo abierto. Esto se resume en el cuadro 3.
Para caracterizar el desempleo oculto, ahora una persona debe cumplir las siguientes condiciones:
Las razones válidas de desaliento según el DANE son: 1) No hay trabajo disponible en la ciudad; 2) Está esperando a que lo llamen; 3) No sabe cómo buscar trabajo; 4) Está cansado de buscar trabajo; 5) No encuentra trabajo en su oficio o profesión; 6) Está esperando la temporada alta; 7) Carece de la experiencia necesaria; 8) No tiene recursos para instalar un negocio y 9) Los empleadores lo consideran muy joven o muy viejo. Las preguntas que se introducen para la nueva definición de los desocupados son:
La medición del desempleo oculto se resume en el Cuadro 4.
Estos cambios generan un desplazamiento de la PEA a la PEI lo cual disminuye la población desempleada. Dado lo anterior, la nueva estructura de la Encuesta de Hogares, en cuanto al módulo de fuerza de trabajo, se presenta en la Figura 1 (Se recomienda que para una mayor comprensión de la figura se revise paralelamente el Anexo 1).
Para mostrar la estructura de la PET y con ello los flujos entre la PEA y la PEI, se tomó la ECH3 del mes de julio de 2002 (tercer trimestre). Este periodo fue escogido por la consistencia que presentan las poblaciones (ocupados, desocupados, PEI y PEA) publicadas por el DANE con respecto a las nuevas definiciones. Esta característica no se encuentra en los primeros meses de la ECH y será ampliada en la siguiente sección.
La Figura 1 muestra que la PET está compuesta por todas aquellas personas que responden al módulo fuerza de trabajo. En primera instancia se quiere clasificar a los individuos de acuerdo con su actividad principal, para ello se utiliza la variable OCUSP. Si el encuestado responde la opción 1 (está trabajando) el individuo queda clasificado como ocupado. Si escoge la opción 6 (incapacitado permanentemente para trabajar) la persona es clasificada como inactivo. Las opciones 2 a 5 continúan el flujo.
Las variables TRAHORA, ACTDIF y TRANEFA definen el resto de la población ocupada cuando el encuestado escoge la opción 1. Cabe destacar que el flujo generado por TRANEFA, incluye a los nuevos ocupados que produjo el cambio metodológico en la definición de ocupados para la ECH. TRANEFA opción 1 corresponde a los TFSR de una hora o más.
A partir de ULTMESDI se define el resto de la población inactiva y la desocupada, principalmente se toman en cuenta los siguientes criterios: i) la disponibilidad para empezar a trabajar, ii) haber hecho diligencias después de su último empleo o en el último año y iii) las razones por las cuales no se hicieron diligencias. El primer flujo de desocupados se define por el grupo de personas que afirma haber hecho diligencias para conseguir trabajo o instalar un negocio y estar disponible la semana de referencia para empezar a trabajar (opción 1 de ULTMESDI y DISPSEM). Aquellas personas que no estaban disponibles para empezar a trabajar, a pesar de haber hecho diligencias en las últimas cuatro semanas, anteriormente formaban parte de la población que experimentaba desempleo abierto y ahora son consideradas inactivas.
Si el encuestado dice no haber hecho diligencias en las últimas cuatro semanas debe manifestar su deseo por conseguir un trabajo o instalar un negocio (DESCONT) para seguir en el flujo, de lo contrario se le considera inactivo. Cuando se continúa en el flujo la persona debe indicar la razón por la cual no hizo diligencias en las últimas cuatro semanas (NODILITR). Básicamente, existen tres posibles respuestas. La primera es afirmar que ya encontró trabajo (opción 1) e inmediatamente revelar su disponibilidad para empezar a trabajar. Nuevamente, si el individuo afirma estar disponible es clasificado como desocupado, de lo contrario se le considera inactivo. La segunda es responder una razón válida de desaliento (opciones 2 a 10), lo que implica continuar en el flujo. La tercera es manifestar una razón no válida de desaliento (opciones 11 a 15), lo que conduce a desplazar esta persona, que anteriormente pertenecía a la población en desempleo oculto, hacia la población inactiva. Entre las razones no válidas de desaliento se encuentran: 1) se considera muy joven o muy viejo; 2) responsabilidades familiares; 3) problemas de salud; 4) está estudiando; 5) otro, cuál.
Del grupo de personas que continúan en el flujo, hay dos posibles caminos.
El primero es afirmar que durante los últimos doce meses trabajó por lo menos dos semanas consecutivas (ULANOTDS), que después de ese trabajo hizo alguna diligencia para conseguir empleo o instalar un negocio (ULTEMDIL) y que estaba disponible o no para empezar a trabajar. Si estaba disponible es desocupado, de lo contrario es inactivo. Nuevamente, la no disponibilidad provoca un desplazamiento del desempleo oculto hacia la inactividad. El segundo camino lo constituyen las personas que durante los últimos doce meses no trabajaron por lo menos dos semanas consecutivas (ULANOTDS opción 2), pero en este mismo periodo habían hecho diligencias para conseguir empleo o instalar un negocio (DIULTANO) y además estaban disponibles para empezar a trabajar en la semana de referencia, estas personas son consideradas desocupadas, y de no estar disponibles son clasificadas como inactivos.
A diferencia de la ENH, la ECH exige que para que una persona sea considerada como desocupada debe haber hecho alguna diligencia para conseguir un trabajo o instalar un negocio en los últimos doce meses. Esto lo muestran las variables ULANOTDS junto con ULTEMDIL y DIULTANO. Las variables a destacar de la Figura 1 son TRANEFA, NODILITR y DISPSEM, ya que son las que determinan las diferencias entre los flujos de las Encuestas de Hogares en el módulo fuerza de trabajo.
5. EMPALME DE LA TASA DE DESEMPLEO 1985-2003
En esta sección se presenta la metodología de empalme de la serie Tasa de Desempleo (TD) a siete Áreas Metropolitanas, se realiza una evaluación del empalme entre las series TD no empalmadas y la serie empalmada, así como una comparación de las mismas.
La tasa de desempleo es una de las variables más importantes en el análisis del mercado laboral, dado que contiene componentes tanto de oferta como de demanda, su evolución temporal refleja fuertemente el comportamiento de la economía, razón por la cual cambios en las encuestas de hogares, que proporcionan la información requerida para su cálculo, inciden fuertemente en los análisis que se hagan a partir de la misma. El paso de la ENH a la ECH tiene asociados cambios metodológicos que alteran la evolución de la tasa de desempleo, siendo necesaria una propuesta de empalme para analizarla.
Los dos cambios metodológicos son: el cambio en el sistema de recolección y la nueva definición de la PEA (ocupados y desocupados). Para hacer compatibales los indicadores que se obtienen a partir de las dos Encuestas de Hogares, Suárez y Buriticá (2004) proponen un empalme basado en la confstrucción de un factor de corrección para cada uno de estos cambios. La metodología de empalme presentada en este artículo se basará en estos autores.
Los primeros intentos de empalme de los indicadores del mercado laboral han sido propuestos por Lasso (2002) y Suárez y Buriticá (2004). Lasso, considera que se deben realizar tres ajustes a estos indicadores: el primero, por la modificación del módulo de fuerza de trabajo, el segundo por la estacionalidad que permite capturar la nueva encuesta y por último una corrección por el proceso de ajuste del nuevo módulo de fuerza de trabajo de la ECH. Para realizar estos ajustes, el autor propone dos modelos jerárquicos de probabilidad PROBIT con "distribución logística", uno para estimar el nuevo flujo de ocupados y otro para el de inactivos. En la estimación de estos modelos tomó como variables independientes las características generales de la persona, del jefe de hogar y del cónyuge y por último del hogar (ciudad de residencia, estrato, número de hijos, etc.). Para capturar el efecto estacional, el autor incluye en los modelos descritos una variable dummy de los meses que hacen parte del trimestre. Lasso (2002) afirma que como los primeros trimestres del año 2000 fueron de muchas pruebas que generaron variaciones en el módulo de fuerza de trabajo, utiliza para el empalme la ECH del último trimestre de 2000 y los tres primeros de 2001. Esta metodología, según el autor, permite la corrección de los indicadores laborales de forma desagregada por variables demográficas, sociales y económicas contenidas en la encuesta.
La metodología desarrollada por Lasso (2002) podría presentar algunos inconvenientes debido a que estima las poblaciones que fueron reclasificadas en la ECH: los TFSR de menos de quince horas como ocupados y los desocupados que ahora son inactivos. Este autor afirma que el DANE sacó mucha más población desempleada en los tres primeros trimestres del año 2000 y a partir de allí y hasta el tercer trimestre de 2001 los niveles se estabilizan, este comportamiento se mantiene en el 2002. Sin embargo, hay que subrayar que las ECH a partir del segundo trimestre de 2001 no permiten capturar esas nuevas poblaciones exactamente. Por ejemplo, en este trimestre la variable TRASEMF (ver Anexo 1), que permite distinguir los TFSR de menos de quince horas a la semana, no se encuentra en la encuesta. Asimismo, la variable NODILITR opciones 11 a 15 (razones no válidas de desaliento), no permite determinar los nuevos inactivos, como se ampliará en el siguiente punto. Así, las estimaciones de Lasso se basan en unas poblaciones que no pueden ser obtenidas en el segundo y tercer trimestre de 2001.
Entonces para el objetivo de calcular las nuevas poblaciones, dado que el DANE dejó la posibilidad de hacerlo sólo a partir de las ECH del año 2000, no resulta adecuado considerar un periodo diferente a éste para el empalme.
Suárez y Buriticá (2004), proponen el cálculo de un factor de corrección que tiene dos componentes: uno que recoge el cambio en la definición y otro el cambio en el sistema de recolección. Estos autores, al igual que Lasso (2002) desarrollan una propuesta de empalme de adelante hacia atrás, es decir, corrigen las observaciones trimestrales de la TD anteriores al 2000 y mantienen las subsiguientes provenientes de la ECH.
Hay que anotar un aspecto importante sobre las metodologías de empalme mencionadas y es que ambas proponen hacer compatibles los cambios metodológicos de las Encuestas de Hogares empalmando las series de adelante hacia atrás. Al respecto, aunque Lasso (2002) señala que una segunda forma de empalme sería la corrección de las ECH de 2000 hacia adelante, es de resaltar que esta forma de homogeneizar los indicadores laborales implica por un lado perder algunas de las ventajas que ofrece la nueva encuesta, y por otro llevaría a que se tenga que replicar el proceso cada vez que se haga una ECH. Las principales ventajas metodológicas de la ECH son: i) captar integralmente en el tiempo, el comportamiento de las variables de la fuerza de trabajo, al igual que sus tendencias y sus variaciones cíclicas y estacionales; ii) permitir reducir el periodo de las estimaciones para el mercado laboral colombiano, por ejemplo a periodos mensuales o bimensuales, guardando cuidado con la significancia estadística de las estimaciones; iii) abrir la posibilidad de plantear esquemas de traslape y rotación de la muestra (panel), lo cual enriquece la encuesta porque posibilita el estudio de los indicadores del mercado laboral como flujos o cambios en el tiempo.
A continuación se desarrolla la metodología de empalme de la TD nacional a siete Áreas Metropolitanas, de adelante hacia atrás, siguiendo a Suárez y Buriticá (2004).
5.1 Factor de corrección por cambios en la definición
Esta corrección se realiza dado que se producen unos desplazamientos de personas al interior de la PET, por las nuevas definiciones de la población ocupada y desocupada que propone el DANE. Dichos desplazamientos sólo pueden ser estimados en la ECH del año 2000, ya que en ella se encuentran preguntas adicionales con respecto al resto de Encuestas. Para constatar lo anterior se hizo una comparación de la ECH de los años 2000 y 2002 para el tercer trimestre.
El efecto de los nuevos ocupados se captura a través de la variable TRASEMF, la cual se encuentra únicamente en la ECH del 2000 (cuatro trimestres) y el primer trimestre del 2001, tal y como se muestra en la Figura 2. En ella se puede ver que aquellos que son TFSR (TRANEFA opción 1) deben indicar el rango de horas trabajadas en ese negocio familiar (TRASEMF). Luego, los TFSR se pueden distinguir entre los que trabajan por lo menos 15 horas y los nuevos ocupados, que son aquellos que laboran entre 1 y 14 horas. Comparando con el 2002, se aprecia la imposibilidad de distinguir los nuevos ocupados debido a la inexistencia de la variable TRASEMF. Para el tercer trimestre, el total de nuevos ocupados (TRASEMF opción 1) es 44.161 personas, población que no puede ser calculada en el 2002.
Por otro lado, el efecto sobre los desocupados depende de las variables DISPSEM y NODILITR. En el 2002, una vez que el encuestado debe responder la razón por la cual no hizo diligencias en las últimas cuatro semanas (NODILITR), si éste escoge una razón no válida (opciones 11 a 15), inmediatamente se considera como inactivo. Sin embargo, en el tercer trimestre del 2000, el encuestado que responde una razón no válida de desaliento puede ser caracterizado como desocupado o inactivo con respecto a la definición de la ENH, determinando la proporción de población que antes era considerada desocupada y ahora inactiva en la ECH.
La Figura 2 ilustra el efecto anteriormente descrito. Una vez el encuestado responde NODILITR, opciones 5 y 9 a 11 (razones no válidas de desaliento), según las definiciones de la ECH esa persona es considerada inactiva, no obstante, en esta Encuesta el flujo continúa facilitando la identificación de las personas que hicieron diligencias en el último año (ULTEMDIL opción 1 ó DIULTANO opción 1), de esta manera, se puede distinguir los desocupados e inactivos con las definiciones anteriores.
Es de resaltar que se hallan algunas inconsistencias en los flujos del módulo de fuerza de trabajo. Por ejemplo, en el tercer trimestre, NODILITR opciones 5 y 9 a 11, la presencia de DESOCUP* indica la existencia de población, que a pesar de cumplir con la condición de inactiva, es clasificada como desocupada por el DANE en la publicación de sus estadísticas.
A su vez NODILITR, opciones 2 a 4 y 6 a 8, contiene población que cumple con la condición de desocupados, pero el DANE dentro de sus estadísticas la considera inactiva (DESOCUP*, flujo T2). Existen inconsistencias en cada uno de los trimestres que se pueden apreciar en el Anexo 2.
En conclusión, se escogieron los trimestres del año 2000 para hacer la corrección de la serie TD, debido a que las Encuestas de este año permiten discriminar los desempleados que efectivamente son excluidos por los cambios en definición, es decir, aquellas personas que cumplían con la definición de desocupados de la ENH, pero que no hicieron diligencias para conseguir empleo la semana pasada y no tenían una razón válida para no haberlas hecho. Por ejemplo, en el tercer trimestre de 2000, los desocupados (según ENH) que son desplazados a inactivos por no tener una razón válida de desaliento son 112.580 personas, mientras, si se hubiese tenido en cuenta únicamente el hecho de no tener una razón válida de desaliento, la población considerada como inactiva sería de 693.085 personas. En el 2002 sólo se puede hallar la población que no tiene una razón válida de desaliento, sin poder caracterizarla con respecto a la definición de la ENH, por ejemplo, en el tercer trimestre esta población es de 670.357 personas, donde no se puede discriminar cuántas de esas personas son los nuevos inactivos.
Ahora, para el factor de corrección por definición se calcula la población por trimestre desplazada ante los cambios en la definición. Como ya se ha mencionado, existen dos efectos: un incremento en los ocupados y una disminución en los desocupados, lo cual genera cambios en direcciones contrarias sobre la PEA. Sin embargo, el efecto predominante es una reducción del tamaño de la PEA.
La construcción del factor implica descomponer el numerador de la TD (desocupados con la ECH) en los desocupados según la definición de la ENH, menos los desocupados desplazados a inactivos por el cambio en definición de la ECH (T2). Así, se obtiene una TD que tiene dos componentes, el primero es una TD calculada a partir de los desocupados según la definición de la ENH; el segundo, es la TD de las personas que dejaron de ser desocupadas según la nueva definición. Por lo tanto, el segundo componente muestra la variación de la TD por el cambio en definición. De esta manera, el factor busca descontar esta variación a las TD calculadas a partir de la ENH trimestre a trimestre,lo cual implica una corrección de la TD hacia atrás.
Donde: FDTD = factor de corrección por definición para la tasa de desempleo y T2 = población desempleada según la ENH que con la nueva efinición pasó a ser inactiva.
En la Figura 2 se aprecian los diferentes flujos que dan origen a T2. La sumatoria de dichos flujos corresponde al valor que se reemplaza en la ecuación (1) para obtener el FDTD. Los resultados estimados para la variable T2 y el factor se realizaron utilizando el paquete estadístico SAS y se resumen en el Cuadro 5.
Como se puede observar, el FDTD para cada uno de los trimestres es diferente de uno. En promedio la disminución de la TD de la ENH con respecto a la ECH es de dos puntos porcentuales, es decir, para corregir la serie por el cambio en definición debe tomarse en promedio el 98% del valor que tomaba en la ENH, lo que deja en evidencia que la ECH reduce la población desocupada.
5.2 Factor de corrección por cambios en la recolección
En el nuevo sistema de recolección, aunque la muestra tiene el mismo tamaño para el trimestre, con respecto a la ENH, ésta se distribuye exactamente en cada una de las semanas que componen este periodo, logrando capturar las variaciones estacionales que se presentan al interior de cada trimestre. Por lo tanto, es necesario determinar el efecto de estas variaciones en la TD.
Para examinar esta estacionalidad resulta adecuado trabajar los trimestres por separado. El primer paso es observar la variación de la serie de interés para cada trimestre, tomando las trece observaciones de la TD, lo cual se resume en el Cuadro 6.
Como se observa, la mayor dispersión la presentan los trimestres 1 y 3, tal como lo demuestran las medidas de rango y desviación, mientras que el trimestre con menor dispersión es el segundo.
Para capturar el efecto mencionado, se utilizó un modelo autorregresivo de orden 1, sin intercepto:
Donde: Φ es una constante, yt es la serie y εt es un ruido blanco.
La ecuación (2) inicia en t = 0 y y0 puede ser cualquier variable aleatoria o una constante, cuya distribución es fija e independiente del tamaño de la muestra T (Phillips y Perron, 1988). Estas condiciones hacen de (2) un modelo viable de aplicar a la serie de datos semanal de la TD.
Para calcular el factor se parte de la definición de la TD, donde tanto los desocupados como la PEA del trimestre resultan de la acumulación de muestra semana a semana. Por lo tanto, los desempleados y la PEA de la semana son una proporción con respecto a los del trimestre.
Donde t=1,2,…,13. Dt son los desempleados de la semana t y PEAt es la población económicamente activa de la semana t. Así, se calcula un modelo como (2) para el numerador y el denominador de la ecuación (3). Los Φ obtenidos tanto para los desocupados como para la PEA se muestran en el Cuadro 7.
Estos valores permiten ponderar el efecto de la recolección semana a semana en la población desocupada o económicamente activa del trimestre.
Donde FRTD es el factor de corrección por recolección para la tasa de desempleo.
La ecuación (4) muestra que el efecto autorregresivo va decayendo al interior del trimestre. Así, el factor de corrección por recolección se muestra en el Cuadro 8.
Al igual que en el caso anterior, el factor es diferente de 1, lo que demuestra que existe un efecto por el cambio en el sistema de recolección, que a su vez genera un efecto estacional al interior del trimestre. En promedio, FRTD es 0.982 y el trimestre con mayor variación es el tercero, con 8 puntos porcentuales.
Finalmente, el factor de corrección definitivo de la TD (FTD) resulta de la multiplicación de FRTD con FDTD. (Ver Cuadro 9).
El empalme se realiza de adelante hacia atrás, multiplicando el FTD, calculado trimestralmente, a los respectivos trimestres de la TD de la ENH. Por ejemplo, para el primer trimestre el FTD es 0.9864 y este valor es el que debe multiplicarse a todos los primeros trimestres de la TD con la ENH.
5.3 Serie empalmada TD 1985-2003
El Gráfico 1, ilustra la evolución de la TD calculada para el periodo 1985-2003 con la metodología de la ENH (marzo de 1985 y diciembre de 2000) y la de la ECH (marzo de 2000 y diciembre de 2003). En el gráfico se observa que en el año 2000, cuando se estimó la TD con ambas encuestas, hay una ruptura en la continuidad de la serie, pues la TD calculada a partir de la ECH es menor a su equivalente con la ENH.
Los resultados del empalme de la serie TD a siete áreas metropolitanas pueden verse en el Gráfico 2 y en el listado 1 del Anexo estadístico. La serie TD, calculada a partir de la ENH disminuye en promedio 0.46 puntos porcentuales, al aplicar el factor de corrección definitivo. Este resultado es aproximadamente igual al que reportan Suárez y Buriticá (2004),quienes encuentran que dicha disminución es de 0.5 puntos porcentuales para la TD a trece áreas metropolitanas, pero difiere del 1.2 encontrado por Lasso (2002) en la misma tasa a siete áreas metropolitanas.
En el Gráfico 2 se aprecia que la serie corregida tiene un menor nivel que la serie proveniente de la ENH, aunque conserva la tendencia y los ciclos que esta última presenta.
Luego, al calcular el coeficiente de desigualdad de Theil se obtiene un valor cercano a cero, indicando un muy buen ajuste entre las series, así mismo, las proporciones de sesgo y de varianza también son cercanas a cero indicando que la media de la serie empalmada actualiza de muy buena forma la media de la serie no empalmada y sus errores son muy similares, es decir, los errores en el empalme son debidos a comportamientos no sistemáticos en los datos. (Ver cuadro 10).
6. CONCLUSIONES
El cambio de metodología en las Encuestas de Hogares de Colombia necesariamente lleva a considerar dos correcciones para el cálculo de los indicadores del mercado laboral. La primera, provocada por los cambios en la definición de la PEA (ocupados y desocupados) y la segunda, por el cambio en el sistema de recolección. Ambos cambios justifican llevar a cabo una metodología de empalme que haga comparables los indicadores obtenidos con la ENH y la ECH, ya que es evidente que existe una ruptura en ellos.
La metodología de empalme desarrollada en el artículo se realizó de adelante hacia atrás, es decir se corrigió la serie de la TD a siete áreas Metropolitanas que se calculaba con la ENH. Como los nuevos cambios introducidos en la definición de los desocupados hacen que se desplace parte de esta población hacia inactivos, se nota una caída de la TD que se calcula con la ECH. Simultáneamente, como también se produce un aumento de los ocupados por la inclusión de los TFSR de menos de 15 horas a la semana, se da un doble efecto en la PEA en sentido contrario, por un lado una disminución ante el desplazamiento de desocupados a la PEI y por otro lado un aumento por los nuevos ocupados, sin embargo es de resaltar que el primer efecto predomina sobre el segundo, por lo cual se podría afirmar que el efecto neto es una disminución de la PEA
Se tiene que la TD calculada con la ECH presenta una caída frente a la de la ENH, pues tanto el numerador (desempleados) como el denominador (PEA) de este indicador disminuyeron, siendo el efecto sobre el numerador el que domina. Por lo tanto,una vez se aplicó la metodología de empalme, se observa la caída de la TD calculada con la ENH en aproximadamente 0.46 puntos porcentuales, resultado similar al de Suárez y Buriticá (2004) quienes encuentran que la reducción en la TD es de 0.5 puntos porcentuales. Quizás la diferencia de resultados se deba a que estos autores calcularon el factor de corrección de la TD a trece Áreas Metropolitanas y para el periodo 1996-2000. No obstante, la caída en la TD encontrada en este trabajo difiere significativamente del resultado de Lasso (2002), quien también realiza el empalme de la TD a siete Áreas Metropolitanas, encontrando que la disminución es de 1.2 puntos porcentuales.
La serie empalmada de la TD conserva la tendencia de largo plazo y guarda los mismos ciclos que la serie inicial, aunque exhibe una disminución de su nivel. Este resultado refuta la afirmación de Lasso (2002) acerca de que esta metodología tiene la debilidad de producir una serie corregida no coherente con el ciclo observado o la estacionalidad de la serie original.
Un aspecto importante en la realización del empalme de adelante hacia atrás es la utilización de las ECH del año 2000 y las del primer trimestre del 2001, pues el DANE las diseñó de tal forma que permitieran determinar cuáles son los TFSR de menos de 15 horas a la semana y los nuevos inactivos, gracias a que en dichas encuestas hay preguntas adicionales que no se encuentran en el resto de las ECH. Lo anterior conlleva que metodologías que realicen estimaciones de estas poblaciones en lugar de calcularlas sean menos exactas, porque pueden conducir un mayor margen de error.
Es importante resaltar que la disminución de la TD experimentada a partir del primer trimestre del 2000 está fuertemente influenciada por el cambio en la metodología de las Encuestas de Hogares y en menor medida por las políticas del gobierno.
Notas al Pié de Página
*Este artículo es producto del proyecto de investigación "Dinámica del desempleo en Colombia: Histéresis o Cambio Estructural, 1985-2003" , financiado por Colciencias y adscrito al CIDSE por el contrato No.249.
*Se agradecen los comentarios de los profesores José Ignacio Uribe, Carlos Humberto Ortiz y demás integrantes del grupo, a la versión preliminar del artículo. Se agradece de manera especial la eficiente participación de los asistentes de investigación: Olga Lucía Briñes, Chistiam Manuel Posso y Yanira Marcela Oviedo; sin su colaboración no hubiese sido posible culminar este proyecto. Cualquier error u omisión es responsabilidad de los autores.
1Sistema de recolección continuo.
2Las razones válidas de desaliento están relacionadas con la creencia de la persona de que no podrá conseguir trabajo o por las deficiencias del mercado.
3Los formularios de la ECH tienen una frecuencia mensual y no cambian en el trimestre.
Bibliografía
1. CIET. (1982). Resolución sobre estadísticas de la población económicamente activa, del empleo, del desempleo y del subempleo.Decimotercera Conferencia Internacional de Estadísticos del Trabajo. Consultado: Octubre de 2005 , en http://www.ilo.org/public/spanish/bureau/stat/res/index.htm
2. Departamneto Administrativo Nacional de Estradística -DANE-. (1998). Metodología de la Encuesta Nacional del Hogares. Bogotá: Autor.
3. Departamneto Administrativo Nacional de Estradística -DANE-. (2001). Metodología de la Encuesta Continua de Hogares. Bogotá: Autor.
4. Departamneto Nacional de Planeación -DNP-. (1995). Guía del Usuario del Banco de Fuentes Primarias, BFP. Unidad de Desarrollo Social, División de Indicadores y Orientación del Gasto Social. Bogotá: Autor.
5. Lasso, F. (2002). Nueva metodología de Encuesta de Hogares. ¿Más o menos desempleados?. Bogotá: DNP.(Archivos de Economía, Documento 213)
6. Phillips, P., & Perron, P. (1988). Testing for Unit Root in Time Series Regression. Biometrika, 75 (2), 335-346.
7. Suárez, álvaro & Buriticá. (2004). Empalme de las series de tasa de desempleo, ocupación y participación entre la encuesta transversal y la continua. Bogotá: DANE.