c26262-ocr

Download C26262-OCR

If you can't read please download the document

Upload: christian-tucto-ramos

Post on 15-Nov-2015

18 views

Category:

Documents


0 download

DESCRIPTION

demanda

TRANSCRIPT

  • recordar, estaba medido en centavos. Por lo tanto, de acuerdo con nuestras estimaciones de regresin, un incremento de 100 centavos (o $1.00) dar como resultado una disminu-cin en la cantidad demandada de pizza de 8.8 (100 X incremento en el costo de colegiatura de una unidad (en este caso$ 1,000) da como resultado un incremento en la cantidad demandada de pizza de 0.138. Estos cambios y los asociados con las modifi-caciones en el precio de las bebidas gaseosas y en la ubicacin del campus universitario son sustanciales o intrascendentes?

    Los investigadores que constantemente estiman la demanda para un bien o servicio en particular tendrn una idea exacta de si las magnitudes de los coeficientes estimados en un estudio especfico son altas o bajas en relacin con sus otros trabajos. Pero si no existen otros estudios disponibles para comparar, entonces los investigadores pueden al menos usar las elasticidades de la demanda con el fin de calibrar el impacto relativo que las varia-bles explicativas tienen en la cantidad demandada.

    A partir de nuestra explicacin de elasticidad en el captulo 4, usted puede ver que los resultados del anlisis de regresin son ideales para la estimacin de la elasticida9-

    Recuerde que la frmula para calcular la elasticidad punto es

    dO X :::.:

    dX Q

    donde Q = cantidad demandada y X = cualquier variable que afecte Q (por ejemplo, pre-cio o ingreso). En el caso de nuestra demanda estimada de pizza, supongamos que las va-riables explicativas tienen los siguientes valores:

    Precio de pizza (X1) = 100 ($1.00) Costo anual de la colegiatura universitaria (X2) = 14 ($14,000) Precio de una bebida gaseosa (X3) = 110 ($1.10) Ubicacin del campus (X4) =rea urbana (X4 = 1)

    Entonces, al insertar estos valores dentro de la ecuacin estimada resulta

    Y= 26.67 0.088 {100) + 0.138 (14) 0.076 (110) 0.544 (1)

    10.898 o 11 (redondeado a la fraccin ms cercana)

    Para calcular las elasticidades punto para cada una de las variables considerando los valores precedentes, simplemente insertamos los nmeros apropiados dentro de la fr-mula de elasticidad. La derivada parcial de Y respecto de los cambios en cada una de las variables (oY/oX) es simplemente el coeficiente estimado de cada una de las variables.

    Elasticidad 100

    . ---o.o88 x '= ---o.so7

    14 Elasticidad del costo de la colegiatura: O. 138 x 16:898 " 0.177

    11 o Elasticidad precio cruzada: 0.076 x 10:898 = 0.767

    Con estas estimaciones, podemos decir que la demanda para pizza es algo inelstica en el precio y que hay algn grado de elasticidad precio cruzada entre las bebidas gaseo-sas y la pizza. A juzgar por el coeficiente ms bien bajo de 0.177, el costo de la colegiatura no parece tener un gran impacto en la demanda de pizza.

    Captulo 5 Estimacin de )a demanda 173

  • 174

    acin de n Nuestros resultados de regresin estn basados en una muestra de universidades esta-dounidenses. Cmo confiar que estos resultados reflejan en verdad a la poblacin de los estudiantes de licenciatura? La prueba bsica de la significancia estadstica de cada uno de los coeficientes estimados de regresin se llama prueba-t. Esencialmente, esta prueba se lleva a cabo mediante el cmputo del valor-t o estadstica-t para cada uno de los coefi-cientes estimados. Esto se hace mediante la divisin del coeficiente estimado entre su error estndar.3 Esto es:

    t .... ....

    Como es prctica comn en las presentaciones de resultados de regresin, los errores estndar en nuestra regresin de pizza se presentan entre parntesis bajo los coeficientes es-timados. Mediante la regla de 2, podemos decir que el coeficiente estimado es estadstica-mente significativo si el valor absoluto del coeficiente dividido entre _su error estndar es mayor que o igual a 2.4

    Es evidente a partir de la ecuacin de regresin precedente que X1 (precio de la piz-za) y X3 (precio de las bebidas gaseosas) son estadsticamente significativas debido a que los valores absolutos de sus estadsticas-t son 4.89 y 3.80, respectivamente. Las otras dos variables, x2 (colegiatura) y x4 (ubicacin), no son estadsticamente significativas debido a que los valores absolutos de sus estadsticas-t son menores que dos.

    Si el coeficiente estimado de una variable pasa la prueba-t, podemos estar confiados de que la variable verdaderamente tiene un impacto en la demanda. Si no pasa la prueba-t, entonces, con toda probabilidad, la variable no tiene verdaderamente un impacto para toda la poblacin de estudiantes universitarios. En otras palabras, los coeficientes de re-gresin son nmeros diferentes a cero simplemente debido a un evento fortuito en la muestra de estudiantes que tomamos a partir de la poblacin.

    En el anlisis estadstico, lo mejor que podemos esperar es estar muy seguros de que nuestros resultados muestrales verdaderamente reflejen la poblacin que representan. Sin embargo, nunca podemos estar absolutamente seguros. Por ello, los analistas estads-ticos fijan grados de incertidumbre. Como se explicar con mayor detalle ms adelante en este captulo, el usar la regla de 2 generalmente implica un nivel de 5% de significancia. En otras palabras, al declarar un coeficiente que aprueba la versin de la regla de 2 de la prueba-t como estadsticamente significativo, nos encontraremos abiertos a una posibili-dad de un 5% de probabilidad de que estemos equivocados.

    Otro indicador estadstico importante utilizado para evaluar los resultados de regresin es el coeficiente de determinacin o R2 Esta medida muestra el porcentaje de variacin en una variable dependiente que se explica por la variacin en todas las variables explicativas en la ecuacin de regresin. Esta medida puede ser tan baja como O (que indica que las varia-ciones en la variable dependiente no son explicadas en absoluto por la variacin en las variables explicativas) y tan alta como 1.0 (que indica que toda la variacin en la variable de-pendiente puede explicarse por las variables explicativas). Para los analistas estadsticos, cuanto ms cercano est R2 a 1.0, mayor ser el poder explicativo de la ecuacin de regresin.

    3En la siguiente ecuacin, el pequeo "sombrero" (acento circunflejo) sobre bes una notacin comnmente utilizada en el anlisis estadstico para denotar un valor estimado a partir de una muestra de datos. 4Se recuerda al lector que sta es slo una descripcin breve de la prueba-t. Para mayores detalles, vea la explicacin completa ms adelante en este captulo.

    Economa de empresa

  • En nuestra regresin de pizza, R2 = 0.717, esto significa que cerca del72% de la varia-cin en la demanda de pizza por los estudiantes de licenciatura puede explicarse por la variacin en el precio de la pizza, el costo de la colegiatura, el precio de una bebida gaseo-sa y la ubicacin del campus. Como se ver ms adelante en este captulo, R2 se incremen-ta al agregar ms variables independientes a la ecuacin de regresin. Por ello, muchos analistas prefieren utilizar la medicin que se ajuste al nmero de variables independien-tes utilizadas de tal forma que las ecuaciones con nmeros diferentes de variables inde-pendientes puedan compararse de una manera ms precisa. Esta medicin alternativa se denomina R2 ajustada. As, resulta que la R2 ajustada para esta ecuacin es 0.67. Otra prueba, llamada prueba-F, se utiliza muchas veces en conjuncin con la R2 Los lectores interesados podrn remitirse a "La prueba-F", ms adelante en este captulo para una explicacin de esta prueba.

    Repaso de resu

    lisis

    Ahora revisaremos todos los pasos clave explicados hasta ahora en el anlisis de regre-sin de una ecuacin de demanda mediante la siguiente ecuacin:

    Q "' 70 ., 10P l- 4Px + 501

    ( ':' v) errores m a dos n entre

    El signo negativo para la variable P indica una relacin inversa entre el precio y la cantidad demandada de un producto. Un incremento unitario en el precio (1 centavo) causar que la cantidad disminuya en 10 unida-des. Una disminucin en el precio causar un incremento en la cantidad de 10 unidades. As por ejemplo, si el precio disminuyera en $1.00, la cantidad se incrementara en 1,000 uni-dades.

    El signo positivo para la variable P x indica una relacin directa entre el precio de un producto relacionado y la cantidad demandada. Esto indica que el producto relacionado es un sustituto del producto en cuestin. Por ejemplo, si el precio del producto relaciona-do cambia en una unidad (por ejemplo, 1 centavo), entonces la cantidad demandada del producto en cuestin cambiar en 4 unidades en la misma direccin.

    El signo positivo para la variable I indica que el producto es normal o quiz superior, dependiendo de la magnitud del coeficiente de elasticidad ingreso. Un cambio unitario en el ingreso per cpita ($1,000) causar que la cantidad cambie en 50 unidades en la misma direccin.

    5 de demanda 175

  • Paso Clculo de coeficientes de elasticidad Para calcular los coeficientes de elasticidad, necesitamos asumir ciertos niveles de variables independientes P, P x e I. Digamos que son:

    P 100 (recuerde, esto es 100 centavos o $1.00)

    P = 1 (tambin en centavos) X

    25 representa $25,000)

    Al insertar estos valores dentro de la ecuacin previa resulta

    Q = 70 10(100) + 4(120) .. !. 50(25)

    Q .:. 800

    Ahora usamos la frmula para la elasticidad punto a fin de obtener los coeficientes de elasticidad. Recuerde que

    8Q X E ::::::

    " ox a Al utilizar esta frmula, obtenemos

    .. --1 o . ~g_g 800

    -- 1

    . .. 6

    25 E ::-.::50 1 800

    .::::. 1.56

    Determinacin significancia estadstica Mediante la "regla de 2" como una aproximacin al nivel .05 de significancia, podemos decir que P y P x son estadsticamente significativas debido a que sus valores t son mayores que 2 (por ejem-plo, 3.3 y 2, respectivamente). I no es estadsticamente significativa al nivel .05 debido a que su valor t es slo 1.67.

    Como una consideracin adicional, observamos que R2 de .47 indica que el47% de la variacin en la cantidad puede explicarse por las variaciones en las tres variables inde-pendientes P, P x e I. Aunque sta no es en realidad una indicacin de significancia esta-dstica, muestra el poder explicativo de la ecuacin de regresin. Para datos de corte transversal, este nivel R2 se interpreta como moderadamente alto.

    Implicaciones del anlisis de regresin para decisiones administrativas

    En nuestra experiencia, la "prueba del budn" en el mundo de los negocios de cualquier anlisis estadstico, incluso el anlisis de regresin, es el grado con el que estos resultados

    176 Economa de empresa

  • pueden ayudar a los directivos a tomar buenas decisiones. En nuestro ejemplo de pizza, los resultados indican que el precio de la pizza y el precio de su producto complementa-rio,la bebida gaseosa, son factores clave que influyen en la demanda de pizza. Sus coefi-cientes de elasticidad son menores que 1 y ambos coeficientes de las variables aprobaron la prueba-t. Qu significa esto para quienes estn en el negocio de la pizza? Primero, es-to significa que ellos pueden esperar que las disminuciones en el precio conduzcan hacia disminuciones en el ingreso, al permanecer otros factores constantes. Por lo tanto, proba-blemente no desearn tratar de bajar el precio en un esfuerzo por incrementar las ventas. Pero tratarn de bajar el precio de las bebidas gaseosas, con la anticipacin de que el precio ms bajo en las bebidas gaseosas atraer a la gente a comprar pizzas.

    En el anlisis estadstico muchas veces resulta tan importante encontrar qu es lo que no pasa la prueba-t como encontrar lo que s la pasa. En nuestro ejemplo, aprendimos que el costo de la colegiatura y la ubicacin no tenan impactos estadsticamente significativos en la demanda de pizza. Ms an, las magnitudes de sus coeficientes eran relativamente pequeas. Para los directores de las cadenas nacionales tales como Pizza Hut o Domino's, esto indicara que ellos no tendran que estar muy preocupados acerca del tipo de uni-versidad (privada o pblica) o de su ubicacin (urbana o rural) al decidir dnde abrir franquicias de pizza.

    Esperamos que este resumen sea suficiente para aquellos profesores y lectores que simplemente quieren una idea general de cmo se emplea el anlisis de regresin en el anlisis de negocios y en la toma de decisiones. Para una explicacin ms detallada, ha-br que continuar con el resto del captulo.

    A.NLISIS DE REGRESIN

    El propsito bsico del anlisis de regresin es el de estimar la relacin cuantitativa entre variables. El primer paso en este procedimiento estadstico es el de especificar el modelo de regresin (tambin llamado ecuacin de regresin). El segundo consiste en obtener datos acerca de las variables especificadas en el modelo. El tercero es el de estimar el impacto cuantitativo que cada una de las variables independientes tiene en la variable dependiente. El cuarto paso es el de probar la significancia estadstica de los resultados de regresin. Finalmente, los resultados del anlisis de regresin resultan tiles como mate-rial de apoyo en la elaboracin de polticas y en la toma de decisiones de negocios.

    El anlisis de regresin implica dos tipos bsicos de variables: la variable dependien-te y las variables independientes. Estas ltimas se conocen tambin como variables expli-cativas. Como indica su nombre, la variable dependiente es aquella cuyo valor depende del valor de alguna otra variable o variables. La variable dependiente es el foco central de cualquier estudio de regresin y es la variable que los investigadores tratan de explicar y predecir. En anlisis de regresin de la demanda, la variable dependiente es la cantidad demandada de un bien o servicio en particular. Si slo una variable independiente se em-plea en el anlisis, usamos el trmino regresin simple. Si est implicada ms de una variable independiente, usamos el trmino regresin mltiple. Como usted esperara, las variables in-dependientes ms comnmente empleadas en el anlisis de regresin de la demanda son el precio, precios de productos relacionados, gustos y preferencias, ingreso y nmero de com-pradores. Para propsitos de explicacin e ilustracin, es mucho ms fcil enfocamos en la regresin simple. Despus de que el modelo de regresin simple haya sido desarrollado y explicado, presentaremos el modelo de regresin mltiple.

    Captulo 5 Estimacin de la demanda 177

  • 178

    El modelo de regresin simple

    Nuestra explicacin de la regresin simple comienza con la expresin formal de la rela-cin que suponemos que existe entre la variable dependiente y la independiente. Esta re-lacin se expresa como la siguiente ecuacin matemtica:

    Y" a+ bX +u (5.1)

    donde Y= v

  • Y (galones) Y (galones)

    y= 0.05X y= 0.05X +u

    25 25

    20 20

    15 15

    10 10

    5 5

    100 200 300 400 500X (millas) 100 200 300 400 500X {millas)

    (a) (b)

    Figura 5.1 Modelo de consumo de gasolina

    De aqu que el trmino probabilstico se utilice para describir una ecuacin que contiene el elemento aleatorio u. Usted ver por qu es importante entender la naturaleza de un mo-delo probabilstico cuando lleguemos a la seccin donde se estudia la significancia esta-dstica de los resultados de regresin.

    Datos utilizados en el anlisis de regresin

    Los datos utilizados en el anlisis de regresin estn divididos en dos tipos: de corte trans-versal y de series de tiempo. Los datos de corte transversal proporcionan informacin de una variable en un punto determinado en el tiempo. Los diferentes valores de la variable re-presentan un corte cruzado de las observaciones de entidades tales como individuos, gru-pos de individuos y ubicaciones (ciudad, municipio, rea metropolitana, estado o pas). Los datos de series de tiempo proporcionan informacin de una entidad a lo largo del tiempo (por ejemplo: ingreso anual per cpita de un estado durante un periodo de 20 aos). Los ejemplos de pizza citados anteriormente implicaban datos de corte transversal, dado que la informacin estaba reunida en una porcin de individuos en las universidades en un pun-to determinado en el tiempo (en realidad, un periodo de una semana). La informacin ba-sada en series de tiempo puede implicar el seguimiento de las compras per cpita de pizza en una regin determinada del pas relativa a su precio durante un periodo. Por ejemplo, podramos buscar el consumo per cpita anual de pizza en Estados Unidos.

    Estimacin de la ecuacin de regresin La estimacin de la ecuacin de regresin implica una bsqueda de la mejor relacin li-neal entre la variable dependiente y la independiente. As, la ecuacin de regresin que buscamos para estimar se expresa como

    (5.2)

    Captulo 5 Estimacin de la demanda 179

  • 180

    y y

    X X

    ~) (b)

    Figura 5.2 Representaciones lineales de grficas de dispersin

    donde Y:;:;: variable dependiente X = variable independiente a = intercepcin de lnea con eje Y lJ = pendiente de la lrH:'a

    La intercepcin y la pendiente generalmente se denominan como parmetros o coefi-cientes de la ecuacin de regresin.

    La figura 5.2 muestra una grfica de dispersin de datos hipotticos para Y y X. Co-mo se indica en la parte a de esta figura, en la grfica de dispersin podra dibujarse cual-quier nmero de lneas para representar la relacin entre Y y X. En el anlisis de regresin la forma ms comn de estimar la relacin se llama mtodo de los mnimos cuadrados ordinarios (MCO).* En esencia, este mtodo requiere dibujar una lnea a travs de la dis-persin de puntos, de tal forma que la suma de las desviaciones cuadradas de cada uno de los puntos respecto a la lnea sea minimizada. Los mnimos cuadrados se muestran en la figura 5.2b. Una ilustracin del mtodo de los mnimos cuadrados se presenta en la figura 5.3.

    La estimacin real de la lnea de regresin es una cuestin relativamente simple, da-da la disponibilidad de computadoras y paquetes de software. Muchas calculadoras de mano contienen programas o teclas de funciones especiales para estimar las ecuaciones de regresin simple. Sin embargo, cuando se utiliza ms de una variable independiente (anlisis de regresin mltiple), se requiere del poder de procesamiento de una compu-tadora. En cualquier caso, quienes deseen revisar las frmulas para la estimacin de ecuaciones, as como las derivaciones matemticas de estas frmulas, pueden consultar un texto de estadstica o econometra. Mediante el mtodo de los mnimos cuadrados, llegamos a la lnea de regresin que se indica en la figura 5.2b.

    Aunque el mtodo de mnimos cuadrados proporciona una buena representacin li-neal de la dispersin de puntos, existe claramente una diferencia en el ajuste de las lneas de

    N.T. En ingls, Method of Ordinary Least Squares (OLS).

    Economa de empresa

  • y

    Figura 5.3 Minimizacin de la suma de

    X las desviaciones cuadradas

    mnimos cuadrados mostradas en las figuras 5.4a y b. Una simple observacin indica que la figura 5.4b representa un mejor ajuste de la lnea de regresin a travs de la dispersin de puntos. Esto se debe obviamente a la naturaleza de la dispersin de los puntos y no a la for-ma en que se construyeron estas lneas. Ambas lneas de regresin fueron dibujadas de forma que se cumpla el criterio de los mnimos cuadrados. Por tanto, sera til contar con alguna medicin de qu tan bien una lnea de regresin se ajusta a la dispersin de puntos.

    Figura 5.4 Lneas de regresin con diferentes ajustes a travs de los puntos de dispersin

    y y

    X X

    (a) (b)

    Captulo 5 Estimacin de la demanda 181

  • Co FICI N D DETE MINACIN: UNA MEDIDA D L PODER EXPLICATIVO DE LA CUACIN D REGRESIN

    STIMADA6

    182

    Para explicar el significado del coeficiente de determinacin, necesitamos introducir al-gunos conceptos y notaciones utilizados en los textos de estadstica y econometra. Siem-pre que se presentan los resultados de regresin basados en datos muestrales, se coloca un "sombrero" (acento circunflejo) sobre los valores estimados:

    (5.3)

    El sombrero sobre Y, a y b significa que sus valores son estimados mediante el em-pleo de un conjunto de datos muestrales. Un mtodo razonable para medir qu tan bien esta ecuacin de regresin estimada determina el valor de Y dado el valor de X, es com-parar los valores de Y con los valores reales de Y tomados en la muestra.

    La grfica de dispersin que aparece en la figura 5.5 ayudar a explicar este enfoque. La ecuacin (5.3) representa la lnea de regresin estimada a travs de la dispersin de pun-tos. Tomemos uno de estos puntos, el punto A, para propsitos de ilustracin. Usted puede ver que la desviacin de este punto respecto a la lnea de regresin se indica por la distancia entre A y B en la figura 5.5. Si acumulramos las desviaciones cuadradas de cada uno de los puntos de la lnea de regresin, obtendramos la suma ms pequea posible, debido a que se utiliz el mtodo de mnimos cuadrados para estimar la lnea de regresin. As, en la evaluacin del ajuste de esta lnea de regresin para la grfica de dispersin de los datos reales, necesitamos algn estndar de comparacin.

    Figura 5.5 Desviaciones

    explicadas y no explicadas

    6Esta seccin se deriva en gran parte de la explicacin presentada en H. Kelejian y W. Oates, Introduction to Econometrics, New York: Harper & Row, 1989.

    Economa de empresa

  • Suponga que se le pide predecir la cantidad de pizza demandada por los consumido-res sin la ayuda de una ecuacin de regresin. No sera razonable utilizar el valor medio (esto es, el promedio aritmtico) de la cantidad demandada como el valor pronosticado? Los tericos estadsticos, de hecho, utilizan el valor medio de la variable dependiente (Y) como la base para la comparacin de la "bondad del ajuste" de la lnea de regresin respecto a la dispersin de los puntos reales de informacin. En efecto, esta medicin particular responde a la pregunta: qu tanto resulta mejor utilizar la lnea de regresin para prede-cir el valor de Y en comparacin con el simple uso de la media de Y?

    En la figura 5.5,la media de Y (Y) se indica mediante la lnea punteada. La desviacin de lnea de regresin del valor medio de Y se indica por la distancia entre los puntos B y C. Observe que la lnea de regresin siempre pasa a travs del punto que representa la media de X y la media de Y.7 Esto se indica por el punto Den la figura 5.5. Por lo tanto, observamos en la figura 5.5 que la desviacin de un valor muestra! de Y a partir de su media puede dividirse en dos componentes separados: AB y BC. Ms formalmente, podemos afirmar lo siguiente:

    '""' Desviacin de la muestra

    de! i-simo valor muestra! de Y respecto a la media

    '"" (Y; -- Y) ~" Desviacin explicada de Y1 respecto a Y

    AB ''' (Y,. - Y) '' Desviacin no explicada de Y,. respecto a \/

    BC es la desviacin "explicada" del valor muestra! de Y respecto a su media debido a que ste puede explicarse por la lnea de regresin. ABes la porcin "inexplicada" de la desviacin total, debido a que su valor difiere del valor estimado mediante la lnea de regresin. Si la ruptura entre los componentes explicados e inexplicados se midiera para cada observacin, y los valores resultantes se elevaran al cuadrado (para compensar por desviaciones negativas y positivas) y despus se sumaran, llegaramos a las siguientes relaciones:

    STC = l( Y; YV ::::= Suma total cuadrados (suma las desviaciones cuadradas de los valores muestrales de Y respecto a la media)

    SCR =, 2.:{ Y Y) 2 = Suma de cuadrados de regresin (suma de las desviaciones cuadradas de los valores estimados respecto a !a media)

    SCE '"~(Y YV Suma de los cuadrados de los errores 1 1

    (suma de las desviaciones cuadradas de los valores muestrales respecto a los valores estimados)

    Las abreviaciones STC, SCR y SCE se utilizan comnmente en los libros de econome-tra para estas relaciones, as que aqu los utilizaremos en referencia a los componentes to-tales, explicados y no explicados, respectivamente, de la variacin de los valores de la muestra respecto a su media. Para resumir podemos decir simplemente que STC = SCR + SCE. A partir de estas relaciones, podemos construir una medicin del poder explicativo de la ecuacin de regresin.

    7para la prueba de por qu siempre es ste el caso cuando el mtodo de los mnimos cuadrados se utiliza, consulte un texto de estadstica o de econometra.

    Captulo 5 Estimacin de la demanda 183

  • 184

    y y

    R2 = 1 R2 =O (Y= y)

    X X

    (a) (b)

    Figura 5.6 El coeficiente de determinacin

    La medicin del poder explicativo de la ecuacin de regresin que se utiliza ms co-mnmente se llama coeficiente de determinacin. El smbolo utilizado para esta medicin es R2 Definimos esta medicin de la forma siguiente:

    SCR SCE ----- --- ::e:: 1 - ---------STC STC

    {5.4)

    Si SCR es igual a STC, esto significa que la desviacin total de Y respecto a su media muestra! puede ser explicada por la ecuacin. Esto tambin implica que R2 es igual a 1. Otra forma de ver esta situacin es buscar la expresin alternativa de R2, 1-SCE/STC. Si la lnea de regresin explica la desviacin total de Y respecto a su media, no habra suma de cuadrados de error (SCE = 0). Esto significa que SCE/STC =O, y por tanto R2 = l. La figura 5.6a ilustra una situacin en la que R2 = l. Usted puede ver en esta figura que R2 = 1 significa que cada punto en la grfica de dispersin descansa sobre la lnea de regresin.

    En el otro extremo, si la lnea de regresin no explica ninguna variacin de Y a partir de su media, R2 asume el valor de O. Como se ve a partir de la frmula, R2 =O significa que SCR/STC = O. Mediante la frmula alternativa para R2, vemos que esto significa que SCE=STC (es decir, SCE/STC = 1). Tal caso podra indicar que el valor medio de Y es jus-tamente tan til como la lnea de regresin de mnimos cuadrados en la prediccin del va-lor de Y (esto es, Y= Y). La figura 5.6b ilustra este caso.

    En realidad, R2 asumir algn valor entre los dos valores extremos de O y l. Claramen-te, cuanto ms cercano est R2 a la unidad, mayor ser el poder explicativo de la ecuacin de regresin. Por ejemplo, un R2 de 0.93 indica un muy buen ajuste de la lnea de regre-sin a la dispersin de puntos (vea la figura 5.7a). Esta estadstica indica que un 93% de la variacin en Y respecto a su media puede explicarse por la ecuacin de regresin. Un R2

    cercano a O indica una ecuacin de regresin con muy poco poder explicativo. Por ejemplo,

    Economa de empresa

  • y y

    X X

    Figura 5.7 Indicador del ajuste de la lnea de regresin

    R2 = .15 (slo el15% de variacin en Y respecto a su media es explicado) se muestra en la figura 5.7b.

    El que un valor dado para R2 se considere "alto" o "bajo", o "aceptable" o "inaceptable" en el anlisis estadstico depende del tipo de datos que se estn utilizando (de corte trans-versal versus series de tiempo), los estndares particulares del investigador y la R2 tpica calculada en estudios de naturaleza similar. Los estudios que emplean datos de corte trans-versal generalmente tienen un R2 ms bajo que aquellos que utilizan datos de series de tiempo. Esto se debe a que los datos de series de tiempo, como cabe esperar, tienen un elemento de tendencia incorporado que por lo general provoca que las variables Y y X se muevan cercanamente durante el tiempo. No es poco comn que cuando se estima la de-manda utilizando datos de series de tiempo se obtenga un R2 de 0.90 o superior. Los estu-dios macroeconmicos de la funcin de consumo generalmente tienen un R2 de 0.95 o ms. Ordinariamente, si un investigador estima una ecuacin de regresin con R2 = 0.75, significa que el modelo de regresin tiene un poder explicativo ms bien fuerte. Sin em-bargo, dado que la mayor parte de los estudios de funcin de consumo producen valores de R2 de 0.95 o ms, un valor R2 de 0.75 en una ecuacin de consumo tendra que conside-rarse como un valor relativamente bajo.

    Hay que mencionar un aspecto adicional acerca de R2 Al aadirse variables adicio-nales a la ecuacin de regresin (esto es, al movernos de la regresin simple a la regresin mltiple),la ecuacin de regresin, naturalmente, "explicar" una mayor proporcin de la variacin en la variable dependiente. De hecho, es posible mostrar que la adicin de algn nmero aleatorio o variable sin relacin alguna con el modelo de regresin, mejorar la bon-dad del ajuste de la ecuacin de regresin (incrementar la magnitud de R2). Para compensar por el hecho de que las ecuaciones de regresin con ms variables independientes tienden a tener valores de R2 ms altos, podemos utilizar una medicin llamada coeficiente de deter-minacin "corregido" o "ajustado", R.2. Esta medicin se define como

    Captulo 5 Estimacin de la demanda 185

  • donde k = nmero de variables independientes n :::.e::. tarr1ai'o de la muestra

    Mediante observacin, usted puede deducir que en la regresin mltiple, R2 exceder siempre a R.z. La diferencia entre las dos mediciones depender, por supuesto, del tamao de la muestra (n) y del nmero de variables independientes (k). Para un tamao de mues-tra dado, R.z mostrar un ajuste incrementado hacia abajo respecto a R2 conforme aumente el nmero de variables independientes. Sin importar el nmero de variables indepen-dientes en la ecuacin, la cantidad del ajuste hacia abajo respecto a R2 disminuir al incre-mentarse el tamao de la muestra. En cualquier proporcin, casi todos los paquetes de software para regresin calculan automticamente R2 adems de R2

    EVAlUACIN DE LOS COEFICIENTES DE REGRESIN ----------------------------------'''"''~;,

    186

    Hasta aqut hemos estudiado el anlisis de regresin en relacin con lo que se denomina estadstica descriptiva. Los datos se renen con base en dos variables, una dependiente y la otra independiente; una lnea se ajusta a travs de la dispersin de puntos que represen-tan los valores de las dos variables; y se desarrolla una medicin de qu tan bien se ajusta la lnea a la dispersin. Pero para evaluar la utilidad de los resultados del anlisis de regre-sin en la toma de decisiones de negocios, necesitamos entrar al mbito de la estadstica inferencia[.

    Un investigador que busca cierta informacin acerca de alguna poblacin intentar obtener datos de la poblacin entera o de alguna muestra de la poblacin. En todos los casos se emplea una muestra de la poblacin debido al costo prohibitivo de obtener in-formacin de la poblacin entera. Ms an, en muchos casos es simplemente imposible obtener los datos de la poblacin entera. Pero si se utiliza una muestra en vez de la po-blacin total, el investigador debe evaluar el grado en que los resultados de esta muestra reflejan a la poblacin. En otras palabras, se vuelve necesario hacer inferencias acerca de la poblacin con base en lo que se conoce acerca de la muestra, y hacer un juicio acerca de qu tan buenas son estas inferencias.

    Suponga que estamos llevando a cabo un estudio de la demanda de la pizza en un plantel universitario con una poblacin de 4,500 estudiantes. Las variables en estudio son el ingreso y la cantidad promedio de rebanadas de pizza demandadas al mes. Suponga adems que somos capaces de obtener informacin de la poblacin completa de estudian-tes. Esto se ilustra en la tabla 5.2, donde los consumidores se han dividido en 10 grupos de acuerdo con el ingreso semanal despus de descontar impuestos, comenzando con $100 a la semana e incrementndose en intervalos de $20 hasta $280. El nmero promedio de rebanadas de pizza compradas al mes se indica en la matriz numrica. Para hacer esta ilustracin tan simple como sea posible, suponemos que hay 450 estudiantes consumidores en cada una de las 10 categoras de ingreso. Por ejemplo, si leemos hacia abajo en la colum-na de $100, vemos que 10 estudiantes (un dcimo de 100) compran un promedio de 10 re-banadas de pizza al mes, 30 estudiantes (un dcimo de 300) compran un promedio de 10.5 rebanadas de pizza al mes, y as sucesivamente. (Note la flecha vertical en la tabla 5.2.) Al leer a travs de cada flecha observamos el nmero de rebanadas de pizza demandadas

    Economa de empresa

  • Tabla 5.2 Nmero de rebanadas de pizza consumidas al mes, por ingreso semanal

    f $100 $120 $140 $160 $180 $200 $220 $240 $260 $280

    (1) 100 10.0 11.5 13.0 14.5 16.0 17.5 19.0 20.5 22.0 23.5

    (2) 300 10.5 12.0 13.5 15.0 16.5 18.0 19.5 21.0 22.5 24.0

    (3) 600 10.8 12.3 13.8 15.3 16.8 18.3 19.8 21.3 22.8 24.3

    (4) 800 11.2 12.7 14.2 15.7 17.2 18.7 20.2 21.7 23.2 24.7

    (5) 900 11.5 13.0 14.5 16.0 17.5 19.0 20.5 22.0 23.5 25.0

    (6) 800 11.8 13.3 14.8 16.3 17.8 19.3 20.8 22.3 23.8 25.3

    (7) 600 12.2 13.7 15.2 16.7 18.2 19.7 21.2 22.7 24.2 25.7

    (8) 300 12.5 14.0 15.5 17.0 18.5 20.0 21.5 23.0 24.5 26.0 (9) 100 13.0 14.3 16.0 17.5 19.0 20.5 22.0 23.5 25.0 26.5

    4,500

    para las nueve categoras de frecuencia. (Note la flecha horizontal en la tabla 5.2.) Obser-vamos que el nmero de rebanadas de pizza demandadas se incrementa al aumentar el ingreso semanalmente. Por ejemplo, en la segunda fila, frecuencia 300, vemos que los 30 individuos (un dcimo de 300), que tienen un ingreso promedio semanal de $100 compran 10.5 rebanadas de pizza al mes; los 30 que ganan un promedio de $120 al mes compran 12 rebanadas de pizza al mes, y as sucesivamente. El nmero promedio de rebanadas que se presenta ms frecuentemente para cada categora de ingreso se observa al leer a travs de la fila indicada por la frecuencia de 900. Como se observa, esta lnea tambin represen-ta el nmero promedio de rebanadas de pizza para cada categora de ingreso.

    La figura 5.8 muestra la distribucin de aquellos consumidores que ganan $200 sema-nalmente. El conjunto completo de datos en la tabla 5.2 se ilustra en la figura 5.9. Observe

    f

    100

    80

    60

    40

    20

    Rebanadas/ mes

    Captulo 5 Estimacin de la demanda

    Figura 5.8 Demanda de

    pizza:distribucin de los consumidores que ganan

    $200 por semana

    187

  • 188

    f Y(Rebanadas de pizza/mes)

    Y= 4+0.075X

    200 X (Ingreso promedio semanal)

    Figura .9 Distribuciones de frecuencia combinada para la demanda de pizza

    que suponemos que hay una distribucin normal y continua para cada nivel de ingreso. Cada distribucin tiene un valor esperado o media diferente, pero todas tienen la misma varianza.

    Para los datos de tal poblacin la lnea de regresin sera

    Y= 4 + 0.075X (5.5)

    Ahora suponga que seleccionamos una muestra de compradores de pizza a partir de esta poblacin. Como usted se imaginar, esta muestra puede indicar una relacin diferen-te entre el ingreso y la cantidad demandada de pizza. Para demostrar este hecho, hemos di-bujado una "visin amplificada" de una parte de la figura 5.9 en la figura 5.10a. Observe que el grupo denso de los puntos poblacionales simtricamente colocados alrededor de la media de cada distribucin refleja la distribucin normal, con forma de campana, que he-mos asumido que existe para cada nivel de ingreso.

    La lnea slida dibujada a travs de la dispersin de puntos en la figura 5.10 indica la verdadera lnea de regresin para la poblacin. Sin embargo, la muestra de puntos seleccio-nados para un estudio de regresin es diferente de la dispersin de puntos de la poblacin. Esto ocasionara que la ecuacin de regresin estimada para la muestra sea diferente de la de la poblacin. Ejemplos de posibles diferencias entre la muestra y las ecuaciones de regresin de la poblacin se presentan en las figuras 5.10b, e y d. Las ecuaciones de re-gresin de la muestra se representan por las lneas entrecortadas.

    Como podr ver, una lnea de regresin de mnimos cuadrados ajustada a travs de los puntos de la muestra en la figura 5.10b mostrara una relacin positiva entre el ingreso y la demanda de pizza. Sin embargo, debido a que la pendiente no est tan incli-

    Economa de empresa

  • f(Y)

    f(Y)

    ---------------

    160 200 240 (e)

    280

    Y=a + bX (Y= 4 + 0.075X)

    X

    X

    f(Y)

    f(Y)

    ------ ___ .. --- . .

    Y=a + bX (b < b)

    --- ... ---~- Y= a+ fx : : (b

  • 190

    La prueba utilizada para establecer, con un cierto grado de certidumbre, que los coeficien-tes de regresin estimados a partir de los datos muestrales verdaderamente reflejan a la poblacin, se denomina prueba de significancia estadstica. Debido a que esta prueba implica lo que se conoce como valores-t, se le denomina comnmente prueba-t.

    Nuestra explicacin de esta prueba comienza con un repaso del trmino de error, u, pre-sentado al principio de este captulo. En teora estadstica, se supone que este trmino se distribuye aleatoriamente alrededor de la lnea de regresin de poblacin en una forma nor-mal, con su media como el valor de Y dado el valor de X y con alguna cantidad de varianza. 8

    Como se ilustra en la figura 5.10, un ejemplo aleatorio tomado de la poblacin puede producir resultados de regresin que son muy diferentes de una lnea de regresin ajustada a travs de la poblacin. Si repetidamente seleccionramos una muestra aleatoria de un tamao determinado a partir de esta poblacin y estimramos una lnea de regresin para cada una de estas muestras, generaramos un gran nmero de lneas de regresin mues-tra! (vea la figura 5.11). Cada una de estas lneas de regresin muestra! tiene sus propios coeficientes de intercepcin y de pendiente, a y b. En teora estadstica, se puede mostrar que si el trmino de error de la poblacin est distribuido normalmente alrededor de su lnea de regresin con alguna varianza constante ( aD, entonces el repetir el muestreo produ-cir una distribucin de coeficientes de regresin estimados, a y b, que estn normalmente distribuidos con una media o un valor esperado igual a los coeficientes de regresin de la poblacin, y con una varianza igual a un nmero relacionado con la varianza del trmino de error en alguna forma sistemtica. Las ecuaciones siguientes expresan este enunciado de una forma notacio-nal. Debido a que estamos interesados primordialmente en los coeficientes de la pendiente, debemos enfocar nuestra atencin en b. Sin embargo, las mismas afirmaciones se pueden hacer acerca del trmino de interseccin, a.

    b) b (5.6)

    (5.7)

    La ecuacin (5.6) es muy sencilla. Expresa que la media o el valor esperado del coeficien-te estimado bes igual a b, el coeficiente de regresin verdadero (pero desconocido) para la poblacin completa. La ecuacin (5.7) afirma que la varianza de la distribucin de los coefi-cientes de regresin estimados de un muestreo repetido de la poblacin es igual a la varian-za del trmino de error de la poblacin, u, dividido entre la suma de las desviaciones cuadra-das de cada valor observado de X respecto a la media de X. La verbalizacin de la ecuacin (5.7) es ms bien molesta pero se hace para estar seguros. Pero lo importante es tener en mente que necesitamos conocer la varianza de la distribucin de los estimadores muestrales b para determinar la probabilidad de ocurrencia de cualquier valor de b en particular.

    Debido a que la informacin acerca de la varianza de los trminos de error de la po-blacin es generalmente desconocida, recurrimos al uso de un estimador de la varianza de la poblacin. En teora estadstica, es posible mostrar que un estimador sin sesgo de la va-

    8Recuerde que la distribucin normal es la curva simtrica y con forma de campana usada con frecuencia en estadstica. Como tal, se puede definir mediante dos valores, su media y su varianza (o desviacin estndar, la raz cuadrada de la varianza). Cuanto ms grande sea la varianza, ms "dispersa" ser la distribucin normal.

    e m

  • y

    Yz= az + bzX-

    ----r--~.,-.:;;._-,r-----Y1 = 1 + bX

    X

    Figura 5.11 Lneas de regresin

    producidas por muestreo repetido

    rianza de la distribucin de trminos de error ( fr~) es igual a la suma de los residuos cuadra-dos de cada uno de los puntos de la muestra respecto a la lnea de regresin estimada, dividida en-tre el tamao de la muestra menos 2 (esto es, n - 2). Los residuales son las diferencias entre los ':alares reales de Y y los estimados a partir de la ecuacin de regresin (esto es, Y menos Y). Expresado en forma notacional,

    A su vez, el estimador sin sesgo de la varianza del estimador muestra! b (a~) es igual al estimador de la varianza de los trminos de error divididos entre la suma de las desviaciones cuadradas de cada valor observado de X respecto a la media de X. En forma notacional,

    Obtenemos la desviacin estndar de la distribucin de los coeficientes muestrales b tomando simplemente la raz cuadrada de la varianza estimada de esta distribucin. Esto es,

    SEr, ' \/r}2 u D

    Como es costumbre, nos debemos referir a la desviacin estndar del coeficiente de regresin de la muestra como el error estndar del coeficiente (EE1;). Y, como vamos a mostrar, EE; juega un papel central en la prueba-t.

    Al manejar la prueba-t, comenzamos mediante la hiptesis de que el coeficiente de regresin verdadero (pero desconocido) para la poblacin es un cierto valor. En el anlisis estadstico esto se denomina hiptesis nula. Tpicamente en la investigacin econmica, se hace la hiptesis de que el coeficiente de regresin de la poblacin es O; es decir, no hay relacin entre X y Y en la poblacin. La hiptesis alternativa es que existe de hecho una re-lacin entre X y Y. Al utilizar la notacin convencional estadstica, podemos expresar la hiptesis nula y la alternativa como:

    Captulo 5 Estimacin de la demanda 191

  • 192

    y

    Y de la muestra

    Figura 5.1 Relacin falsa indicada por

    X la regresin de la muestra

    H0

    :b:::::Q

    H "bc;ic:Q 1. '

    Si la b o el coeficiente de la pendiente es verdaderamente O, como expresa la hiptesis nula, entonces para la poblacin completa, los cambios en X no tendran impacto en Y.

    Suponga que el valor verdadero de b fuera de hecho O. Sera an posible seleccionar una muestra que denotara la relacin entre Y y X? Ciertamente s sera posible, y la figu-ra 5.12 muestra exactamente cmo podra pasar esto. Observe que en esta figura la grfi-ca de dispersin de la poblacin es tal que una lnea de regresin ajustada a travs de los puntos es horizontal (tiene una pendiente cero). Pero suponga que la muestra que selec-cionamos (indicada por los puntos circulados en la figura 5.12) denotara una relacin po-sitiva al fijar una lnea de cuadrados mnimos a travs de la dispersin de la muestra. Con base en los resultados del anlisis de regresin de los datos muestrales, concluiramos que existe una relacin directa entre X y Y para la poblacin entera, cuando realmente no hay ninguna. Esta clase de error sera de obvia preocupacin para los encargados de to-mar decisiones. Por ejemplo, suponga que un anlisis de regresin de ventas relacionado con los gastos de publicidad mostr errneamente una relacin positiva entre las dos va-riables y sugiri a la empresa incrementar sustancialmente la cantidad de su presupuesto para publicidad. Dado que en realidad no existe un impacto de la publicidad en las ven-tas, esta decisin conducira a gastar intilmente los recursos financieros de la empresa.

    Afirmamos antes que si el trmino de error de la ecuacin de regresin de la poblacin est normalmente distribuido, es posible mostrar que los coeficientes estimados de la mues-tra tambin estn distribuidos normalmente. Tambin es factible demostrar matemtica-mente que la desviacin estandarizada de cada estimacin muestra! a partir del valor de pobla-cin real tiene una distribucin-U La figura 5.13 ilustra este punto. En la figura 5.13a, vemos

    9La distribucin-t es una distribucin simtrica en forma de campana que se asemeja mucho a la distribu-cin normal. Esta forma precisa depende de la medicin llamada grados de libertad. En la regresin simple existen n- 2 grados de libertad. Al incrementarse el tamao de la muestra (n), la distribucin-t tiende hacia la distribucin estndar normal. En el lmite, las dos se vuelven idnticas.

    Economa de empresa

  • P(b)

    Figura 5.1 La distribucin-t

    E(b) = b

    (a) b

    P(t)

    t=O t = 2

    (b)

    una distribucin normal de los coeficientes b estimados con su punto medio que designa la media o el valor esperado. El eje vertical de la grfica mide la probabilidad de ocurrencia de los diferentes valores de b estimados. Obviamente, la media o valor esperado de b tiene la mayor probabilidad de ocurrir. Suponga que el coeficiente estimado de la muestra b es el que se indica en el punto A en la figura 5.13a. Cul es la probabilidad de que tal punto ocurra? Para encontrar la respuesta a esta pregunta, estandarizamos las diferencias entre cualquier punto en la distribucin y su valor esperado. Esto se hace mediante la siguiente ecuacin:

    + ... . t .. . (5.8)

    Este valor muestra a cuntas unidades-t alejadas del valor esperado se encuentra el coeficiente estimado b. Para interpretar este valor-t, necesitamos saber el nmero de grados de libertad ( d.f., del ingls degrees of freedom) implicados en este caso. Para cualquier mues-tra determinada, d.f. se define como n - k -1 , donde n, k y 1 representan el tamao de la muestra, el nmero de variables independientes y el trmino de interseccin, respectiva-mente. Por ejemplo, en una ecuacin de regresin con una muestra de 62 observaciones, ha-bra 60 grados de libertad. La probabilidad de ocurrencia del valor A (convertida en 2 uni-dades) se puede encontrar ahora con la ayuda de una tabla-t, como se muestra en la tabla CA en el apndice C al final del texto. En esta tabla vemos que para 60 d.f., la probabilidad de que t tenga un valor de 1.671 o ms es aproximadamente del 5%. (Vea columna para "una-cola, a = 0.05".) Por lo tanto, la probabilidad de que t tenga un valor de 2 o ms se-r claramente menor que 5%.

    Despus de encontrar el valor-t del coeficiente estimado de regresin b, el investiga-dor debe decidir entonces si rechazar la hiptesis nula de que no existe relacin entre X y Y en la poblacin. El procedimiento estndar es establecer lo que se llama el valor-t crtico basado en un punto predeterminado de la distribucin-t. Generalmente este punto se es-tablece en un nivel de significancia de 0.05. Podemos entonces ir a la tabla-t para encontrar el valor crtico de t correspondiente a este nivel de significancia. Por ejemplo, la tabla mues-

    d 193

  • 194

    -2 +2

    Figura 5.14 Valores-t crticos para la

    prueba de dos colas, nivel de 5% de significancia, 60

    grados de libertad

    traque para 60 grados de libertad, el rango entre 2.0 y -2.0 incluye aproximadamente el 95% de los valores de t. Otra forma de decir esto es que la oportunidad de obtener un va-lor-t mayor que 2.0 o menor que -2.0 es de aproximadamente 5% o menos. La figura 5.14 ilustra el nivel 0.05 de significancia en una distribucin t con 60 grados de libertad. Obser-ve que los valores de t son mayores o menores que el valor-t crtico que est situado en las dos terminales o "colas" de distribucin.

    La conclusin anterior nos ayuda a entender la racionalidad de la "regla de 2" emplea-da muchas veces por los economistas en su evaluacin de la prueba-t. Esta regla afirma que la hiptesis nula de que b =O puede rechazarse si el valor-tes menor o igual a -2 o mayor o igual a 2. Al utilizar el valor absoluto de t, podemos afirmar que la hiptesis nula se rechaza si

    La implicacin de esta regla emprica es que el nivel de significancia 0.05 se est utili-zando para seleccionar el valor-t crtico. Como se observa en la tabla-t al nivel de 0.05 de significancia, 2 sirve como una aproximacin til del valor-t crtico para 20 grados de li-bertad y superior.

    Ejercicio sugerido para ilustrar el uso de la prueba-t en el saln de clases En este punto, quiz usted est un poco confundido acerca de la nocin del valor-t y su uso en la comprobacin de la relacin entre la estimacin muestra! b y el valor poblacional des-conocido b, particularmente si no est familiarizado con la teora estadstica. Presentare-mos, entonces, un ejercicio simple que probablemente desear poner en prctica usted mis-mo o conjuntamente con sus compaeros de clase y su profesor. Este ejercicio utiliza el ejemplo de la demanda de pizzas con el que hemos trabajado anteriormente.

    Corte 45 cuadrados de cartn de igual tamao. De acuerdo con la tabla 5.2, existen nueve niveles posibles de demanda de pizza para cada categora de ingreso. Por tanto, a cada uno de los cuadrados se le asignar un rango de valor de 1 a 9. Como se muestra en la primera columna de la tabla 5.2, deber etiquetarse un cuadrado con 1, tres cua-drados con 2, seis cuadrados con 3 y as sucesivamente. (Observe que hemos dividido las frecuencias en cada categora de ingreso entre 100. Existen 4,500 observaciones en la poblacin, pero hemos reducido el nmero de cuadrados empleados a 45 simplemente

    Economa de empresa

  • por conveniencia. Si las frecuencias relativas son las mismas, no debe importar si se utili-zan 45 o 4,500 cuadrados en este ejercicio.)

    Coloque los 45 cuadrados en un sobre. Despus seleccione un cuadrado para cada categora de ingreso. Asegrese de regresar el cuadrado al sobre despus de cada selec-cin. Al hacer esto, usted est generando una muestra aleatoria de 10 observaciones, una para cada categora de ingreso. Debido a que el nmero 5 ocurre ms frecuentemente (9 veces en este ejercicio y 900 veces en una poblacin hipottica de estudiantes consumi-dores) es claro que la probabilidad de sacar este nmero del sobre es la mayor. De hecho, cada vez que se selecciona un cuadrado, hay una probabilidad del 20% (9 1 45) de que el nmero 5 sea seleccionado. Entonces combine el nmero sacado con su categora de ingre-so para determinar el consumo correspondiente de pizza.

    Suponga que uno de estos ejercicios produce la siguiente tabla de nmeros. Como re-ferencia al ejercicio, el nmero que fue sacado del sobre se incluye entre parntesis junto con las cantidades demandas de pizza.

    CANTIDAD PROMEDIO DE REBANADAS

    DE PIZZA DEMANDADA INGRESO SEMANAL

    10.0 (1) $100

    13.0 (5) 120

    15.2 (7) 140

    16.0 (5) 160

    16.0 (1) 180

    18.7 (4) 200

    21.2 (7) 220

    22.3 (6) 240

    22.0 (1) 260

    26.0 (8) 280

    En la figura 5.15 se presenta una grfica de dispersin de estos datos. La ecuacin de regresin estimada para esta muestra es

    Y~= 3.27 l- 0.078X

    (0.86) (0.004) (5.9)

    Ahora llevaremos a cabo una prueba-t para la significancia del coeficiente de muestra estimado, b. Recuerde que las hiptesis nula y alternativa se pueden expresar de la siguien-te forma:

    H b O o . -

    Claramente, nuestro coeficiente muestral b de 0.078 es mayor que cero. Por tanto, debe-mos determinar la probabilidad de encontrar tal valor muestra! a partir de una poblacin cuyo valor verdadero es en realidad cero. Empezamos mediante la sustraccin del cero (el valor de poblacin hipottico de b) de 0.078 (el valor estimado a partir de lamuestra, b), y despus dividimos esta diferencia entre el error estndar de b. Por convencin, el error es-tndar de un coeficiente de regresin estimado se presenta entre parntesis debajo del coeficiente. Como se observa en la ecuacin (5.9), el valor estndar debes 0.004, y el error estndar de la interseccin es 0.86. Este procedimiento se resume aqu.

    Capitulo 5 Estimacin de la demanda 195

  • 196

    y (Rebanadas 1

    Mes)

    25 r-

    20 r-

    15 r-

    5 r-

    Al 1 _1 ~ ~ 1 l 1 L

    120 140 160 180 200 220 240 260 280 X (Ingreso semanal)

    t .. .. :

    t= 1

    La ecuacin (5.10) se denomina razn-t o el valor-t.

    Figura .1 Grfica de dispersin de los datos de muestra para el experimento de la pizza

    (5.10)

    A partir de los resultados de la ecuacin usted puede ver que si el coeficiente de pobla-cin, b, fuera verdaderamente cero, entonces 0.078 estara situado a 19.5 unidades-t de distancia de la media. Al regresar a la tabla C.4 en el apndice C de este texto vemos que la probabilidad de encontrar tal valor es tan remota que ni siquiera se incluye en la tabla. Sin embargo, esta tabla indica que la probabilidad de obtener un valor-t (con 8 grados de li-bertad) mayor que 3.355 o menor que -3.355 a partir de una distribucin cuya media es cero, es una entre 100 (es decir, 0.01). Esto implica que la probabilidad de obtener un va-lor de 19.5 es virtualmente nula. Y por ello llegamos a la conclusin bastante obvia de que el verdadero valor del coeficiente de poblacin es, muy probablemente, diferente de cero. En trminos de teora estadstica, rechazamos la hiptesis nula.

    Al utilizar el anlisis de regresin, los economistas casi siempre hacen la hiptesis de que el coeficiente de poblacin es igual a cero (H0 : b = 0). Sin embargo, se puede for-mular la hiptesis de que el valor del coeficiente desconocido de poblacin sea de cual-quier valor que el investigador desee. Por ejemplo, suponga que diferentes estudios pre-vios en la demanda de pizza estimaron que el valor del coeficiente de la variable del ingreso es aproximadamente de 0.073. Entonces podramos utilizar estos estudios previos como la justificacin de la hiptesis de que el coeficiente desconocido es igual a este valor:

    H0 : b "''' 0.73

    H : b :f' 0.73 fi

    Encontramos la razn-t correspondiente como

    Economa de empresa

  • 0.078 "" t :::.: .. . 0.004

    1

    Suponga que probamos esta hiptesis mediante una prueba de dos colas con un nivel de 0.05 de significancia. Si regresamos nuevamente a la tabla-t en el apndice, encontra-mos un valor-t crtico de 2.306 para una regresin con 8 grados de libertad. Dado que el valor-t de 1.25 no es mayor que 2.306, no podemos rechazar la hiptesis nula. Nuev;:unen-te, esto no significa que podamos decir ahora que el coeficiente de poblacin es en reali-dad 0.073. Sin embargo, esta falla en pasar la prueba-t significa que no podemos decir con un alto grado de certidumbre que el valor de la poblacin no es de 0.073. Hasta que estu-dios futuros indiquen otra cosa, los investigadores quiz quieran asumir la hiptesis en funcionamiento de que el coeficiente desconocido de poblacin est alrededor de 0.073.

    La distribucin-t y una y Al utilizar el anlisis de regresin para la investigacin econmica y de negocios, el patrn para todas las hiptesis nulas es afirmar que no existe relacin entre una variable particular indepen-diente y la variable dependiente (por ejemplo, b = O). Sin embargo, los investigadores por lo general hacen una eleccin en cuanto a si la hiptesis alternativa afirma que la variable independiente simplemente tiene algn impacto en la variable dependiente (una prueba de dos colas) o si indica un impacto positivo o negativo (una prueba de una cola). En la evaluacin de la relacin entre ingreso y cantidad demandada de pizza, nuestra hipte-sis alternativa fue que los cambios en el ingreso tenan un efecto en la cantidad demanda-da de pizza; no se estableci si este efecto era positivo o negativo. Si tuviramos una ra-zn a priori para creer que el efecto del ingreso en la cantidad demandada era positivo o negativo, se reflejara en la hiptesis alternativa. Por ejemplo, si establecemos la hiptesis de que la pizza es un bien "normal",la hiptesis alternativa sera que los cambios en el in-greso tienen una relacin directa con los cambios en la cantidad demandada. Si establece-mos la hiptesis de que la pizza es un bien "inferior", la hiptesis alternativa afirmara una relacin inversa entre las dos variables. Mediante la notacin que hemos desarrollado:

    Si se formula la hiptesis de que la pizza es un "bien normal" (el coeficiente de la variable de ingreso es positivo), entonces

    H0 : lJ :sO

    H: b.> O Ei

    Si se establece la hiptesis de que pizza es un "bien inferior" (el coeficiente de la variable de ingreso es negativo), entonces

    H0

    : b::;:: O

    H:b

  • muy extenso de la prueba-t, as que resultar til resumir cada uno de los pasos implica-dos en la ejecucin de esta prueba.

    Paso 1: Formule la hiptesis.

    Por ejemplo, "la p~zza es un bien normal". (En otras palabras, se hace la hiptesis de que el ingreso tiene una relacin directa con la demanda de pizza.)

    Paso 2: Reformule la hiptesis en trminos adecuados para la prueba estadstica.

    Con respecto a la hiptesis antecedente acerca del ingreso y la pizza,

    : b ::~: o : b.> o

    Paso 3: Establezca un nivel crtico de rechazo y encuentre el valor-t que corres-ponda a este nivel.

    Por ejemplo, para una prueba de una cola, el nivel de significancia de 0.05 y 8 grados de libertad (el nmero que asumimos para el anlisis de pizza), t* = 1.86. Por tanto, si la estadstica-t es mayor que 1.86, podemos rechazar la hiptesis nula al nivel 0.05 de significancia.

    Paso 4: Encuentre la estadstica-t mediante la transformacin de la diferencia entre el estimado b y su valor hipottico, O.

    Por ejemplo, suponga que un coeficiente estimado es 2.5 y que el error estndar del coeficiente es 1.3. Entonces

    2.5- o t oo: 1

    1.92

    Paso 5. Compare el valor-t resultante con el valor crtico. Entonces decida si hay que rechazar la hiptesis nula.

    En nuestro ejemplo, 1.92 es mayor que el valor crtico-t de 1.86 para una prueba de una cola con 8 grados de libertad. Por tanto, podemos rechazar la hiptesis nula y afirmar que el ingreso tiene un impacto directo estadsticamente significativo en la demanda de pizza.

    ANLISIS D REGR SIN MLTI

    198

    Empecemos nuestra explicacin de la regresin mltiple mediante la especificacin del siguiente modelo de regresin aditivo lineal para la demanda de pizza:

    Y a+ b1

    donde Y== ca.ntidad demandada de por mes)

    X, = precio una

    Economa de empresa

    (5.11)

    (nnH.:ro promedio rebanadas per cpita

  • U onzas de bebida (en centavos) plantel est ubicndo en una concentrada

    urbana, O de otra forma)

    Suponga, como lo hicimos en la seccin de apertura de este captulo, que el anlisis de regresin de datos de corte transversal de 30 universidades produce la siguiente relacin estimada entre la cantidad demandada de pizza y nuestra seleccin de variables indepen-dientes:

    (0.018)

    R2 . 0.7'17

    + 0.1

    (0.087)

    F 15.8 n

    R2 0.67 Error

    - 0.544)(1

    (0.020) (0.884)

    de Y. 1

    Los asteriscos indican la significancia estadstica al nivel de 0.05.

    (5.12)

    Al evaluar esta ecuacin, observamos primero los signos de los coeficientes estima-dos de las variables independientes. (Generalmente ignoramos el trmino de intersec-cin, debido a que por s mismo este trmino carece de significado econmico.) Observe que, como se esperaba, el signo de la variable del precio es negativo. El signo de la varia-ble X2 es positivo, lo que indica que cuanto ms alto sea el costo de la colegiatura de la universidad, ms pizzas comprarn los estudiantes. El signo X3, la variable del precio de bebidas gaseosas, es negativo, lo que indica que la pizza y las bebidas gaseosas son pro-ductos complementarios.

    Existe una variable en la ecuacin, X4, que podra parecer un poco extraa. Se llama variable binaria o nula y asume el valor de 1 si el campus se ubica en un rea urbana con-centrada, y un valor de cero si es de otra forma. Este tipo de variable se explicar con ma-yor detalle en una seccin posterior. Sin embargo, por el momento podemos sealar que el coeficiente de esta variable mide la diferencia de la demanda de pizza por estudiantes que asisten a universidades en reas urbanas versus los estudiantes en instituciones loca-lizadas fuera de las reas urbanas. Como usted podr observar por la magnitud y signo del coeficiente X4, se estima que el primer grupo coma 0.544 menos rebanadas de pizza por mes que el ltimo grupo.

    Las magnitudes de los coeficientes indican el cambio en la cantidad demandada de pizza relativo a un cambio unitario en una variable particular independiente, asumiendo que los valores de las otras variables permanecen sin cambio. Esta caracterstica del anlisis de regresin mltiple es extremadamente til en la investigacin econmica y de negocios, debido a que sigue el enfoque de la esttica comparativa para el anlisis de problemas tan comnmente utilizado en teora econmica. Por tanto, la ecuacin nos dice que, al perma-necer constantes todos los dems factores, una disminucin de una unidad (un centavo) en el precio de la pizza causar que la cantidad demandada de pizza se eleve en 0.088 unidades. A menos que alguien tenga experiencia real o conocimiento previo acerca del negocio de venta de pizza al detalle, es difcil juzgar si las magnitudes de los coeficientes de regresin representan patrones tpicos de demanda de pizza relativos a cambios en las variables independientes o no. Sin embargo, como se observ antes, una forma de eva-luar estas magnitudes es la de calcular las elasticidades de la demanda con respecto a es-tas variables independientes. Para calcular dichas elasticidades, tenemos que suponer un cierto punto de arranque para los valores de las variables independientes. Asumamos los siguientes valores:

    Captulo 5 Estimacin de demanda 199

  • 200

    Precio de pizza (X1) = 100 ($1.00) Costo anual de la colegiatura de licenciatura (X2) = 14 ($14,000) Precio de una bebida gaseosa (X3) = 110 ($1.10) Ubicacin del campus (X

    4) =rea urbana (X4 = 1)

    Dados estos valores, calcularemos entonces que la demanda mensual per cpita para pizza ser

    y~~:. 26.67 -- 0.088 (100) + 0.1 (1 ---0.076 (110) --0.544 (1) (5.13)

    10.898 o 1 'l (redondeo a la cornpleta ms cercana)

    Recuerde la frmula general para la elasticidad punto:

    bY X -----X ax Y

    Ahora usaremos esta frmula para calcular las diferentes elasticidades de demanda:

    Elasticidad precio: -0.088 x --199 -0.807

    10.898

    14 Elasticidad del costo de la colegiatura: 0.138 x - - - =O 177

    10.898 '

    110 Elasticidad precio cruzada: - 0.076 x = 0.767

    10.898

    La ecuacin tiene una R2 ajustada de 0.67. Esto significa que el67% de la variacin en la variable dependiente se puede explicar por las variaciones en la variable independien-te. Una vez ms, slo quienes estn familiarizados con este tipo de negocios podrn eva-luar realmente el poder explicativo de esa ecuacin estimada. Sin embargo, 0.67 es una R2

    mayor que la que se encuentra en la mayor parte de los estudios empricos de demanda del consumidor que utilizan datos de corte transversal.

    Para llevar a cabo la prueba-t, primero dividimos los errores estndar (citados entre parntesis) entre sus respectivos coeficientes y comparamos estas razones-t con los valo-res apropiados en la tabla C.4 del apndice C. Al nivel de 0.05 de significancia, la prueba de dos colas, podemos ver que el valor-t crtico de 25 grados de libertad es 2.06. Median-te este nivel crtico vemos que las variables x1, que indica el precio de la pizza, y x3, que indica el precio de las bebidas gaseosas, son estadsticamente significativas.

    En cuanto a las implicaciones para las polticas de estos hallazgos de regresin, su-ponga que usted es un empresario que est considerando abrir una cadena de pizzeras en universidades a lo largo del pas. La inelasticidad precio de la pizza implica que usted debe tratar de utilizar la publicidad y promocin en lugar de las reducciones en el precio como medio de impulsar las ventas. Adems, la significancia estadstica del coeficiente de la variable del precio le dara una gran seguridad en cuanto a que no debe tratar de reducir el precio. Aunque el coeficiente de costo de la colegiatura no prob ser estadstica-mente significativo, la relativamente baja elasticidad de la demanda del costo de la cole-giatura lo llevar a la conclusin de que sus pizzeras no deben estar confinadas en algn tipo particular de instituciones de educacin superior. Con base justamente en la elastici-dad precio cruzada entre los precios de las bebidas gaseosas y la demanda de pizza, una vez que las pizzeras se establezcan, usted quiz considere reducir el precio de las bebidas como forma de impulsar la demanda de pizza.

    Economa de empresa

  • Existe otra prueba de significancia estadstica, llamada la prueba-F, que se emplea co-mnmente en el anlisis de regresin. Esta prueba mide la significancia estadstica de la ecuacin de regresin completa en lugar de la de cada coeficiente individual (como la prueba-t). Anteriormente, afirmamos que R2 es la medida del poder explicativo del mo-delo de regresin. En efecto, la estadstica-F es una prueba de la significancia estadstica de R2 La hiptesis nula de la prueba-F se expresa como sigue:

    o donde k es igual al nmero de variables independientes en la ecuacin de regresin.

    Si la hiptesis nula es verdadera, virtualmente no existe ninguna relacin entre la va-riable dependiente y las k variables independientes para la poblacin, y cualquiera que sea el valor de R2 (esto es, la proporcin de la variacin en Y explicada por X), es ms pro-bablemente un resultado casual del proceso de muestreo.

    El valor-F se define como

    1 )

    donde la variacin explicada es ICY- Y)2, la variacin no explicada es I(Y - Y )2, n es el tamao de la muestra, y k es el nmero de variables independientes. Esto tambin puede expresarse en trminos del valor de R2:

    (5.14)

    El procedimiento para usar el valor-F en la prueba-Fes similar al uso del valor-ten la prueba-t. Se establece un valor crtico para F dependiendo del grado de significancia estadstica que el investigador desee fijar. Tpicamente, el nivel de significancia se fija en 0.05 o 0.01. Los valores-F crticos correspondientes a estos niveles de aceptacin se muestran en la tabla C.3 del apndice C. Como se puede ver hay dos valores de "grados de libertad" que deben incorporase en la seleccin del valor-F crtico. Un valor se rela-ciona con el numerador de la ecuacin de F, y el otro se relaciona con el denominador. Dada esta informacin de los antecedentes, podemos ahora interpretar el valor-F para nuestra ecuacin de regresin mltiple para la demanda de pizza. Con un tamao de muestra de 30 y cuatro variables independientes (n = 30 y k = 4), la tabla-F indica que en el nivel de 0.05, el valor-F crtico para 4 y 25 grados de libertad es 2.76. En el nivel 0.01, el valor-F crtico es 4.18.

    Debido a que el valor-F de 15.80 de la ecuacin estimada (reportado en la ecuacin 5.12) excede ambos valores crticos, podemos concluir que nuestro modelo completo de regresin explica una porcin estadsticamente significativa de la variacin en la deman-da de pizzas. En general, es muy fcil para un modelo de regresin aprobar la prueba-F. La hiptesis nula, que establece que no existe relacin entre la variable dependiente y todas las variables independientes, es ms bien un enunciado rgido. Mientras algunas de las va-riables independientes en la ecuacin de regresin verdaderamente ayuden a explicar la varianza en la variable dependiente, la prueba-F indicar muy probablemente un modelo de regresin estadsticamente significativo. De hecho, se puede ver en la ecuacin (5.14) que para algn tamao de muestra dado y un conjunto de variables independientes, cuanto mayor sea R2, mayor ser el valor-F.

    Captulo 5 Estimacin de la demanda 201

  • Otra forma de ver la tendencia general de una ecuacin de regresin a pasar la prue-ba-Fes reconocer que los modelos de regresin que no pasen el examen deben de hecho ser inferiores. En cualquier caso, aun si la estadstica-F indica la significancia estadstica general del modelo de regresin, ah existe an la necesidad de someter cada variable in-dependiente a un examen individual. Para ese propsito, confiamos en la prueba-t.

    EMPL O D L AN Ll iS DE REGRESiN PARA ONOS ICAR LA DEMANDA

    202

    Adems de ayudar a los investigadores a entender ms acerca de las determinantes de la demanda, el anlisis de regresin se puede usar simplemente como herramienta para el pronstico. En el siguiente captulo explicaremos este tema con mucho mayor detalle. Por ahora, solamente afirmaremos que una vez que se han estimado los coeficientes de re-gresin, llegar a un valor pronosticado de la demanda de un bien o servicio en particular es simplemente cuestin de asignar valores a las variables independientes. Por ejemplo, su-ponga que el anlisis de regresin de datos de series de tiempo da como resultado la siguiente estimacin de demanda de pizza:

    Q ""- 100 -- 20P + 100/ + 15GP + 10P; . ,(1

    donde Q :::e: dernanda de pizza (en rniUones de rebanadas por ao) P = precio de la pizza (en centavos) l :;;; lngreso per cpita (en miles de dolares)

    CP :::: gastos de pubLicidad (en millones de dolares) Phd = Precio de los hot dogs (en centavos)

    Si asumimos que P = 100, I = 5, GP = 30 y Phd =125, nuestro pronstico para la can-tidad de pizza demandada para el ao prximo ser de 300 (millones de rebanadas). Sin embargo, cuando el anlisis de regresin se utiliza para el pronstico, debe tenerse el mis-mo cuidado que se tuvo al evaluar la significancia estadstica de los coeficientes de regre-sin individual. Esto se debe a que el pronstico est basado en una muestra de datos. Pa-ra tomar en cuenta que el valor de pronstico de 300 est basado en una muestra y es por tanto sujeto a un error de muestreo, utilizamos una medida llamada error estndar del estimado (EEE). Este trmino se incluye como una parte regular del ejemplar impre-so de computadora de cualquier programa de software de regresin. De hecho, se pue-de mostrar que el error estndar del coeficiente (EE 6) se deriva en realidad del EEE de la ecuacin de regresin.

    De acuerdo con la teora estadstica, podemos esperar que el valor verdadero (pero desconocido) de Y est dentro de un rango determinado por el valor estimado, ms o menos el producto del error estndar del estimado y el valor-t apropiado. En forma notacional,

    Y:::::tn-k 1EEE

    Por ejemplo, suponga que la ecuacin de regresin estimada para la demanda de la pizza se gener a partir de un tamao de muestra de 27 y que tiene un EEE de 25. Da-dos los valores previos podemos decir con 95% de seguridad que la actual demanda de

    Economa de empresa

  • pizza es 300 + 2.074 (25) o un rango de 248.15 a 351.85.10 Hay que tener precaucin cuando se desarrolla un rango d~ pronstico para la variable dependiente de la ecuacin de regresin estimada. La teora estadstica muestra que conforme los valores dados de las variables in-dependientes (precio, ingreso, precio de productos relacionados) se alejan de sus valores promedio, el rango de pronstico se ampla para cualquier nivel determinado de confianza.

    TEMAS ADICIONAL N EL LA ESPECIFICACI N

    MODELO DE R GRESIN

    Variables nulas y sustitutas

    Uno de los aspectos que ms retos representan en el anlisis de regresin (o en cualquier tipo de anlisis estadstico) es la obtencin de datos muestrales adecuados para su empleo en el anlisis. Por ejemplo, la teora econmica indica que "los gustos y las preferencias" es una determinante importante de la demanda del consumidor. Pero, cmo se mide es-te factor? Un investigador que no puede obtener informacin directa acerca de los gustos y preferencias, quiz tenga que usar una variable sustituta para representar este factor en la ecuacin de regresin. El nivel de educacin y el gnero de los consumidores son posi-bles variables sustitutas para gustos y preferencias. Las personas con niveles ms altos de escolaridad formal pueden tener gustos o preferencias diferentes por un bien o servicio en particular. Las mujeres pueden tener gustos o preferencias diferentes a los hombres. Aun las diferencias en la ubicacin residencial podran reflejar diferencias en gustos y preferencias. Por ejemplo, los autores han observado que los supermercados en la regin noreste de Estados Unidos manejan un surtido proporcionalmente ms grande de ali-mentos italianos que los que se localizan en otras partes del pas. Por otro lado, la variedad y cantidad de comida mexicana en los estantes de los supermercados en el medio oeste, el suroeste y la costa pacfica son sustancialmente ms amplias que en el noreste.

    En ciertos casos, las variables tales como la ubicacin y el gnero que se utilizan en el anlisis de regresin, se deben cuantificar. Esto se hace mediante la creacin de una varia-ble binaria o nula, que toma el valor de 1 si la unidad de observacin cae en una categora en particular, y O si no lo hace. Por ejemplo, podemos asignar el valor de uno a un consu-midor femenino y cero a uno masculino. De esta manera, es posible crear variables nulas para cualquier factor no cuantitativo.

    Una manera til de considerar una variable nula en una ecuacin de regresin es como un factor de "desplazamiento". Por ejemplo, en nuestro anlisis de regresin de la deman-da de pizza por estudiantes universitarios, el coeficiente de la variable nula de ubicacin se estim en -0.54. Suponga que graficamos la ecuacin de la demanda implicada me-diante los valoresproporcionados en la ecuacin (5.13). Esto se ilustra en la figura 5.16. La curva original de la demanda indica la demanda de aquellos estudiantes que asisten a escue-las fuera de las reas urbanas (X4 = 0). Para determinar la demanda de los estudiantes que asisten a escuelas en reas urbanas, asignamos simplemente el valor de 1 a la variable X4

    10De acuerdo con la tabla-t, el valor-t crtico con 22 grados de libertad (n - k- 1, o 27- S) es 2.074. Si se deseara un grado mayor de confianza, el rango del valor esperado para la demanda de pizza obvia-mente se ampliara. Por ejemplo, al 99% de nivel de confianza, el valor-t crtico con 22 grados de liber-tad es 2.819.

    Captulo 5 Estimacin de demanda 203

  • 204

    Ingreso ra 5.1

    Efecto de la variable nula

    Esto nos da la segunda curva de la demanda mostrada en la figura 5.16. En efecto, el cam-bio en X4 ha originado que la curva original se desplace hacia abajo.

    El mtodo de mnimos cuadrados encuentra la mejor relacin lineal entre las variables dependientes e independientes. Sin embargo, en ciertos casos, la teora econmica, la ex-periencia, o la simple observacin de la grfica de dispersin puede llevar a los investiga-dores a sospechar que la relacin entre las variables dependientes e independientes es no lineal. Por ejemplo, suponga que los datos de ingreso (X) y de demanda para comidas en restaurantes (Q0 ) para una muestra de hogares produce el diagrama de dispersin que se presenta en la figura 5.17a. Como podr ver, la dispersin implica una relacin no lineal entre el ingreso y la demanda para comidas en restaurantes. Tales representaciones no lineales son an adecuadas para la estimacin mediante el uso del anlisis de regresin li-neal. Por ejemplo, podramos especificar un modelo de regresin polinomial en el que el trmino independiente, X, se eleve tanto al segundo como al primer grado. La figura 5.17b ilustra esta opcin. Tambin podramos especificar nuestra ecuacin de regresin en trminos de una funcin de potencia. La figura 5.17c ilustra esta posibilidad. En cualquier caso, la idea es la de usar el mtodo de mnimos cuadrados para estimar los coeficientes de las ecuaciones. Las pruebas y estadsticas comunes (prueba-t, prueba-F, R2) se em-plean an.en la evaluacin de los resultados de regresin.

    Cuando utilizamos la funcin de potencia, primero aplicamos una transformacin lo-gartmica a la especificacin original. Por ejemplo, dejemos que la ecuacin original sea como sigue:

    una come en un restauranlc:

  • Qo

    X(Ingreso)

    (a)

    X (Ingreso) X (Ingreso) (b) (e)

    ,. 1""'"~ gura . ., elaciones no lineales

    Si aplicamos el logaritmo a ambos lados de la ecuacin, resulta la siguiente transfor-macin logartmica:

    log o.:.: .. loga +. b logX

    Para desarrollar un anlisis de regresin de este tipo de datos no lineales, primero en-contramos los logaritmos de cada uno de los valores de Y y X en la muestra de datos. Entonces hacemos la regresin de log Y con logX mediante el mtodo de los mnimos cuadrados. Una forma en que se puede evaluar la ecuacin de regresin transformada es la de comparar su R2 con el de la ecuacin lineal simple (esto es, Q0 =a + bX). Si el R

    2 de la ecuacin exponencial transformada es mayor que el de la expresin lineal simple, pare-cer que el modelo no lineal ofrece una mejor explicacin para la varianza de Q0 .

    El uso de la ecuacin logartmica lineal en el anlisis de regresin es particularmente adecuado para los economistas, debido a que para cambios relativamente pequeos en X,

    Captulo 5 Estimacin de la demanda 205

  • el coeficiente estimado del logaritmo de X puede indicar el cambio porcentual en Y relativo al cambio porcentual en x.u En otras palabras, los coeficientes de las variables transforma-das son, de hecho, medidas de la elasticidad punto de la demanda con respecto a cada va-riable. Por ejemplo, si el valor estimado deben la ecuacin anterior fuera 1.2, entonces podramos interpretar inmediatamente a la comida en restaurantes como un producto "superior" debido a que su elasticidad ingreso es mayor que la unidad.

    PRO LEMA EN DEL ANLISIS D IN

    206

    Una exposicin plena de los problemas que pueden surgir en la regresin est ms all de las pretensiones de este captulo y este texto. Como se mencion al comienzo del presen-te captulo, existen textos y cursos completos, desde introductorios hasta avanzados, de-dicados al estudio del anlisis de regresin. No obstante, debemos citar y explicar breve-mente algunos de estos problemas para que los lectores que no estn familiarizados con este tema adquieran una apreciacin de los retos reales que aguardan a quienes desean aplicar el anlisis de regresin a la investigacin econmica y de negocios.

    problema de identificacin El problema de identificacin representa tal vez el mayor reto para quienes utilizan el anlisis de regresin para estimar la demanda de un bien o servicio en particular. A fin de explicar este problema, retornemos a nuestro ejemplo de las pizzas. Suponga que tene-mos datos de series de tiempo relacionados con el consumo per cpita de pizza y con el precio de pizza durante un periodo de 20 aos. La grfica de dispersin de esta informa-cin se presenta en la figura 5.18a. Observe que la dispersin tiende a tener una pendien-te hacia arriba y que la estimacin de regresin de los mnimos cuadrados reflejara este patrn de relacin. Esto significa que los consumidores de pizza se comportan irracional-mente y demandan ms pizza a precios ms altos? El sentido comn evitara esta conclu-sin, pero entonces por qu el coeficiente positivo de la variable de precio en la ecuacin de la demanda? El lector alerta afirmara que lo que hemos identificado como una ecua-cin de la demanda es probablemente alguna clase de ecuacin de la oferta o quiz, el re-sultado del movimiento tanto en la oferta como en la demanda durante los pasados 20 aos. Como se advierte en la figura 5.18b, si la oferta permaneci constante durante los pasados 20 aos mientras la demanda se desplaz hacia arriba (debido a cambios en fac-tores tales como el ingreso, nmero de compradores, gustos y preferencias durante este periodo),la ecuacin de regresin sera realmente un reflejo de la curva de la oferta Or Si la oferta se increment pero la dem~nda se increment ms que la oferta, entonces la esti-macin de regresin sera realmente un reflejo de la interseccin de varias curvas O y D en la figura 5.18c. La figura 5.18d muestra otra posibilidad. En este caso, la oferta se des-plaza ms que la demanda, de manera que la lnea de regresin estimada tiene pendiente hacia abajo y es ms parecida a lo que esperaramos de una curva de la demanda. No obs-tante, esta curva de la demanda estimada es ms plana que las curvas de demanda verda-deras, que se desplazan en forma gradual hacia la derecha con el paso de los aos. Por tanto, el estimador de la regresin de la relacin entre el precio y la cantidad demandada

    U Para una explicacin del significado de los coeficientes en una ecuacin de regresin lineal logartmica, vea el anlisis de matemticas bsicas de la funcin de Cobb-Douglas en el captulo 7.

    Economa de empresa

  • Precio Precio

    (a) (b)

    Qo Qo

    o3

    X , . D2 D2

    Dl

    Precio Precio

    (e) (d)

    Figura 5.18 El problema de identificacin

    estara sesgado en el sentido de que podra indicar una elasticidad precio mucho mayor de la que en realidad existe en la poblacin de consumidores de pizza.

    Existen tcnicas de estimacin avanzadas, tales como los mtodos de mnimos cuadrados de dos etapas y mnimos cuadrados indirectos, que ayudan al investigador a tratar con muestras en las que los desplazamientos simultneos de la oferta y la demanda tienen lugar. Esen-cialmente, estas tcnicas implican la consideracin simultnea de las ecuaciones de la oferta y la demanda con el uso de una sola ecuacin de regresin. La descripcin de estas tcnicas est fuera del alcance de este texto. Pero el punto principal a recordar es que si la identificacin del problema no se reconoce y se trata por el investigador, el mtodo de los mnimos cuadrados ordinarios dar como resultado estimaciones sesgadas de los coefi-cientes de regresin.

    Captulo 5 Estimacin de la demanda 207

  • 208

    Uno de los principales supuestos hechos en la construccin de la ecuacin de regresin mltiple es que las variables independientes no estn relacionadas entre s en ninguna forma sistemtica. Si esta suposicin es incorrecta, entonces cada uno de los coeficientes estimados podra dar una visin distorsionada del impacto del cambio en cada una de las variables independientes. Por ejemplo, suponga que un modelo de regresin expresa que la demanda de automviles de lujo y fabricados en el extranjero depende del precio, ingre-so y educacin. La ltima variable se incluye debido a que la educacin es un sustituto pa-ra gustos y preferencias, y se establece la hiptesis de que las personas con altos niveles educativos tienen una preferencia mayor por los carros extranjeros de lujo. Pero, como us-ted esperara, la educacin y el ingreso estn asociados estrechamente. Si sus valores tien-den a moverse hacia arriba y abajo juntos, el mtodo de los mnimos cuadrados podra asignar arbitrariamente un valor alto al coeficiente de una variable y un valor de coefi-ciente bajo a la otra. En efecto, si las dos variables estn asociadas estrechamente, se vuel-ve difcil separar el efecto que cada una tiene sobre la variable dependiente. La existencia de tal condicin en el anlisis de regresin se denomina multicolinealidad.

    Si los resultados de la regresin pasan la prueba-F (la medicin de la significancia esta-dstica global de la ecuacin de regresin) pero no pasan la prueba-t para cada uno de los coeficientes de regresin individual, generalmente es un signo de que se presenta multico-linealidad en los datos muestrales. La multicolinealidad se puede detectar tambin al exa-minar el coeficiente de correlacin entre dos variables que se sospecha estn relacionadas estrechamente.12 Como regla emprica, los coeficientes de correlacin de 0.7 o mayores pro-porcionan una base a los investigadores para sospechar la existencia de multicolinealidad.

    Si la multicolinealidad es un problema serio en el anlisis de regresin, tender a intro-ducir un sesgo hacia arriba a los errores estndar de los coeficientes. Esto tender a reducir los valores-t (los que, como usted recuerda, se calculan usando los errores estndar de los coeficientes). Esto hace ms difcil rechazar la hiptesis nula y, por supuesto, identificar las variables independientes estadsticamente significativas en el modelo de regresin.

    Se debe sealar, sin embargo, que si el investigador simplemente desea usar los coe-ficientes estimados de regresin como base para pronosticar valores futuros en la variable dependiente, la multicolinealidad no representa un problema serio. Es slo cuando el in-vestigador desea entender ms acerca de la estructura subyacente de la funcin de la de-manda (esto es, cules son las determinantes clave de la demanda) que este problema es-tadstico en particular debe resolverse. La mayor parte de los paquetes de software producen automticamente una matriz de coeficiente de correlacin para el conjunto en-tero de variables independientes utilizadas en la ecuacin de regresin. Un remedio es-tndar para la multicolinealidad es el de eliminar una de las variables que est asociada estrechamente con otra variable en la ecuacin de regresin.

    Autocorrelacin

    La autocorrelacin es un problema que se encuentra generalmente cuando se utilizan datos de series de tiempo. Por esta razn con frecuencia se denomina correlacin serial. Utilicemos el caso de la regresin simple, que implica slo la variable dependiente Y y una variable independiente, X. Esencialmente, la autocorrelacin ocurre cuando la variable Y se relaciona

    12El coeficiente de correlacin es un medicin del grado de asociacin entre dos variables. Esta medicin, denotada como r, vara de un valor de -1 (correlacin negativa perfecta) a 1 (correlacin positiva perfecta).

    Economa de empresa

  • y

    Figura 5.19 Autocorrelacin

    (a)

    X Tiempo (b)

    con la variable X de acuerdo con cierto patrn. Por ejemplo, en la figura 5.19a, la grfica de dispersin revela que al incrementarse X (presumiblemente durante el tiempo), el va-lor Y se desva de la lnea de regresin de una forma muy sistemtica. En otras palabras, el trmino residual, o la diferencia entre el valor observado de Y y el valor estimado de Y dado X(Y) se alterna entre un valor positivo y negativo de aproximadamente la misma magnitud a travs del rango de los valores X. De hecho, si graficramos estos residuos por separado, tendran el patrn mostrado en la figura 5.19b.

    Una posible causa de autocorrelacin es que existen efectos en Y que no explican las variables incluidas en la ecuacin de regresin. Tambin puede deberse a que la relacin verdadera entre Y y la(s) variable(s) independiente(s) es no lineal. Pero sin importar la ra-zn, si se presenta la autocorrelacin en el anlisis de regresin, se crea un problema para la validez de la prueba-t. Dicho de forma simple, la autocorrelacin tiende a incrementar la probabilidad de que la hiptesis nula sea rechazada. Esto se debe a que la autocorrelacin da un sesgo hacia abajo al error estndar del coeficiente estimado de regresin (EE;). Al recordar que el valor-t se define como (b - b) /EE;, podemos ver que un EE; ms pequeo tender a incrementar la magnitud del valor-t, al permanecer constantes otros factores. Por tanto, en la presencia de autocorrelacin, los investigadores pueden declarar que ciertas variables independientes tienen un impacto estadsticamente significativo en la variable dependiente cuando de hecho no lo tienen. Desde el punto de vista de las polticas, su-ponga que el coeficiente estimado de la variable de publicidad en un modelo de regresin de demanda pas la prueba-t cuando no tena que hacerlo realmente. Una empresa en-tonces quiz incrementara los gastos en publicidad cuando de hecho debera buscar otras formas de expandir la demanda (a travs de promociones, canales de distribucin alternativos o acciones sobre precios).

    Puede resultar difcil identificar la autocorrelacin mediante la simple observacin del patrn de los residuos de una ecuacin de regresin. Una prueba estndar para identi-ficar la presencia de este problema es la prueba de Durbin-Watson. La estadstica de Durbin-

    Captulo 5 Estimacin de la demanda 209

  • Watson (DW) se calcula rutinariamente en los paquetes de software de regresin y se pre-senta automticamente en el ejemplar impreso de la computadora. Como en el caso de la prueba-t y de la prueba-F, existe un tabla de Durbin-Watson que lista los valores crticos de esta estadstica para un nivel dado de significancia (generalmente el nivel 0.05). He-mos incluido dicha tabla en el apndice en la parte final de este texto (vea tabla C.5). Como regla emprica, si la estadstica DW est alrededor de 2, hay mucha probabilidad de que no se presente autocorrelacin en los datos. Pero si la estadstica DW indica la presencia de autocorrelacin, existen ciertas cosas que un investigador puede hacer para corregir el problema. Esto incluye la transformacin de los datos en un orden diferente de magnitud o la introduccin de datos adelantados o rezagados en las series de tiempo.

    APLICACIN INTERNACIONAL: ALIMENTOS EN ESPAA, CIGARROS EN TAIWN ------------------------------------~'-"'''"~ L~, \~

    210

    Es algo difcil obtener los resultados reales de regresin en la demanda del consumidor por parte de compaas tales como ACNielsen e IRI, o de grupos de investigacin de mer-cado de los principales fabricantes de bienes de consumo. Sabemos que la regresin es una herramienta til para estos investigadores, pero desafortunadamente, todos sus estu-dios estn patentados. Los lectores debe