Predictores e indicadores de la fortuna de 82 familias rurales en Bio Bio, Chile



I. Introducción

Este artículo pretende ser un aporte pues no existe material publicado en el contexto nacional de las ciencias sociales en especial en el campo de la economía colonial en Chile que aborde directamente la relación entre las fortunas de padrones o matrículas de estratificación socioeconómica de familias y estadística multivariada. El presente estudio –basado en la tesis y un artículo del autor (Álvarez, 1997) se fundamenta en la "Matrícula de los vecinos con expresión de sus mujeres, hijos, familias, y bienes" donde se registran 638 familias rurales de Perquilauquén de 1754 de la región del Bío-Bío de Chile que se encuentra en el Archivo Nacional de Chile (Capitanía General de Chile. 1754, volumen 938:145-176). Además, se emplea información esencial de los archivos judiciales y notariales de Talca, Cauquenes, San Fernando, por la proximidad a Perquilauquén o San Carlos, Chillan. Los archivos de Chillan, San Carlos, Quirihue, que deberían ser los más adecuados por la zona, no se ocupan pues no existen cercanos al año 1754. El problema básico es: ¿Cuáles son los predictores o variables más significativas estadísticamente hablando que influyen en el logro de la fortuna de cada familia?. La solución es aplicar un Análisis factorial y de un Análisis de regresión múltiple de predictores e indicadores de la fortuna de 82 familias rurales –depuradas estadísticamente, pues se eliminan los indigentes y marginales. Aquí, se habla de familias nucleares rurales, entendida esta como la constitución del supuesto esposo, esposa e hijos si los hay. Son ocho listas o "poblaciones" de familias detalladas más adelante. En la recogida de los datos nos encontramos con algunas imprecisiones, errores, todos intencionados o no. De hecho, se confiesa poseer menos bienes por temor a exacciones por parte del estado. Por lo tanto, los datos descriptivos finales en los anexos tienen aproximaciones a veces –por ejemplo, 2 fanegas por 1 fanega más 8 almudes-, pues se trató de aprovechar todo, aunque una vez subsanados en general se esmeró en la estricta precisión en el análisis factorial y regresión múltiple. El padrón señala por familia: la cantidad de animales –ganado mayor: caballos, vacas, mulas y ganado menor: cabras, ovejas-, yuntas, y se agrega la cantidad de hijos, y la variable construida artificialmente por nosotros del tamaño de la familia, todas las cuales son las variables independientes o predictores que son sumadas al ser convertidas en pesos y reales de la época, y por ultimo, también se construye artificialmente y agrega la variable dependiente o indicador que es la fortuna de la familia, también expresada y convertida en pesos. En todo caso, se aprecia que son familias rurales de modesta condición socioeconómica. Se realiza un ensayo estadístico a una muestra de 82 familias con las siete variables: tierra (1), ganado mayor (2), ganado menor (3), yunta (4), hijos (5), tamaño familiar (6), fanegas (7), y la variable dependiente fortuna, donde se destaca la fanega de siembra de trigo como variable independiente a probar. El resultado final son los datos cuantitativos expresados en sus promedios, desviaciones estándares y los resultados del Análisis Factorial y del Análisis de Regresión Múltiple. Aquí no interesa cuáles son las familias más acaudaladas o las más pobres, quién tiene más tierras, sino qué variables –la tierra, los caballos, las vacas, las mulas, las cabras, etc.- aportan significativamente desde el punto de vista estadístico para que tiendan a ser más ricas o prosperas, por lo menos consideradas estáticamente en el año de 1754. ¿En este contexto, se puede predecir una fortuna familiar?. Creemos que si. La solución es aplicar instrumentos o técnicas estadísticas multivariadas -ya probadas en diversos campos- cuales son el Análisis Factorial y del Análisis de Regresión Múltiple. De Perquilauquén se ha escrito poco o casi nada. El único texto (Pinto, 1986:121) encontrado señala específicamente a Perquilauquén en su ubicación geográfica, mapa, auto de visita, donde se señala el curato y doctrina de Perquilauquén. Descripción: Tiene de longitud el distrito de este curato de Perquilauquén, cuyo titular es el glorioso San Antonio de Padua, norte sur, desde el río de Longaví hasta el de Ñuble, diez y seis a veinte leguas; y de latitud este a oeste, otras tantas. Hállanse dos capillas; la principal arruinada, a orillas de Perquilauquén, y la otra en el paraje nombrado Curipemu, que es vice parroquia, y a orillas de Ñuble otra más al cuidado del indio cacique de Cocharcas. La feligresía de este curato entre el río de Perquilauquén y Ñuble, gente española son dos mil seiscientas treinta y una persona y de indios trescientos cincuenta y dos, entre Perquilauquén y Longaví, se hallan dos mil seiscientas noventa y cuatro, y doscientas setenta y seis indios que en el todo componen el número 5.953 almas, según la matricula exhibida en la presente Visita…" Se indica que Perquilauquén era un antiguo curato del obispado de Concepción. Pertenecía al corregimiento de Chillán, que tenía dos curatos: el de Chillán y el de Perquilauquén. En la cabecera del curato fundó el gobernador Ortiz de Rozas en 1754 la villa de Nuestra Señora de la Candelaria. Nuevamente erigida en 1800 por el gobernador interino Joaquín del Pino, tornó el nombre de San Carlos.

II. Objetivos

El objetivo general es estudiar la influencia estadística de las variables independientes de la posesión de las cuadras de tierra, ganado mayor –caballos, vacas, mulas-, ganado menor –ovejas, cabras-, las yuntas de animal, la cantidad de hijos, el tamaño del grupo familiar, las fanegas de trigo sembrado que determinan el logro de la variable dependiente fortuna de 82 familias de Perquilauquén de 1754 de la región del Bío-Bío de Chile.

El objetivo específico n°1 es determinar las características descriptivas de las variables de las cuadras de tierra, ganado mayor, ganado menor, las yuntas de animal, la cantidad de hijos, el tamaño del grupo familiar, las fanegas de trigo sembrado y la fortuna de cada familia de la muestra intencional de 82 familias de Perquilauquén de 1754 de la región del Bío-Bío de Chile a través de un análisis estadístico de la planilla Excel, caso a caso, de la media aritmética y la desviación estándar expresada en pesos y en cantidad real. El objetivo específico n°2 es determinar el número y la contribución de los factores que justifican la intercorrelación significativa entre las cuadras de tierra, el ganado mayor, el ganado menor, las yuntas, la cantidad de hijos, el tamaño del grupo familiar, las fanegas de trigo sembrado y la fortuna a la muestra indicada de Perquilauquén de 1754 de la región del Bío-Bío de Chile a través de la matriz de correlación, de un Análisis Factorial, y una validación anexa de éste, expresada en pesos y en cantidad real. El objetivo específico n°3 es determinar el aporte predictivo de las variables independientes de las cuadras de tierra, ganado mayor, ganado menor, las yuntas, las fanegas de trigo sembrado, la cantidad de hijos, el tamaño del grupo familiar sobre la fortuna a la muestra señalada de Perquilauquén de 1754 de la región del Bío-Bío de Chile a través de un Análisis de Regresión Múltiple, expresada en pesos y en cantidad real.

III. Diseño y metodología

El estudio corresponde a un diseño multivariado que:"comprenden dos o más variables independientes y una sola variable dependiente" (Himmel y Maltes, 1981:2); no experimental: "aquello que se realiza sin manipular deliberadamente las variables independientes; se basa en variables que ya se dieron en la realidad sin la intervención directa del investigador" (Hernández et. al., 1991:204); de tipo transversal, pues:"se centra en describir las variables y analizar su incidencia e interrelación en un momento dado correlacional/causal " y de tipo correlacional/causal se define como:"aquellos cuyo objetivo es describir relaciones entre dos o más variables en un momento determinado" (191); ex post facto, definido como:"cuando los hechos y variables ya ocurrieron" (195). Metodología Se obtiene la información esencial del padrón de 638 familias rurales de Perquilauquén de 1754 de la región del Bío-Bío de Chile ya señalado. Además, se recaba información importante y complementaria de los Archivos Judiciales y Notariales de Talca, Cauquenes, San Fernando. Se aplica un Análisis Factorial y de Análisis de Regresión Múltiple de predictores e indicadores de la fortuna de 82 familias rurales –depuradas estadísticamente, pues se eliminan los indigentes y marginales. Se aplica a dicha muestra con siete variables independientes: tierra, ganado mayor, el ganado menor, yunta, cantidad de hijos, tamaño familiar, fanegas, y la variable dependiente fortuna o riqueza total de la familia. Criterios de especificación de las variables Las muestras históricas casi siempre tienen errores, imprecisiones, ambigüedades. La nuestra posee datos faltantes inevitables a veces, pues no todas las familias tienen hijos. El tamaño y la fortuna están completas. Es decir, como supuesta distribución estadística normal no todas las 82 familias definitivas poseen todas las variables completas con los datos respectivos. Por ejemplo, una familia tiene tierras, vacas, y no tiene cabras. Para el proceso estadístico asignamos un valor numérico determinado a la categoría definida de una variable y un cero (0) a las demás que señalan la inexistencia del bien. De la muestra de 82 familias los datos faltantes o error de las siete variables independientes son: los hijos, solo hay 15 (18.3%) familias sin hijos y 67 (81.7%) con hijos; el tamaño familiar y las fanegas están completas; tierra, hay 26 (31.7%) familias con datos y 56 familias (68.3%) dicen no tener tierras, aunque seguramente arriendan o viven con familiares o mienten; la yunta, hay 33 (36.6%) familias sin yuntas, seguramente arriendan y 49 (63.4%) con yunta propia; el ganado menor, hay 30 (36.6%) familias sin estos y 52 (63.4%) poseen; el ganado mayor, hay sólo 3 (3.7%) familias sin estos animales, los cuales son más necesarios, y 79 (96.3%) los poseen. Respecto de los datos faltantes, se indica que si "un sujeto en una encuesta no responde a la pregunta 1 pero responde a las preguntas 2 y 3, la correlación entre las variables 1 y 2 y 1 y 3 se basa en la menor observación que hubiera podido obtenerse si el sujeto hubiera respondido la pregunta 1, pero la correlación entre las variables 2 y 3 no es afectada" (Nunnally y Bernstein, 1995:138). O sea, se compensan de alguna manera los datos completos con los datos faltantes. Es evidente que se pueden haber omitido otras variables más importantes que influyan en la fortuna. Esto se llama el sesgo de variables omitidas. Una pregunta fundamental es: ¿Por qué estas variables? Simplemente porque son las que se presentan en las listas de poblaciones de familias. Ahora bien, ¿Por qué estas variables se convierten en la moneda de pesos de 1754 y no se toman como tal –o sea, por ejemplo, 20 cuadras de tierra- para hacer el análisis estadístico?. Por una decisión personal de procesar todos los datos en la misma moneda de pesos nivelando todas las variables comprometidas. Así, los cálculos son más viables y parejos al estar medidos y evaluados en las mismas unidades. Por lo tanto, se crea artificialmente una nueva variable: la fortuna económica (más hijos y tamaño) de cada familia que es la sumatoria de todos los bienes o recursos económicos y no económicos de todas las otras variables. Para simplificar el análisis las variables fueron agrupadas: los animales mayores en el ganado mayor y los animales menores o pequeños en el ganado menor para simplificar el número de variables. Las variables independientes –excepto los hijos y tamaño que son expresión simple de la cantidad bruta- representan una expresión numérica de la conversión a dinero de esa época (año 1754) en pesos finalmente de su valor económico. La moneda del real o moneda de plata se transforma a pesos, la moneda principal. El criterio de conversión[1]es que el real vale 0.25 pesos, o la cuarta parte del peso. Todos los cálculos de los bienes o recursos económicos o variables independientes –en los asientos originales hay errores- se basan en los datos de los archivos notariales y judiciales señalados. Las variables independientes, todas expresadas en pesos, excepto hijos y tamaño que son expresadas numéricamente, son:

X = 1 Las cuadras de tierra (TIERRA).

X = 2 El ganado mayor (GMAYOR): las vacas, los caballos, las mulas.

X = 3 El ganado menor (GMENOR): las ovejas, las cabras.

X = 4 Las yuntas (YUNTA) de animales u otro animal.

X = 5 La cantidad de los hijos (HIJOS).

X = 6 El tamaño de la familia (TAMAÑO).

X = 7 Las fanegas (FANEGA) de trigo sembradas Variable Dependiente o Indicador Se refiere a la fortuna de cada familia expresada en pesos como la sumatoria de todos sus bienes económicos (tierra, yunta, animales, fanega) y/o no económicos (cantidad de hijos y tamaño familiar) de Perquilauquén de la región de Bío-Bío de Chile.

Y =1 La fortuna (FORTUNA) de cada familia. Fundamentos de elección del criterio de los bienes/recursos: En base a la revisión de los Archivos Judiciales y Notariales ya señalados se captura la mayor cantidad de datos representativa pero cercana al año de 1754. Así, nuestros datos oscilan entre 7 y 26 precios por cada bien. Luego, se dividen obteniendo la media aritmética precisa, aunque no necesariamente aproximé, pues traté de cuidar la exacta cifra original. El problema estadístico es cómo decidir que promedio elegir por cada bien de manera que sea representativo de la muestra -ésta definida como:"toda parte representativa de un conjunto, población o universo, cuyas características debe reproducir en pequeño lo más exactamente posible" (Sierra, 1991, 330), pues además tenemos como otros indicadores las medidas de tendencia central y de dispersión: la moda y la mediana. Entonces, debemos considerar si la muestra de 82 familias es una distribución simétrica o no. Nuestros resultados estadísticos señalan que efectivamente no es simétrica. Nuestra variable fortuna concuerda con lo que señala Sierra, citando a Mueller (1970, 142: Statiscal reasoning in Socioloy. Boston), que muchos datos sociológicos –salarios, tamaños de ciudades, de familias, etc- son fuertemente asimétricos. Sin embargo, se indica que "la media como estadística de intervalo o de razón da una medición más exacta que la mediana o el modo y es la más estable" (Ary, Cheser y Razavieh, 1994:107). Por supuesto, se agrega la desviación estándar en la descriptiva para consolidar científicamente el proceso. Así, se toman los años más cercanos a la base de 1754 de la matricula de nuestro padrón investigado por sus representatividad en el tiempo. Ahora, dependiendo del bien y la representatividad de este, si hay pocos datos para tomar más variedad (y no caer estadísticamente en la homogeneidad) se toman datos relativamente antes y/o después de 1750, aunque si hay más y variados datos dentro del lapso de 1750 se prefieren estos. Se promedian y se dividen por el número de casos. En resumen, el criterio promedio final de cada bien o recurso económico y el precio respectivo es: Ovejas: $0.6 pesos[2]Cabras: $0.8 pesos[3]Vacas:$3 pesos[4]Yuntas: $14.5 pesos[5]Yeguas: $2.7 pesos[6]Caballos:$4 pesos[7]Tierra: $3.4 pesos por cuadra[8]Mulas: $3.5 pesos[9] A veces, los criterios no son seguidos -1a, 1b, etc-, porque no existen tales fuentes. Las fuentes y siglas son AJCT=Archivo Judicial Civil de Talca; ANSF=Archivo Notarial de San Fernando; AJCC=Archivo Judicial Civil Cauquenes; AJCSF=Archivo Judicial civil de San Fernando; l.=legajo; s.=sin; p=pieza.

La población y la muestra La población o el universo la constituyen todos -declarados u omitidos- los vecinos de Perquilauquén que constituyan familias en la zona. La muestra intencional -defininida como: "muestra no probabilística o intencional donde la elección de los elementos depende ciertos criterio del investigador" (Hernández et. al., 1991:213)- es de 638 familias, fs. 145-175v, pero se trabaja en definitiva con 82 familias depuradas estadísticamente de Perquilauquén de la región del Bío-Bío. La muestra de 82 familias, parece pequeña y criticable; en efecto, se afirma del tamaño de la muestra que "cuanto mayor el tamaño muestra, mayor será la probabilidad de encontrar un coeficiente de correlación similar en otras muestras, y en la población general como un todo" (Rowntree, 2005:8). Sierra, indica citando a Blalock (1966,160), que éste afirma que es grande siempre o casi siempre una muestra de N >100.y también de N>50 si se tiene evidencia empírica de que la desviación de la población en relación a la normalidad no es importante. Sigue, por el contrario, una muestra de N<30 debe estimarse siempre como pequeña salvo que se esté seguro de la normalidad aproximada de la población. La ventaja de la muestra intencional es "su utilidad, su controlada elección de sujetos con ciertas características" (Hernández et. al., 1991:231). Una crítica a toda muestra intencional, o no aleatoria, es que es sesgada, pero para suavizar tal crítica se puede defender asimismo que toda muestra contiene inevitablemente sesgos. La muestra de vecinos seleccionados depende de dos condiciones: por un lado, que los lugares o pueblos presenten un número suficiente de familias radicadas y por otro lado, estadístico, esto es, que las variables independientes medidas presenten un mínimo de 10 sujetos o datos por variable (Frías-Navarro y Soler, 2012:48), donde unos dicen 5 datos o sujetos por 1 variable;10 por 1 y 20 por 1, o familias por variable independiente o predictor. En nuestro caso, se cumple la condición o no hay problema, pues tenemos 82 sujetos. Aquí, la muestra comprende ocho "listas de poblaciones" de familias: Lista 1: (fs. 145v-149v), de 96 familias de don José Ayala; Lista 2: (fs. 149v-151) de 19 familias con sitio en la ciudad de Chillán y en la de Concepción; Lista 3: (fs.151-154v.) de 72 familias de don Miguel Candia; Lista 4: (fs154v.-158) de 74 familias consignadas en su mayoría con fanegas –más otros dispersos en otras listas;las otras listas prácticamente no señalan plantaciones de fanegas- de don Felipe Caro; Lista 5: (fs.158-162) de 76 familias de don Juan Antonio Arias; Lista 6: (fs.162-166) de 71 familias de don Juan Contreras; lista 7: (fs.166-171) de 107 familias del capitán don Marcelo Ortega; Lista 8: (fs.171-175v.) de 122 familias del capitán don Manuel morales.

IV. Análisis y procesamiento de datos

El análisis y procesamiento de los datos se lleva a cabo esencialmente mediante el software estadístico denominado Systat, versión 5.0, 1990-1994 por S. P. S. S., para analizar los datos con las técnicas del Análisis de Regresión Múltiple, modalidad Step-wise o paso a paso –éste definido como:"un procedimiento en el que las variables independientes entran o salen del modelo dependiendo de su significación" (Martínez, 2001:12), y el Análisis Factorial, modalidad Varimax. También, alternativamente se emplea el software denominado Minitab, versión 16, obteniendo resultados similares sino idénticos, y el Excel de Microsoft. El análisis de los datos se realiza conforme a los tres objetivos específicos: 1. Análisis Descriptivo, mediante el uso de la planilla Excel, caso a caso. 2. Análisis de Regresión Múltiple, modalidad Step-wise. 3. Análisis Factorial, modalidad Varimax. En lo esencial, en el Análisis de Regresión Múltiple, se asume que "se cumple unos supuestos que se deben verificar en el ajuste de un modelo de regresión: la homocedasticidad –varianza semejante entre las variables-; la ausencia de autocorrelación y de multicolinealidad –entre las variables-, como condiciones básicas para que los estimadores o predictores sean eficientes, lineales, consistentes, insesgados para hacer confiable la estimación de (Y) o fortuna" (Kazmier, 1991: 270, 282, 285), Kazmier señala que las únicas limitaciones asociadas con el Análisis de Regresión Múltiple son los temas de la multicolinealidad y la autocorrelación, la cual no interesa aquí. La colinealidad se refiere cuando las variables independientes de un análisis múltiple regresión están correlacionadas entre si –lo cual se percibe al ser relativamente altas, positivas o negativas, las correlaciones-, entonces los coeficientes de regresión parcial son poco confiables en términos de significado. Asimismo, se cuestiona los coeficientes de correlación parcial. Según Kazmier, un coeficiente de correlación significativo no necesariamente indica causalidad, sino que puede simplemente indicar una asociación común con otros eventos. Una correlación "significativa" (comillas del autor) no es necesariamente una correlación importante. En una muestra grande, una correlación de r= +0.10 puede ser significativamente diferente de 0 al nivel de alfa=0.005 o nivel de significancia del 5% de error. Y la interpretación de los coeficientes de correlación y de determinación se basa en el supuesto de una distribución normal bivariada para la población y, para cada variable, de igualdad de varianzas condicionales. De los coeficientes de correlación se indica que:"en cuanto a la significación de los coeficientes de asociación, aunque no existe una norma valida para todos los casos, pues tal significación, no depende solo de su tamaño, se admite que su significación es la siguiente: + 0.70 muy fuerte;+ 0.50 a 0.69 sustancial;+ 0.30 a 0.49 moderada;+ 0.10 a 0.29 baja;+ 0.01 a 0.09 despreciable" (Sierra, 1994:506).

Los pasos a seguir (Morales, 2005: 223), que nosotros cumplimos, en un Análisis de Regresión Múltiple son seis:

1. Ajustar el modelo de regresión con algún software estadístico. O sea, usar alguno.

2. Analizar la significancia estadística de los parámetros a través de un Anova, análisis de varianza, para la regresión. O sea, analizar si los coeficientes son positivos o no.

3. Diagnóstico del modelo. Hay que probar la normalidad -los errores siguen una distribución normal-, homocedasticidad -varianza de los errores es constante- e independencia –las observaciones son independientes. En la práctica se asumen simplemente que se dan.

4. Calcular los criterios de bondad de ajuste. O sea, el coeficiente de Determinación R², y el coeficiente de Determinación R² ajustado y el Error Estándar de Estimación –éste indica el error probable que se comete al estimar la variable dependiente mediante un modelo en particular. O sea, analizar si los coeficientes son significativos o no.

5. Calcular los criterios de bondad de predicción. Todos estos indicadores generados en el reporte final de los análisis: 1. El Error Cuadrático Medio –un modelo es bueno cuando el ECM es cercano a cero; 2. Diferencia agregada –como medida de sesgo, un valor positivo indica que el modelo subestima el verdadero valor y un valor de DIFA negativo indica una sobrestima del verdadero valor; 3. El Error Medio Absoluto –como medida de error, un modelo es bueno si este es cercano a cero. Analizar su significancia.

6. Chequear el nuevo modelo con una muestra independiente –realizado en una muestra de Chillán de 1737, en nuestro estudio.

Por último, respecto del alcance de la predicción, se señala que "en la ecuación de regresión múltiple un objetivo relevante es llegar a la ecuación de predicción más efectiva" (Walpole, 1990:437 y ss.). En efecto, Walpole, indica que la calidad de la respuesta estimada de Y, en nuestro caso fortuna, es importante. Por otro lado, se indica que necesariamente la predicción de la fortuna de las familias implica su análisis como un concepto a corto plazo (Himmel y Maltes, 1979:35) –ciertamente sugerimos nunca más de un año probable-, o sea, aquí por lo menos tomemos el año temporal de plantación y mantención de los bienes/productos agrícolas. El tema y/o problema es qué variables son mejores parcialmente para optimizar en mejor grado probabilístico la producción de la empresa o sistema agrícola del campo chileno, qué contexto es el más adecuado para tales siembras, etc. Ahora bien, la fortuna o indicador tiene como propósito proporcionar un índice de la capacidad económica que poseen las familias. A partir de este índice se puede inferir, en términos de probabilidad estadística, el comportamiento futuro. Sin embargo, ello no implica que cada uno de los factores –tierra, animales, yunta- que componen la capacidad económica sea tan constante que no experimente ningún cambio en ese lapso. Significa más bien que los cambios observados no son repentinos sino que ocurren dentro de ciertos límites que pueden ser determinados previamente. Aquí, se puede tomar en sentido general que la estabilidad de los factores de producción se entiende como la presencia relativamente invariante en el tiempo de un rasgo o más en un sujeto o entidad. Este argumento de la estabilidad señalada es el que permite hacer juicios predictivos.

Análisis Factorial Exploratorio, modalidad Varimax. En lo esencial, se recomienda el análisis factorial tipo exploratorio como un método complementario para la solución del problema de multicolinealidad del modelo de regresión, pues explica cuáles de las variables predictoras están correlacionadas. Para validar preliminarmente el modelo es necesario realizar una matriz de correlaciones entre las variables de la relación entre las variables, que indicarán el grado y la forma de relación existente entre ellas, la cual podría ser positiva (o negativa) lineal (o no lineal); mientras más se acerca su valor a –1 y +1 mayor será su relación y cuando se acerque a cero, ello indica; su escasa vinculación. Se afirma respecto del número de sujetos en el análisis factorial, que "no existe un criterio o norma definitiva sobre el número de sujetos necesario" (Morales V., 2010:8). En principio, son preferibles muestras grandes porque el error típico de los coeficientes de correlación será menor. Hay que tener en cuenta dos criterios: 1) La proporción de sujetos con respecto al número de variables (o ítems). 2) El número mínimo recomendable de sujetos en términos absolutos. Un criterio que puede considerarse como mínimo es: 2. a) Que el número de sujetos sea el doble que el número de variables. 2. b) Que la muestra no baje de unos 100 sujetos, (Kline 1986, 1994) aunque el número de variables sean muy pocas. Otros autores recomiendan utilizar una muestra 10 veces mayor que el número de variables o ítems (N = 10k;Nunnally, 1978; Thorndike, 1982). Una orientación más segura es que el número de sujetos no baje de 200 y que al menos haya 5 sujetos por ítem. Independientemente del número de sujetos por variable, la recomendación de Beavers y otros (2013) es que la muestra inicial sea al menos de 150 sujetos después de eliminar los outliers (residuos) o sujetos con puntuaciones muy extremas. A su vez, agregan respecto de otro tema importante cual es "decidir el tamaño de la muestra con el objetivo de facilitar un adecuado funcionamiento de la técnica estadística del análisis factorial exploratorio" (Frías-Navarro y Pascual Soler, 2012: 47 y ss.). Señalan que hay diversidad de opiniones. Citan a Hair, Anderson, Tatham y Black (2004) que éstos afirman que nunca se debe realizar el análisis con una muestra inferior a 50 observaciones, siendo preferible trabajar con 100 o más unidades. Otros, siguen citando, opinan que la muestra nunca debería ser inferior a 100 (Gorsuch, 1983; Kline, 1994). Guilford (1954) recomienda un tamaño de muestra mínimo de 200 casos y Cattell (1978) opinaba que un N o muestra entre 200-250 casos sería aceptable aunque proponía 500 como un buen tamaño muestral. De Winter, Dodou y Wieringa (2009) señalan que un N=50 es un valor mínimo razonable. De la proporción de número de casos por variable medida no existe acuerdo entre los investigadores, antes ya señalado. Gorsuch (1983) sugiere una proporción de cinco sujetos por variable medida, pero Nunnally (1978) y Everitt (1975) proponen una relación de 10 sujetos:1 mientras que Hair, Anderson, Tatham y Grablowsky (1979) opinan que debería ser de 20 sujetos:1. En relación al criterio de raíz latente, se señala que "se escoge utilizar un porcentaje de varianza explicado que esté en torno al 60%, valor admitido habitualmente en ciencias sociales" (Morales V., 2010:21). Existen diversos criterios para determinar el número de factores a conservar. Uno de los más usados es la regla de Kaiser: "conservar aquellos factores cuyos valores propios (eigenvalues) son mayores a la unidad" (Salvia, 2014:18). Confirman (Nunnally y Bernstein, 1995: 542), este criterio de aceptar mayor o igual a la unidad o 1. Se extrema al señalar que hay que eliminar las variables con cargas factoriales bajas: aquellas por debajo de 0, 25 (Salvia, 2014: 24). Se indica de los criterios (Morales V., 2010: 16, 21) para valorar la magnitud de las correlaciones variable-factor que los pesos de las variables que definen un factor se interpretan como los coeficientes de correlación de cada variable con cada factor. Podemos valorar estos coeficientes como cualquier otro coeficiente de correlación (con N =100 una correlación de 0.20, más o menos, ya es estadísticamente significativa). Morales V., indica que aunque no hay un valor óptimo de referencia, desde el punto de vista de la relevancia se considera un valor en torno a 0.30 como mínimo (explica aproximadamente el 10% de la varianza); en torno a 0.40 ya es más relevante, y valores en torno a 0.50 son de relevancia práctica. El tamaño de la muestra y el número de variables (o ítems) también son datos que hay que tener en cuenta para valorar estos coeficientes. En general, a mayor número de sujetos los coeficientes pueden ser menores, aunque no deben ser inferiores a 0.30, para tenerlos en cuenta como representativos de un factor (Kline, 1994) o entre 0.30 y 0.35 (Spector, 1992, Costello y Osborne, 2005). Un criterio puede ser éste: con N= 100, podemos considerar valores relevantes los que están en torno a 0.50, con N= 200 nos bastan valores de 0.40 y con 300 sujetos 0.30 es suficiente; éstos valores son orientaciones. También tiene que ver el número de variables: a mayor número de variables y factores, se aceptan valores menores. Cuando hay muchos factores, los ítems o variables que definen los últimos factores deben tener pesos mayores para considerarse. Respecto de la proporción de varianza explicada por los diversos factores señala que "frecuentemente nos encontraremos con una aceptable proporción total de varianza explicada por los factores que oscila entre el 50 y 60%" (28), aunque otros proponen una varianza explicada en torno al 75%, 80% como resultado satisfactorio (De la Fuente, 2011:13). Por último, se afirma, que "las cargas factoriales iguales o mayores que 0.40 (algunas veces 0.30, otras veces otro criterio) se consideran lo bastante grandes como para ameritar su interpretación" (Kerlinger, 1985:189).

V. Resultados e interpretación

Muestra de 82 familias de Perquilauquén Objetivo n°1: Análisis Descriptivo en pesos y cantidad real Tabla n°1 Descriptiva y Desviación Estándar de predictores e indicadores

PREDICTORES E INDICADORES

DESCRIPTIVA PESOS Total, promedio, desviación estándar

DESCRIPTIVA CANTIDAD Total, promedio, desviación estándar

1. Tierra (cuadras) *

$28.281= total; $345 ap. prom.; $1.136= ap. d.s.

8.318 total; 101 prom.; 342 ap. d.s.

2. Ganado mayor *

$8.013= ap. total; $98 ap. prom.; $143 d.s.

2.400 ap. total; 29 ap. prom.:

46 ap. d.s.

3. Ganado menor *

$12.247= total; $149 ap. prom.; $289 d.s.

16.874 ap. total; 206 ap. prom.; 403 ap. d.s.

4. Yunta *

$1.320= total; $16 ap. prom.; $19 ap. d.s.

91 total; 1 ap. prom.; 1 ap. d.s.

5. Hijos *

0

295 total; 3.6 ap. prom.; 3 ap. d.s.

6. Tamaño *

0

448 total; 5.5 ap. prom.; 3 ap. d.s.

7. Fanega *

$8.468= ap. Total; $103 ap. prom. ; $394 ap. d.s.

4.234 ap. total; 52 ap. prom.; 199 ap. d.s.

8. fortuna **

$60.464= total; $737 ap. prom.; $1.520 ap. d.s.

0

Notas:

* : Variable Independiente o predictor. ** : Variable Dependiente o indicador. prom. : promedio d.s. : desviación estándar ap. : Aproximado Interpretación Se puede apreciar que los totales, promedios y las desviaciónes estándar no presentan en general variaciones significativas. De las 82 familias, en el original fs. 154v-158, solo 19 (23.2%) familias declaran tierras propias pero no señalan cuantas cuadras. De los 82, 16 (19.5%) familias señalan sus cuadras, que oscilan entre 2600 y 4, dando un total de 8.318 cuadras y el promedio es de 103 por familia. La tierra, suma total $28.281= y su promedio es $345. De los 82, solo 3 (3.7%) cita arrendar. El ganado mayor suma 2.400 animales. El ganado menor suma 16.874;éste tiene un aumento porcentual de 703% respecto del ganado mayor, tomado como base;la explicación es que valen mucho más baratos. Las yuntas suman 91. De las 82 familias, los hijos suman total 295 (un 65.8%, tendencia casi similar como se verá también en la siguiente muestra de 579) y el tamaño total de personas suma 448;aquí, de la resta entre tamaño e hijos quedan 153 adultos o presuntos padres (un 34% aproximado). Aunque, las fanegas de trigo sembradas suman 4.234, infladas por algunas familias más ricas, la mayoría de estas familias empobrecidas tienen en promedio entre 1 y 8 fanegas sembradas por sementera. Se indica respecto a su rendimiento que "Claudio Gay, un siglo más tarde o 1812 -Freizer, en 1712, hablaba de cosechas de sesenta y ochenta (fanegas) por una sementera-, reducía estas optimistas cifras a un promedio de doce fanegas[10]por una (De Ramón y Larrain, 1982:101). Y la fortuna total suma $60.464, donde el máximo logra $9.922 y el mínimo $9. Todo lo cual evidencia una muestra de familias rurales con escasos capitales, tierras, animales. Se señala respecto del tamaño de la familia, que "existiría una relación directa y mensurable entre los tipos de familia y las condiciones económicas y demográficas subyacentes" (Mellafe, 1980: 4) . Asimismo, Mellafe, acota que respecto del análisis del tamaño de la familia:"que el tamaño promedio de la familia no muestra ninguna tendencia secular a través del tiempo; ni tampoco, como es tradicional, distinción diferencial alguna entre patrones familiares rurales y urbanos" (6); respecto del tamaño de la familia se "ha observado que el índice de fertilidad en las sociedades rurales es más alto que en las sociedades urbanas" (Cohen, 1989:132);otros, confirmando esta línea, añaden que "the largest familias in the entire country occur in the rural-farm areas, the smallets in urban centes" (American Sociological Review, 1937:641). El tamaño de la familia en la historia de América Latina, parece ser entonces independiente de condiciones de tiempo y espacio. En nuestro estudio, de 82 familias el promedio del tamaño es de 5.5 personas aproximadamente; otros, siguiendo esta línea, añaden que "la clase social influye sobre el número de hijos que tendrá cada familia...las encuestas muestran que las familias más bajas en la jerarquía social comúnmente tienen (y desean) más hijos que las de las clases más altas de dicha jerarquía" (Light et. al., 1994:475). En efecto, se asegura que "otras localidades del Chile central con condiciones económicas demográficas muy similares, dan promedios equivalentes de habitantes por casa; por ejemplo, Los Ángeles, 10 en 1749 y La Ligua 9,3 en 1754, (Salinas Meza, sin fecha), y en Chile rural del siglo XVIII, donde tenemos para Cauquenes la cifra de 12, 3 en 1749" (Mellafe, 1980:12). En nuestro estudio, los hijos -3.6 promedio aproximado y con una desviación estándar de 3, donde 10 hijos es el máximo y 1 hijos el mínimo- y el tamaño familiar –5.5 promedio aproximado personas por familia, donde 12 personas es el máximo por familia y 2 personas el mínimo- son similares con los datos de los padrones de distintas ciudades o pueblos de chile entre 1761 y 1789 (Pinto (1981: 54, 55, 57), que señala que la media aritmética del promedio general de hijos por familia es de 3,19 similar al cálculo del jesuita Joaquín Villarroel en 1752 que señala 3 hijos por familia más dos esposos, o sea, 5 en total, casi idéntico a nuestros datos;del tamaño, corresponde más bien a una familia mediana con 3 a 4 hijos, o sea, unos 6 aproximado en total. Pinto, indica que Cauquenes en el año de 1761 suma en total 286 hijos –pero son 68 familias con distinto número de hijo entre 0 y 12-, cifra relativamente parecida a la nuestra de 295 hijos pero en 1754.

Muestra de 82 familias de Perquilauquén Objetivo n°2: Análisis Factorial Tabla n°2 Matriz de Correlación Pearson

tierra

gmayor

gmenor

yunta

hijos

tamaño

fanega

fortuna

tierra

1

gmayor

0.287

1

gmenor

0.580

0.816

1

yunta

0.569

0.688

0.793

1

hijos

0.076

0.065

0.131

0.173

1

tamaño

0.087

0.065

0.127

0.188

0.987

1

fanega

0.190

0.381

0.256

0.314

0.135

0.140

1

fortuna

0.919

0.528

0.742

0.689

0.095

0.097

0.470

1

Test Bartlett Chi² : 825.062 D.F. (grados de libertad)= 28 Prob= 0.000 Notas: