Manual de construcción de instrumentos psicológicos (página 4)

Partes: 1, 2, 3, 4, 5

54
2.
Los tres factores del WISC-R.
En el año 1959 Cohen realizó uno de los primeros análisis factoriales con el WISC,
analizándolas puntuaciones de 200 sujetos de la muestra de estandarización y en-
contró cinco factores:
ComprensiónverbalI,Organizaciónperceptiva,Independenciaaladistracción,Compren-
siónverbalII,yunquintofactorcasiespecífico.Cohenoptópornointerpretarlosfactores
cuartoyquintoyagrupólossubtestysuscargasfactorialesenlostresprimerosfactores.
Un análisis factorial llevado a cabo con cada uno de los 11 grupos de edad con
los que se estandarizó el WISC-R puso de manifiesto la existencia de tres factores:
Comprensión verbal, Organización perceptiva e Independencia a la distracción
(Kaufman, 1975). Esta estructura factorial se ha encontrado, también, en diferen-
tes muestras de sujetos con retraso mental, superdotados, con trastornos de apren-
dizaje o problemas conductuales y emocionales (Juliano, Haddad y Carroll, 1988;
Reynolds y Kaufman, 1990; Macmann, Plasket, Barnett y Siler, 1991).
Cada uno de los 12 sub test del WISC-R se ubica en uno de los tres factores, tal como
se recoge en la siguiente tabla.
TABLA 2. Composición de los tres factores del WISC-R.
UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

Monografias.com

CONSTRUCCIÓN DE INSTRUMENTOS
PSICOLÓGICOS MANUAL AUTOFORMATIVO
55
3.
Interpretación de las puntuaciones del WISC-R.
En este apartado se propone un método para interpretar los cocientes intelectua-
les y el perfil de puntuaciones típicas que se obtienen con la administración del
WISC-R. El método consta de tres apartados: el primero hace referencia al cociente
intelectual total, como resumen global delos resultados obtenidos por un individuo
en la prueba. El segundo paso requiere atender a los cocientes intelectuales verbal
y manipulativo, y a sus discrepancias, si las hay. El tercer paso consiste en elaborar
hipótesis sobre las habilidades e inhabilidades del sujeto, a partir del perfil de las
puntuaciones típicas de los sub test.

3.1 Interpretar el cociente intelectual total (CIT).
El CIT es una puntuación que resume la ejecución de una persona en 10 o 12
tareas y, por tanto, debe ser tomada como tal. No se debe sobreestimar como
indicador de la capacidad cognitiva, sobre todo si aparecen discrepancias entre
el cociente intelectual verbal (CIV) y el manipulativo (CIM) o si el perfil de
puntuaciones presenta una o más diferencias significativas. Diferencias amplias
entre el CIV y el CIM, fluctuaciones notables en las puntuaciones típicas de los
sub test administrados, o la presencia de variables como fatiga, ansiedad o la
UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

El primer factor mide la comprensión verbal, los conocimientos adquiridos con la
educación y la capacidad para aplicar la habilidad verbal a situaciones nuevas. Su
relación con la escala verbal es bastante clara.

El segundo factor, claramente relacionado con la escala manipulativa mide, funda-
mentalmente, organización espacial y perceptiva. Aprecia la habilidad para orga-
nizar e interpretar el material visual, percibido en situaciones en las que el tiempo
está limitado.

Estos dos factores corresponden prácticamente a la distinción entre CIV y CIM,
por lo que el propio Kaufman (1982) afirma que estos CI pueden ser considerados
como buenas estimaciones de la capacidad de comprensión verbal y de organiza-
ción perceptiva en sentido factorial.
El tercer factor, que ya había sido encontrado en otros análisis factoriales del WISC
(Cohen, 1959), mide la capacidad para permanecer atento y concentrado. La ha-
bilidad numérica y la memoria a corto plazo pueden ser componentes importantes
de este factor. Mientras que los dos factores anteriores son, básicamente, de tipo
cognitivo, este tercer factor puede corresponder tanto al campo cognitivo como al
conductual o afectivo.

2.1 Interpretación del factor de independencia a la distracción.
Este factor se analiza cuando la puntuación de cualquiera de los sub test que lo
componen se desvía de la media del sujeto en el resto de la escala. Si aritmética y
dígitos no difieren de los sub test verbales y claves de los manipulativos, es inne-
cesario analizarlo como un factor independiente.

Cuando interpretemos este tercer factor no es adecuado utilizar los CIV y CIM
puesto que puede haber en uno de ellos, o en ambos, algún sub test que provoca
un desequilibrio. En este caso de la capacidad de comprensión verbal y de orga-
nización perceptiva en sentido factorial.

Puntuaciones altas o bajas en el factor de independencia a la distracción no im-
plican, necesariamente, superioridad o deficiencia en esta área. Una deficiencia
puede ser debida, también, a ansiedad, falta de atención e hiperactividad, pro-
blemas en el manejo de los números, deficiente memoria a corto plazo o mala
coordinación viso motora, por ejemplo. Una superioridad puede indicar buena
capacidad de secuenciación, buena memoria a corto plazo o habilidad para el
manejo de los números. Indudablemente una puntuación alta o baja no implica,
necesariamente, todas estas habilidades o discapacidades. La historia clínica, la
observación del sujeto durante la prueba, así como el resto de pruebas que haya-
mos administrado, nos indicarán a cuales de ellas podemos atribuirlas.

Monografias.com

TEMA N° 3: PUNTUACIÓN DE UN TEST
56
Diagrama
Objetivos
Inicio
Desarrollo
de contenidos

Lecturas
seleccionadas
Recordatorio
Anotaciones
ACTIVIDAD N° 1:
Actividades Autoevaluación
Esta actividad puede consultarla en su aula virtual.

Glosario Bibliografía
1 CALIFICACIÓN DE UNA PRUEBA PSICOLÓGICA
1.1 NORMAS DE PUNTUACIóN
En un test formado por varios ítems, el sujeto evaluado debe emitir una respues-
ta, el resultado inicial se conoce como puntaje bruto o puntaje directo (PD),
generalmente se obtiene de la sumatoria de respuestas correctas o respuestas
clave, estas puntuaciones no son suficientes para interpretar los resultados y esto
obedece a según (Tornimbeni, S. 2004)9 :
a. Carecen de cero absoluto (el cero no indica ausencia absoluta del rasgo).
b. No poseen unidades de medida constante (cada test emplea unidades de me-
dida diferente).
c. No son reconocidas ampliamente en el ámbito fuera de la especialidad (como
si ocurre por ejemplo con el sistema métrico decimal).

Por lo tanto en los test lo que interesa es interpretar la puntuación del sujeto en
función de cierto nivel o grado que posee en ese rasgo.

La estrategia comúnmente usada es la comparación de los resultados individua-
les con el rendimiento del grupo de referencia de esas personas en la misma
prueba.

1.1.1 Métodos de Trasformación de puntuaciones
Trasformaciones lineales: Es cuando se obtienen una nueva escala de me-
dición que respeta las distancias entre las unidades de medida de la escala
original.
La relación entre los intervalos es independiente de la unidad de medida
empleada y del punto de origen de la escala.
Las transformaciones lineales más utilizadas son las puntuaciones estándar
o z. (Aiken 2003)

1.1.2 Trasformaciones no lineales: Asumen una distribución a priori que altera la
forma de distribución de los puntajes originales, Las puntuaciones no pue-
den ser sumadas, promediadas o correlacionadas puesto que no respetan
las diferencias entre los intervalos de la escala de medida original.
a) Percentiles Expresan el porcentaje de personas en un grupo de referen-
cia que queda por debajo de una puntuación original determinada.
b) Puntuaciones estándar normalizada Facilita la comparación de diferen-
tes puntuaciones transformadas (puntuaciones z con puntuaciones per-
centiles). El procedimiento empleado se denomina normalización y las
puntuaciones obtenidas mediante este proceso reciben el nombre de
normalizadas.

9 Tornimbeni, S 2004 Introducción a los Test Psicológicos tercera edición p.103.
UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

pertenencia a grupos socioculturales deprimidos o marginales, disminuye la im-
portancia del CIT como indicador de la capacidad cognitiva de una persona.

3.2 Comprobar si existe discrepancia entre el cociente intelectual verbal (CIV) y el
cociente intelectual manipulativo (CIM). Determinar si la discrepancia es esta-
dísticamente significativa.

Monografias.com

CONSTRUCCIÓN DE INSTRUMENTOS
PSICOLÓGICOS MANUAL AUTOFORMATIVO
57
UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

Ejemplo de ello podemos encontrar en las tablas de conversión de puntua-
ciones directas a percentiles en el test de inteligencia de Wechsler (WPPSI)
Manual del test p. 74.

TEMA N° 4: PROCESO DE VALIDACIÓN DE UN TEST.
1
VALIDACIÓN DE UN TEST.
1.1 Validez de contenido:
1.1.1 Análisis lógico de los ítems y de la estructura de la prueba: Consiste en estu-
diar de manera lógica y racional los ítems. Explicar el por qué se incluyen
en el instrumento.

1.1.2 Análisis por criterio de jueces: Recibir el apoyo de un conjunto de perso-
nas calificadas con amplios conocimientos del tema. Los resultados pue-
den ser cuantificados en base a diferentes coeficientes, los cuales posibili-
taran la aceptación o rechazo de los ítems evaluados.

1.2 Valides de construcción:
Es definida como el grado en que una prueba mide y evalúa una característica
psicológica, demostrando construcciones teóricas que explican en una cierta
mediada el resultado encontrado

Calidad de un método de evaluación que refleja con fidelidad los cambios o
necesidades a evaluar. La validez de construcción se logra de manera íntegra
cuando los conceptos clave son completamente transparentes y / o cuando los
indicadores miden lo que deben medir.

1.3 Validez externa:
Calidad de un método de evaluación que posibilita la obtención de hallazgos
que pueden generalizarse hacia otros grupos, áreas, períodos, etc. La validez
externa se logra de manera íntegra cuando el equipo de evaluación es capaz
de dejar en claro que una intervención similar implementada en otro contexto
tendría los mismos efectos bajo determinadas condiciones.

Sólo una fuerte validez externa permite la transferencia de las lecciones apren-
didas. También se busca validez externa cuando la evaluación está destinada a
identificar y validar las buenas prácticas. La validez externa se ve amenazada
cuando el análisis no logra identificar los factores externos fundamentales que
son influyentes en el contexto de la intervención evaluada pero que tendrían
una influencia diferente en otro contexto.

1.4 Validez interna:
Calidad de un método de evaluación que, en la medida de lo posible, limita los
sesgos imputables a la recolección de datos o a las técnicas de análisis. La validez
interna se logra de manera íntegra cuando el equipo de evaluación aporta argu-
mentos irrefutables mostrando que la intervención ha tenido (o no) un efecto
determinado.

Se solicita una fuerte validez interna cuando se supone que la evaluación debe
informar acerca de los resultados e impactos directos.
Se pone en peligro la validez interna cuando el análisis no confirma adecuada-
mente las relaciones de causa y efecto, cuando se realizan comparaciones de gru-
pos que no son lo suficientemente similares, o cuando las pruebas estadísticas
no son significativas.

Las evaluaciones más útiles tal vez no sean siempre las más válidas. Sin embargo,
la falta de validez expondrá a la evaluación a críticas devastadoras por parte de
aquellas partes interesadas que no estén satisfechas con las conclusiones y reco-
mendaciones. Se le debería prestar una mayor atención a la validez cuando hay

Monografias.com

58
•
Coeficiente de validez:
Consiste en correlacionar los resultados obtenidos en la prueba con puntajes
de un criterio externo.
–
–
–
–

•
Seleccionar un grupo
Aplicar la prueba predictiva
Aplicar el tratamiento
Reunir los datos de criterio

Diferenciación de grupos:
2
Consiste en determinar si las calificaciones predictivas del instrumento son
capaces de establecer diferencias entre dos o más grupos específicos.

PRUEBA PILOTO O PRETEST COGNITIVO:
Recordatorio
Anotaciones
La prueba piloto es aquella práctica de investigación en donde se prueba la meto-
dología, la muestra, la funcionalidad de los instrumentos, el análisis de los datos y
la viabilidad del proyecto investigativo.
La prueba piloto permitirá identificar:
• Tipos de preguntas más adecuados.
• Si el enunciado es correcto y comprensible, y si las preguntas tienen la extensión
adecuada.
• Si es correcta la categorización de las respuestas.
• Si existen resistencias psicológicas o rechazo hacia algunas preguntas.
• Si el ordenamiento interno es lógico; si la duración está dentro de lo aceptable
por los encuestados.
En cuanto a los métodos utilizados para la realización del pre-test cognitivo, éste se
lleva a cabo mediante la realización de:
• Entrevistas informales.
Diagrama Objetivos Inicio
• Grupos focales de la población diana.
• Encuesta sobre comprensión de las preguntas.
• Valoración del cuestionario por parte de los participantes en el estudio.
Desarrollo Actividades Autoevaluación
de contenidos

LECTURA SELECCIONADAS N° II
Lecturas Glosario Bibliografía
seleccionadas
Directrices para la traducción – Adaptación de los Test
Adaptadas de la International Test Comisión (ITC)11
1.
Contexto
Los efectos de las diferencias culturales que no sean relevantes para los objetivos
centrales del estudio deberían minimizarse en la medida de lo posible.
Debería de evaluarse la cuantía del solapamiento de los constructos en las pobla-
ciones de interés.

10American Psychological Association (APA) is a scientific and professional organization that represents psycho-
logists in the United States.
11 Dra. Isabel M. Mikulic Construcción y Adaptación de Pruebas Psicológicas.
UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

partes interesadas con intereses en conflicto entre los usuarios previstos.
LA Asociación Psicológica Americana (APA)10: Establece los métodos de clasifi-
cación como validez relacionadas con el siguiente criterio:
a. Concurrente:Es el estudio de los puntajes de la prueba y un criterio. Su pro-
pósito es determinar si las calificaciones del criterio pueden ser sustituidas
por los puntajes obtenidos con la prueba.
b. Predictiva: La prueba es capaz de predecir un determinado rendimiento. Un
criterio es una medida o norma de ejecución de una determinada conducta o
área de comportamiento.

Monografias.com

CONSTRUCCIÓN DE INSTRUMENTOS
PSICOLÓGICOS MANUAL AUTOFORMATIVO
59
2.
Adaptación de los test
3.
Los constructores/ editores de test deberían de asegurarse que el proceso de adap-
tación tiene en cuenta las diferencias lingüísticas y culturales entre las poblaciones
a las que se dirigen las versiones adaptadas de los test.

Los constructores / editores de los test deberían de proporcionar datos que ga-
ranticen que el lenguaje utilizado en las instrucciones, en los propios ítem y en el
manual del test, son apropiados para todas la poblaciones culturales e idiomáticas
a las que va dirigido el test.

Los constructores / editores de test deberían de aportar evidencia de que las téc-
nicas de evaluación elegidas, los formatos de los ítems, las reglas de los test y los
procedimientos son familiares a todas las poblaciones a las que van dirigidos.

Los constructores / editores de test deberían de asegurarse que el diseño de reco-
gida de datos permite el uso de técnicas estadísticas apropiadas para establecer la
equivalencia entre los ítems correspondientes a las diferentes versiones idiomáticas
del test.

Los constructores / editores de test deberían aplicar técnicas estadísticas apropia-
das para 1) establecer la equivalencia entre las diferentes versiones de un test,y 2)
identificar componentes problemáticos o aspectos del test que puedan ser inade-
cuados para alguna de las poblaciones a las que va destinado el test.

Los constructores / editores de test deberían de proporcional información sobre
la evaluación de la validez en todas las poblaciones objetivo a las que va dirigido el
test adaptado.

No deben utilizarse preguntas no equivalentes en todas las versiones dirigidas a di-
ferentes poblaciones cuando se prepara una escala común, o cuando se comparan
estas poblaciones. Sin embargo, pueden ser útiles para reforzar la validez de conte-
nido de las puntuaciones de cada población por separado.

Aplicación
Los constructores y los aplicadores de los test deberían tratar de prever los tipos de
problemas que cabe esperar, y tomar las medidas oportunas para evitarlos mediante
la preparación de materiales e instrucciones adecuados.

Quienes aplican los test deberían de ser sensibles a cierto número de Editores re-
lacionados con los materiales utilizados para los estímulos, los procedimientos de
aplicación, y las formas de respuesta, que pueden reducir la validez de las inferen-
cias extraídas de las puntuaciones.

Aquellos aspectos del entorno que influyen en la paliación del test deberían de
mantenerse lo más parecidos posibles para todas las poblaciones a las que va diri-
gido el test.

Las instrucciones para la aplicación del test en el idioma fuente y en el objetivo
deben minimizar la influencia de variación no deseada.

El manual del test debería de especificar todos los aspectos del test y de su aplica-
ción que han de revisarse al utilizarlo en un nuevo contexto cultural.
El aplicador no debe de interferir, debiendo minimizarse su influencia sobre los
examinados. Deben de seguirse al pie de la letra las reglas explicitas descritas en el
manual del test.
UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

Monografias.com

TAREA ACADÉMICA I
• Organiza toda tu información y material bibliográfico.
60
4.

5.
Interpretación de las puntuaciones
Cuando se adapta un test para utilizarlo en otra población, debe de facilitarse la
documentación sobre los cambios, así como los datos acerca de la equivalencia
entre las versiones.

Las diferencias entre las puntuaciones obtenidas por las muestras a las que se aplicó
el test no deben de tomarse sin más directamente. El investigador tiene la respon-
sabilidad de sustanciar las diferencias con otros datos empíricos.
Las comparaciones entre poblaciones solo pueden hacerse al nivel de la invarianza
que se haya establecido para la escala en la que se expresan las puntuaciones.
El constructor del test debería de proporcionar información específica acerca de
las distintas formas en las que los contextos socioculturales y ecológicos de las po-
blaciones pueden afectar al rendimiento en el test, y debería sugerir procedimien-
tos para tener en cuenta estos efectos en la interpretación de los resultados.

CONCLUSIONES
La utilización de los test psicológicos construidos en otros contextos culturales es
una práctica frecuente no solo en nuestro medio sino en todo el mundo. El uso de
un test en un contexto cultural diferente, donde se usa un lenguaje distinto y se está
familiarizado con estímulos muy diversos, produce dificultades traducibles como
fuentes de sesgo. La existencia de sesgo puede tener consecuencias iatrogénicas al
aplicar los test y al obtener resultados totalmente erróneos.
En un ámbito clínico podemos asumir la existencia de un rasgo de personalidad
patológico, cuando este rasgo puede ser normal sí está dentro de un rango correc-
tamente medido.

Además de ser muy necesario contar con instrumentos adecuados para la práctica
psicológica y para la investigación, la adaptación de instrumentos responde a razo-
nes de índole científico y practico.

Es importante reconocer que la mayoría de las teorías psicológicas actuales se han
desarrollado en contextos de cultura occidental y que la validación empírica de las
mismas se ha realizado con muestras de jóvenes universitarios de raza blanca.
Ahora enfrentamos el desafió de demostrar la Universalidad de esas teorías si es
que es posible. Es por ello que para poder evaluar si un determinado rasgo psicoló-
gico existe en culturas diferentes es necesario contar con instrumentos equivalentes
a través de diferentes culturas, es decir que midan lo mismo en ambas culturas en
donde va a ser aplicado.

Para ello proponemos comenzar por desarrollar mayor cantidad de instrumentos
que cumplan con los requisitos necesarios para ser aplicados según las teorías de los
test que últimamente han cobrado vigor y siguiendo parámetros internacionales.
Diagrama
Objetivos
Inicio
Desarrollo
de contenidos

Lecturas
seleccionadas

Recordatorio
ACTIVIDAD N° II:
Actividades Autoevaluación
Esta actividad puede consultarla en su aula virtual.

Glosario Bibliografía
1. Redacta el marco teórico y la respectiva matriz organizativa de su test psicológico.
Instrucciones
Antes de Empezar, debe realizar los pasos siguientes:
Anotaciones
• Desarrolla un esquema del marco teórico a realizar
• Busque información sobre la estructura de un marco teórico.
• Obtener información (bibliografía, citas, estadísticas, etc.)
UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

Monografias.com

CONSTRUCCIÓN DE INSTRUMENTOS
PSICOLÓGICOS MANUAL AUTOFORMATIVO
61
Objetivos
Inicio
s
Actividades
s
Glosario
o
Anotaciones
AUTOEVALUACIÓN DE LA UNIDAD N° II
Autoevaluación
1. Anote en el espacio en blanco, la expresión que mejor complete la idea inconclusa,
luego marque la alternativa que estime correcta:
“Cuando un ítem solo mide la ocurrencia o no ocurrencia de un fenómenos, se
Bibliografía denomina__________________”.
A) Escala Ordinal
B) Escala Nominal
C) Escala de Frecuencia
D) Escala de razón
E) Escala de Intervalo

2. Con respecto a la validez de un instrumento, Anote en el espacio en blanco, la
expresión que mejor complete la idea inconclusa, luego marque la alternativa que
estime correcta:
“Puede definirse como la _______________ entre las puntuaciones o medida de
una prueba y la cualidad que se cree que se está midiendo”.
A) Consistencia.
B) Concordancia.
C) Recurrencia.
D) Persistencia.
E) Similitud.

3. Anote en el espacio en blanco, la expresión que mejor complete la idea inconclusa,
luego marque la alternativa que estime correcta.
La estimación de confiabilidad test- retest se usan para:_____________________
_________________________.
A) Evaluar el error asociado con la administración de una prueba en dos rasgos
diferentes
B) Evaluar el error asociado con la administración de una prueba en dos tests dife-
rentes
C) Evaluar la consistencia asociado con la administración de una prueba en dos
momentos diferentes.
D) Evaluar el error asociado con la administración de una prueba en dos momentos
diferentes
E) Evaluar el error asociado con la puntuación de una prueba en dos momentos
diferentes

4. Con respecto a la confiabilidad, anote en el espacio en blanco, la expresión que
mejor complete la idea inconclusa, luego marque la alternativa que estime correcta.
“Es el grado de ______________ que existe entre dos medidas de un mismo evento,
objeto o constructo”
A) Seguridad.
UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

1.1 La estructura del marco teórico es la siguiente:
a. Antecedentes.
b. Definición de términos básicos de su test.
c. Bases Teóricas (teorías) en la que se sustenta su test (constructo).

1.2 Matriz organizativa completa.
Resuelva el siguiente cuestionario, marcando la respuesta correcta en cada caso,
para fijar los conceptos e ideas fundamentales tratados en la Unidad:

Monografias.com

62
UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

B) Resultado.
C) Recurrencia.
D) Consistencia.
E) Consistencia interna.

5. Anote en el espacio en blanco, la expresión que mejor complete la idea inconclusa,
luego marque la alternativa que estime correcta.
“En la etapa que se encuentran en la elaboración de su prueba, están
en__________________”
A)Competencia Inconsciente
B) Incompetencia Inconsciente
C) Competencia Consciente.
D) Incompetencia consciente
E) Competencia subconsciente.

6. Con respecto a la matriz organizativa, está conformada esencialmente por:
A) ítems e indicadores
B) ítems y situaciones de medida
C) Indicadores y situaciones de medida
D) Situaciones de medida
E) Indicadores

7. Conrespecto al proceso de elaboración de una prueba, las interrogantes referidas
a: ¿qué tema voy abordar, para quienes está dirigido, qué recursos necesito, para
cuándo lo voy a realizar?, están referidas a:
A)Organización
B) Ejecución
C) Planificación
D) Elaboración
E) Evaluación

8. Anote en los espacio en blanco, la expresión que mejor complete la idea inconclusa,
luego marque la alternativa que estime correcta:
“Para hacer una prueba psicológica se debe tener en cuenta primero
el_____________, luego _____________sin descuidar la ____________además
la_______________ y los _________________ “.
A) Lenguaje, público al que va dirigido, redacción, tendencia del ítem
B) Lenguaje, publico al que va dirigido, redacción, errores gramaticales
C) Lenguaje, extensión, público al que va dirigido, redacción, tendencia del ítem
D) Lenguaje, extensión, redacción, tendencia del ítem, errores gramaticales
E) Lenguaje, extensión, errores gramaticales, tendencia del ítem

9. Con relación a la Validez de contenido y de criterio de jueces, anote en el espacio
en blanco, la expresión que mejor complete la idea inconclusa, luego marque la
alternativa que estime correcta:
“al buscar la validez de contenido intentamos determinar si una prueba ha
sido_________ _____________________________________________ “.
B)Adecuadamente estandarizada
C) Adecuadamente planificada.
D) Adecuadamente aplicada.
E) Adecuadamente elaborada.
F) Adecuadamente calificada.

Monografias.com

C) FFVV.
CONSTRUCCIÓN DE INSTRUMENTOS
PSICOLÓGICOS MANUAL AUTOFORMATIVO
63
Diagrama
Objetivos Inicio
D) VVFF.
E) VVVF.
Desarrollo
de contenidos
Actividades
Lecturas
seleccionadas

Recordatorio
Autoevaluación

GLOSARIO12
Glosario Bibliografía
1. ANALISIS DE íTEMS. (Ingles: ítem analysis): Comprobación empírica de la utilidad
de los ítems componentes de un test.
2. AQUIESCENCIA: En los test, la tendencia a reaccionar con una actitud, espontánea,
Anotaciones irreflexiva de conformidad, que se observa, sobre todo, en la perseveración de un
tipo de respuesta. Por ejemplo, contestar a todos los ítems de un inventario como
“verdadero”, “falso”, o de un cuestionario como “sí”, “no”, etc. Altera y falsea los
resultados. (Dorsch, 1991)
3. Coeficiente de validez: Correlación entre las puntuaciones obtenidas por los sujetos
en el test y las obtenidas en el criterio
4. Iatrogénicas: (iatrogénicas) La norma clásica de “ante todo no hacer daño” (pri-
mum non nocere) es una de las bases de la ética médica.
5. Percentil: Puntuación en un test, que indica el “tanto por ciento” de sujetos del gru-
po normativo que dicha puntuación deja por debajo
6. Proceso discriminante: Proceso subjetivo originado en el sujeto ante la presentación
de un estímulo a través del cual le asignará un valor también subjetivo en el conti-
nuo psicológico.
7. Puntaje Observado. La puntuación obtenida por un sujeto es un test psicológico.
Puntuación empírica de un test compuesta por una parte denominada puntuación
o puntaje verdadera/o y de otra que es el error de medida
8. Puntaje Transformado. Transformación de las puntuaciones brutas en cualquier
escala derivada a fin de hacer comparables los resultados. Los más usuales son los
puntajes de normas intra grupo (percentil, puntaje T, Cociente Intelectual por des-
viación). Véase “Normas Intra grupo”
9. Puntaje Verdadero. La puntuación verdadera es constante, pero las puntuaciones
observadas y los errores son aleatorios. Si, por ejemplo, suponemos que el puntaje
verdadero de una persona en inteligencia es de CI = 110 no podemos predecir con
certeza cuál será la puntuación observada o empírica que obtendrá esa persona en
aplicaciones estandarizadas y repetidas del mismo test, dada la influencia del error
de medida (Martínez Arias, 1996)
12 http://psicopsi.com/Diccionario-terminos-psicometricos.
UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

10. Con respecto a la prueba piloto, determine la falsedad (F) o la veracidad (V) de las
siguientes afirmaciones, luego marque la respuesta correcta:
I.- Verificar la comprensión de los ítems
( )
II.- Se aplica a un grupo normativo
( )
III.- Nos da la facilidad de reajustar los ítems
( )
IV.- Sirve para vislumbrar la posibilidad de otro instrumento
( )
A. VFVF.
B) VVFV.

Monografias.com

UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”
64
Diagrama

Desarrollo
de contenidos

Lecturas
seleccionadas

Recordatorio
Objetivos

Actividades

Glosario

Anotaciones
Inicio

Autoevaluación

BIBLIOGRAFIA DE LA UNIDAD II:
Bibliografía
1.- AMERICAN PSYCHOLOGICAL ASSOCIATION (APA) (1999). Standards for psy-
chological and educational test. Washington, D.C.
2.- ANASTASI, A. & URBINA, S. (1998) Test Psicológicos. Prentice Hall. México. Sép-
tima Edición.
3.- CORTADA DE KOHAN, N. (1999) Teorías Psicométricas y Construcción de Test.
Lugar Editorial. Buenos Aires
4.- WECHSLER, David. WISC-R, ESCALA DE INTELIGENCIA DE WECHSLER PARA
NIñOS-REVISADA editorial: TEA S.
http://www.ula.ve/personal/cargos_unicos/psicologo.htm
http://glosarios.servidor-alicante.com/psicometria

Diccionario de términos psicométricos

Monografias.com

DIAGRAMA DE PRESENTACIÓN DE LA UNIDAD
CONTENIDO
CONSTRUCCIÓN DE INSTRUMENTOS
PSICOLÓGICOS MANUAL AUTOFORMATIVO
65
BIBLIOGRAFÍA
EJEMPLOS
AUTOEVALUACIÓN
ACTIVIDADES
Diagrama
Objetivos
Inicio
Desarrollo
de contenidos

Lecturas
seleccionadas
Diagrama
UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”
Actividades Autoevaluación

Glosario Bibliografía
Objetivos Inicio
Recordatorio Anotaciones
Desarrollo Actividades Autoevaluación
de contenidos
Lecturas
seleccionadas
Glosario
Bibliografía

Monografias.com

66
1
NORMAS: CONCEPTO, INTERPRETACIÓN.
Tiler (1978) citado por Tornimbeni, S. dice que, la evaluación por criterios supone
un concepto de la educación diferente al de la evaluación por normas. Por lo tanto
la evaluación que se realiza dentro de la escuela, no tiene una función selectiva sino
formativa. La función del maestro noes identificar a los mejores alumnos y a los
peores sino en hacer que unos y otros logren los aprendizajes 13.

Los test nos permiten obtener datos cuantitativos y cualitativos, arrojan resultados
que en sí mismos (puntuaciones brutas) no nos dicen mucho, pero obtenemos más
información cuando la comparamos con los resultados obtenidos por otros grupos,
así podemos interpretarla.

Existen dos formas para comparar los resultados, dependiendo de la forma en que
ha sido construido el test (por normas o por criterios), son las siguientes:

1.1 Normas. Se compara al sujeto con un grupo de referencia (otros sujetos).
La mayor parte de los test están construidos en base a normas, fundamentados
en la teoría clásica de los test. Por lo tanto:
a. Se posiciona al sujeto dentro de un colectivo, un grupo de referencia en cuan-
to a una característica. Existen diferentes formas de posicionar al sujeto, por
medio de percentiles, desviación típica…
b. Los resultados obtenidos se comparan y el sujeto adquiere una posición rela-
tiva a un grupo de referencia (grupo normativo).

También existen diferencias en cuanto a cómo se hace la comparación y las in-
ferencias:
Normas. Juega un papel primordial la varianza, lo que se busca es una diferen-
ciación, hacer una discriminación entre sujetos. Por ejemplo, cuando se utiliza la
campana de Gauss para obtener la nota de un examen, la puntuación se obtiene
en base a las notas del mismo grupo.

1.2 Criterios. Se compara al sujeto con respecto a un objetivo a lograr (lo puedo
comparar consigo mismo), hasta qué punto se la logrado o no el objetivo pro-
puesto (por ejemplo en lugar de comer una tableta de chocolate comer solo dos
onzas al día).

Los test basados en criterios tienen las siguientes características:
a. Se construyen y aplican con el fin de saber si un sujeto ha conseguido el obje-
tivo o no.
b. Para diferenciar si un sujeto se puede catalogar como apto o no para una
tarea determinada.
c. Clasifico en base a la puntuación obtenida por el sujeto (lo comparo consigo
mismo).
d. Existen diferentes tipos de población por lo que se utilizan puntos de corte,
es decir, puntuaciones que diferencian, por ejemplo a un depresivo de un no
depresivo, es el punto donde se divide la población (hasta aquí es normal…),
diferencia la población normal de la clínica.

También existen diferencias en cuanto a cómo se hace la comparación y las in-
ferencias:
Criterios. Se trata de que todos los sujetos puedan llegar al objetivo, no importa
la varianza.

13 Tornimbeni, S 2004 Introducción a los Test Psicológicos tercera edición p.103.
UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

TEMA N° 1: TEST NORMALIZADOS

Monografias.com

CONSTRUCCIÓN DE INSTRUMENTOS
PSICOLÓGICOS MANUAL AUTOFORMATIVO
67
UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

“La diferencia básica en los dos tipos de pruebas se refleja también en la in-
terpretación de sus resultados: en la prueba por normas, el puntaje adquiere
significado si se lo interpreta en relación con el rendimiento alcanzado por un
grupo de referencia o grupo normativo, es decir nos proporciona información
de cómo es el rendimiento de un individuo comparado con el rendimiento de
otros en el mismo instrumento… en cambio la prueba por criterios informa
la posición de un individuo en relación con un dominio conductual definido
explícitamente, refleja un cambio interpretable en términos conductuales y no
solo su variación de su posición comparada con las posiciones relativas de otros
sujetos (Himmel, 1979)” 14

1.3 La fiabilidad En los tipos de test:
a. Los test basados en normas, la fiabilidad está en las medidas que tomamos
(un test es fiable si la medida es fiable).
b. Los test basados en criterios, se hace énfasis en que la fiabilidad se da en las
clasificaciones que hago en base a los criterios.
Ambos tipos no son excluyentes, se pueden complementar.

1.4 ¿Para qué sirven los test normalizados?
Para transformar las puntuaciones brutas en puntuaciones indirectas, es decir,
para comparar a un sujeto con el grupo.
Tipificar, es el establecimiento de las normas que nos va a permitir comparar.
Las normas se extraen siempre del promedio de actuación de un grupo de re-
ferencia (grupo normativo) al que tiene que pertenecer el sujeto o en base a la
muestra de normalización, pero debe ser realmente representativa de su pobla-
ción de referencia.

Para tipificar un test se siguen los siguientes pasos:
a. Acotar la población a la que va dirigida el test.
b. Elegir una muestra normativa (parte representativa de la población) para po-
der hacer inferencias a la población.
Para elegir la muestra utilizamos un muestreo (proceso de elección de mues-
tra, extrayéndola de la población). Para hacer el muestreo se utilizan diferentes
métodos: probabilístico, intencional u opinático, circunstancial o errático, etc.;
y a su vez existen diferentes técnicas para llevarlo a cabo: aleatorio simple, por
etapas, estratificado, etc.
c. Establecer normas de comparación (edad, sexo, grado, nivel socioeconómi-
co, cultura)
d. Aplicar el test.
e. En base a las normas se analiza la forma de actuación del grupo normativo y
obtiene la media de actuación.

Los métodos más usados para describir la posición de un sujeto respecto al gru-
po son:
a. Puntuación típica (z).
b. Rangos percentiles. Son más fáciles de usar e interpretar pero no son exactos
en la posición, conllevan más errores.

1.5 El instrumento psicométrico tiene que estar validado lo que conlleva saber en
primer lugar ¿qué evaluar?, lo que nos lleva a una definición lógica del atributo
a medir. También hay que definir operativamente como se manifiesta el atributo,
luego hay que saber cómo dar grado al mismo. Un instrumento psicométrico
consta de tres elementos:
a. Manual, pautas de manejo
b. Protocolo de la prueba(ítems y posible hoja de respuestas aparte)
c. Plantilla de corrección

14 Tornimbeni, S 2004 Introducción a los Test Psicológicos tercera edición p.103.

Monografias.com

68
–

–
–
ómnibus: las preguntas miden diferentes operaciones mentales que se
combinan en una sola puntuación final(escalas evolutivas de Binet)
Homogéneos o de tarea única: mide solo una habilidad o tarea (Raven)
Batería de test: grupo de sub test tipificado y normalizado en una pobla-
ción que dan diferentes características (test de aptitudes de Thurstone),
que forman parte de una misma evaluación o contexto.
d. Tipo de respuesta que exigiremos al sujeto:
–

–
Construcción de respuesta: se le presenta un estímulo y el sujeto elabora
su propia respuesta de forma libre.
Elección de respuesta: se le presenta el estímulo y se le dan alternativas
de respuesta cerradas de las que el sujeto elige una.
e. Tipo de aplicación:
–

–
Colectivos: las cuestiones se presentan en un protocolo impreso. El con-
tacto personal con el evaluador es mínimo. Las tareas a realizar se pro-
ponen a todos los sujetos a la vez, hay un tiempo para realizarlo y la tarea
suele ser de elección de respuesta. Las habilidades lectoras del sujeto
pueden influir a la hora de responder. No exigen demasiada preparación
del examinador. Resultan económicos en tiempo.
Individuales: la aplicación se hace persona a persona. El examinador nor-
malmente presenta oralmente las preguntas. No hay límite de tiempo. El
examinador necesita más experiencia; permiten también que el sujeto
responda libremente (construcción de respuesta). El sujeto puede pedir
explicaciones sobre la tarea por lo que las influencias de las habilidades
lectoras no se dan. El problema es que llevan mucho tiempo.

TEMA N° 2: BAREMACIÓN
1
PUNTUACIÓN PERCENTIL Y PUNTUACIÓN ESTÁNDAR
1.1 Puntuación percentil.
Se llaman centiles o percentiles a 99 valores que dividen a la serie de datos en
100 partes iguales. Se representan por P1, P2…, P99 y se leen percentil primero,
segundo, …, noventa y nueve. Un percentil es el porcentaje de casos que figuran
en o por debajo de la puntuación de un individuo en una distribución. En otras
palabras, es el rango de una persona entre cien. Se obtienen dividiendo su rango
por el número total de mediciones en la distribución y multiplicándolo por 100.
Así, si un profesor indica al padre de un alumno que su hijo se encuentra en el
percentil 80, el profesor quiere indicar que dicho alumno deja al 80 por 100 de
la clase por debajo de su puntuación, es decir que se encuentra en el grupo del
20 por 100 de los que obtuvieron mejor calificación 15.

1.1.1 Cálculo
Si se desea un resultado más preciso se puede utilizar la siguiente expre-
sión: (datos agrupados en frecuencias):

15 http://www.e-torredebabel.com/Psicologia/Vocabulario/Percentil.htm.
UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

Estos tres elementos varían en su forma de presentación dependiendo de la fina-
lidad del test, de su aplicación, de su corrección, etc.
Cuando queremos elaborar un test hay que saber a quién queremos evaluar; la
longitud del test también será diferente. Hay que saber el tiempo del que dispo-
nemos para: Elaborar el test, aplicarlo y corregirlo.

1.6 Criterios para diferenciar los test.
b. Forma de presentar los ítems: Estos pueden ser verbales (16PF), gráficos (Ra-
ven) o manipulativos (tepsi).
Hay instrumentos que combinan diferentes tipos de ítems por ejemplo esca-
las Wechsler de inteligencia que combina los tres tipos de ítems.
c. Contenido del test:

Monografias.com

CONSTRUCCIÓN DE INSTRUMENTOS
PSICOLÓGICOS MANUAL AUTOFORMATIVO
69
UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

Fórmula N° 2:

Donde:
K: porcentaje de casos del centil.
Li: Límite inferior de la puntuación donde se encuentra el centil.
fi: Frecuencia de la puntuación donde se encuentra el centil.
N: Tamaño de grupo.
fa: Frecuencia acumulada hasta el límite inferior de la puntuación donde se
encuentra el centil.

El percentil representa el porcentaje de los casos de un grupo que alcanzó valores
iguales o menores que el citado porcentaje. El rango percentil se calcula dividien-
do la frecuencia acumulada entre el total de datos (N) multiplicado por 100. Un
rango percentil debe expresarse en relación a algún grupo de referencia.

El rango percentil se utiliza, cuando se quiere averiguar un porcentaje de un valor
que cae dentro de los intervalos de la variable.

Así, el rango percentil de un resultado es el porcentaje de puntuación en su dis-
tribución de frecuencias que son inferiores a él. Por ejemplo, una puntuación de
prueba que es mayor que 75% de las puntuaciones de las personas que toman la
prueba se dice que está en el percentil 75.

1.2 Puntuación estándar.
Los resultados suelen usarse en la evaluación de normas de referencia para com-
parar el rendimiento de un estudiante por ejemplo en una prueba con el desem-
peño de otros estudiantes de su edad.

Los resultados estiman si las puntuaciones de un estudiante son superiores a la
media, promedio o por debajo del promedio en comparación con sus compa-
ñeros. También permiten la comparación de los puntajes del estudiante en di-
ferentes tipos de pruebas, como en el diagnóstico de problemas de aprendizaje.

Tipos comunes:
a. Z-scores: Estas puntuaciones se escalan en una recta numérica que va desde
-4 hasta 4 siendo cero en el medio. En esta escala, el cero es promedio . Re-
sultados positivos son superiores a la media, y los resultados negativos son
inferiores a la media.
b. T-scores: Estos puntajes rango 10 – 90 en intervalos de 10 puntos. Cincuenta
es la media en esta escala.
c. Stanines: La escala stanine es también llamado el estándar de nueve escala.
Estas calificaciones van de 1 – 9 con promedio de cinco. Las puntuaciones
menores de cinco años están por debajo de la media. Las puntuaciones por
encima de cinco años están por encima del promedio.

Un sistema de puntuación estándar es una conversión de puntuaciones Z, en un
nuevo sistema que tiene una media (M) y una DE elegidas de manera arbitraria.
Las nuevas M y DE suelen elegirse para que sean cifras fáciles de recordar como
50, 10 o 500 y 100, en pocos casos se buscan otras características deseables 16.

A fin de convertir una puntuación directa en una puntuación estándar, prime-
ra se traducirá la puntuación directa en puntuación Z, luego se multiplicará la

16 HOGAN, Thomas Pruebas Psicológicas. Una introducción práctica. p. 59.

Monografias.com

Mn
: Media en el sistema de puntuación natural.
70
Me: Media en el sistema de puntuación estándar.
X
: Puntuación natural
Diagrama
Objetivos Inicio
Desarrollo
de contenidos
Actividades
Autoevaluación
LECTURA SELECCIONADAS N° I
Lecturas Glosario Bibliografía
seleccionadas

De Dr. Antonio Alva Santos.
El aspecto más importante de la evaluación psicológica es la interpretación de los re-
Recordatorio
1.

2.
Puntuaciones
La puntuación absoluta es el recuento numérico de respuestas acertadas. Presenta
una utilidad muy limitada, ya que debe transformarse en una puntuación percentil
(tanto por ciento de la población que queda por debajo del sujeto) o en una pun-
tuación estándar (en desviaciones típicas por encima o por debajo de la media o
promedio), puntuaciones que hacen referencia al promedio de la población.

Si un sujeto tiene un percentil 50, significa que el 50% de la población puntúa por
debajo de él y el otro 50% por encima. Si es 80, significa que el 20% lo sobrepasa y
el 80% está por debajo.

Las puntuaciones estándar dependen de la media o promedio y de la desviación
típica.

La media se obtiene de la suma del conjunto de las puntuaciones dividida entre el
número total de individuos.

La desviación típica o estándar es la raíz cuadrada de la media del cuadrado de las
desviaciones.

Si una puntuación absoluta se resta de la media y se divide entre la desviación típica,
nos da la puntuación estándar.
Las tablas de normas, que se incluyen en los manuales de evaluación psicológica,
indican la escala de puntuaciones absolutas previstas a partir de estudios en los que
un determinado test ya ha sido aplicado a grandes grupos representativos de pobla-
ción, y deben, por tanto, especificar cuáles eran las características de la muestra en
cuanto a sexo, edad, ocupación y situación geográfica.
Si las normas se han obtenido partiendo de un grupo de población distinto al del
sujeto, no serán una buena referencia de comparación.

Validez
En último término, la interpretación de las puntuaciones de un test supone hacer
una predicción del comportamiento del sujeto en una situación determinada, por
UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

puntuación Z por la nueva DE y se sumará la nueva media y se resume en la
siguiente formula:

Fórmula N° 3:

Donde:
PE : puntuación estándar deseada.
DEe: Desviación estándar.
DEn: Puntuación estándar en el sistema de puntuación natural

Monografias.com

CONSTRUCCIÓN DE INSTRUMENTOS
PSICOLÓGICOS MANUAL AUTOFORMATIVO
71
3.
Durante el proceso de construcción de un instrumento psicológico.
La etapa del análisis de datos se presenta posterior a la aplicación del instrumento
y finalizada la recolección de los datos, donde se procederá a aplicar el análisis de
los datos para dar respuesta a las interrogantes de la investigación. Hevia (2001).

Luego de haber obtenido los datos producto de la aplicación de los instrumentos
psicológico, se procederá a codificarlos, tabularlos, y utilizar la informática a los
efectos de su interpretación que permite la elaboración y presentación de tablas y
gráficas estadísticas que reflejan los resultados.

“El propósito del análisis es aplicar un conjunto de estrategias y técnicas que le
permiten al investigador obtener el conocimiento que estaba buscando, a partir del
adecuado tratamiento de los datos recogidos.” (Hurtado, 2000:181).
Estrategias de análisis:
3.1 Programas de cómputo
• SPSS
• Minitab
• SAS
• STADTS
3.2 La matriz organizativa.
3.3 Análisis estadístico.
3.4 Descriptiva
• Distribución de frecuencias
• Medidas de tendencia central
• Medidas de variabilidad
• Graficas
• Puntuaciones z
UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

lo que si el test permitió realizar pronósticos acertados, se dice que tiene una gran
validez (externa o predictiva).

Sin embargo, antes de que la validez sea probada nos debemos enfrentar a una
cuestión previa: la fiabilidad, es decir, que mida siempre lo mismo, de un modo
consistente, aun si son diferentes profesionales los que lo aplican.

Además de la fiabilidad, un test debe ser válido (que mida lo que debe medir) en
al menos tres sentidos:

2.1 Validez interna: que los ítems incluidos en el test sean una muestra suficiente-
mente representativa de los que eventualmente se podrían haber utilizado. Por
ejemplo, en un test que consista en deletrear palabras, éstas deben presentar
distintos grados de complejidad.

2.2 Validez externa o de criterio: se refiere a la capacidad del test para ajustarse a
un hecho futuro o concurrente. Por ejemplo, un test de aptitudes artísticas tiene
validez externa o predictiva si las puntuaciones más altas las obtienen quienes
después tendrán mayor éxito en esa actividad. La validez de criterio de un nuevo
test de inteligencia puede establecerse si sus puntuaciones tienen una estrecha
correlación con las de un test clásico, de validez ya contrastada.

2.3 Validez de construcción: hace referencia a los rasgos o cualidades psíquicas que
el test mide, demostrando que ciertas pautas del comportamiento humano son
en cierto grado relevantes para puntuar en el test. Por ejemplo, un test que mida
la necesidad de éxito debe demostrar que quienes puntúan más alto son los
individuos que trabajan de forma más independiente, que persisten más en las
tareas de resolución de problemas y que en situaciones competitivas obtienen
los mejores resultados.

Monografias.com

72
UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

3.5 Inferencial
• Estimar parámetros
• Distribución muestral

3.6 Pasos
• Reportar resultados
• Análisis estadísticos de variables he hipótesis
• Evaluar la confiabilidad y validez
• Explorar datos
• Ejecutarlo
• Seleccionar el programa

3.7 Categorización analítica de los datos.
a. Los datos que han sido recogidos con anterioridad, se sometieron a la clasi-
ficación y codificación de esa forma lograr una nueva o mantener la actual
interpretación de los hechos recogidos.
b. Procesamiento de la información mediante la disposición de la masa de datos
para organizarla y proceder a la ordenación de la información.

3.8 Calificación y tabulación de los datos.
Tabulación de la información mediante tablas de resumen de resultados, donde
se determinan los casos que encajan en las distintas sinergias.

3.9 Análisis e integración de los datos.
a. Se relacionó y se compararon los contenidos documentales obtenidos e inte-
grarlos en forma holística.
b. Los procedimientos utilizados para realizar la tabulación, análisis y la interpre-
tación de los datos recopilados fueron realizados a través de una herramienta
tecnológica, motivo por el cual se recurrió a la asesoría de un profesional,
experto en el área de estadística. Este profesional se encarga de asesorar en los
procedimientos estadísticos utilizando el programa SPSS para Windows 7 .

Según Hurtado (2000) el propósito del análisis es aplicar un conjunto de estra-
tegias y técnicas que le permitan al investigador obtener el conocimiento que
estaba buscando, a partir del adecuado tratamiento de los datos recogidos.
Este método permitirá clasificar y reclasificar el material recogido desde diferen-
tes puntos de vista hasta que usted opte por el más preciso y convencional. El
análisis permitirá la reducción y sintetización de los datos, se considera entonces
la distribución de los mismos. (Tamayo, 1995).

3.10 Analizar los datos
a. Decidir el programa de análisis de datos que se utilizara.
b. Explorar los datos obtenidos en la recolección.
c. Analizar descriptivamente los datos por indicador del constructo.
d. Visualizar los datos por indicador.
e. Evaluar la confiabilidad, validez y objetividad de los instrumentos de medi-
ción utilizados.
f. Analizar e interpretar mediante pruebas estadísticas las hipótesis planteadas
(análisis Estadístico Inferencial).
g. Evaluar y realzar la calidad de los datos.
h. Describir la población de estudio y su relación con alguna supuesta fuente.
i. Evaluar la posibilidad de sesgos (por ejemplo, no-respuesta, negativa a contes-
tar, y desaparición de sujetos, grupos de comparación).
j. Controlar y analizar los efectos de otros factores relevantes.
k. Buscar una mayor comprensión de las relaciones observadas o no observadas.
l. Evaluar el impacto o importancia.

Monografias.com

TEMA N° 3: ANALISIS DE LOS ITEMS Y LA FICHA TÉCNICA
CONSTRUCCIÓN DE INSTRUMENTOS
PSICOLÓGICOS MANUAL AUTOFORMATIVO
73
Diagrama
Objetivos
Inicio
Desarrollo
de contenidos

Lecturas
seleccionadas
Recordatorio
Anotaciones
ACTIVIDAD N° 1:
Actividades Autoevaluación
Esta actividad puede consultarla en su aula virtual.

Glosario Bibliografía
1 PODER DISCRIMINATIVO DEL ÍTEM
1.1 Análisis de los ítems
Definición: análisis de ítems = estudio de las propiedades de los elementos (pre-
guntas) de un test directamente relacionadas con las propiedades de éste (hacer
inferencias sobre algún parámetro del test a partir de propiedades de los ítems)
En esta etapa se establecen los criterios de adecuación de los ítems, los que más
tarde serán nuevamente controlados en la fase de validación. Principalmente se
trata aquí de explorar el grado de dificultad de las tareas o ítems que van a con-
formar el test y de determinar la capacidad que estos muestran para discriminar
la variable que se estudia. Existen dos tipos de análisis posibles:
a. Análisis subjetivo: Realizado por un conjunto de expertos en la materia que
el test va a evaluar, se trata de un proceso de eliminación de todos aquellos
ítems que sean juzgados inconvenientes con base a una serie de criterios apa-
rentes. Así, se descartarán mediante este proceso aquellos ítems que reflejen
ambigüedad, constituyan una repetición innecesaria, guarden poca relación
con el constructo a evaluar o una tengan una complejidad sintáctica excesiva.
b. Análisis objetivo: Se realiza a partir del análisis estadístico de los ítems. Los
criterios de selección varían en función de los supuestos del modelo a utilizar
en su construcción. Si la prueba se construye con base en la teoría clásica de
los test, los criterios de selección a tener en cuenta serán los índices de ho-
mogeneidad, validez y dificultad del ítem; su poder discriminativo; y el coefi-
ciente de fiabilidad del test. Si por el contrario, la prueba se construye bajo
los supuestos de la teoría clásica de los test, los criterios de selección, según
Hambleton y Swaminathan (1985) serán la dificultad y discriminación del
ítem, la bondad de ajuste del ítem al modelo, y el grado deseado de la función
de información del test 17.

1.2 índice de dificultad (ID)
Es la proporción de sujetos que aciertan en relación con los que intentan resolver-
lo: ID = A / N

El valor del índice de dificultad está directamente relacionado con la media del test:
la media del test es igual a la suma de los índices de dificultad de los ítems:

Formula N° 4
n

i=1

Interpretación: a medida que el ID aumenta, el ítem es más fácil (en propiedad
habría que llamarlo índice de facilidad); además, en muchos test no tiene sentido
de hablar de ID, ej., los cuestionarios de personalidad, que no tienen respuestas
acertadas o erróneas.

Limitaciones: el ID no es una propiedad intrínseca del ítem, su valor depende de
la muestra de sujetos a la que se aplique (la solución la da la Teoría de Respuesta
a los ítems)

17 Eduardo García Cueto. «La construcción de un test». Introducción a la psicometría. Madrid: Siglo XXI de
España Editores. pp. 10-14.
UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

Monografias.com

74
Donde:
A: Número de sujetos que aciertan el ítem
E: Número de sujetos que fallan el ítem
K: Número de alternativas del ítem
N: Número de sujetos que intentan resolver el ítem

La varianza de un ítem puede expresarse en términos de su ID: sj2 = PjQj, donde
Pj sería la proporción de sujetos que aciertan el ítem (su ID) y Qj = (1 – Pj). (la
dificultad media de los ítems maximiza su varianza)

1.3 índice de discriminación 18.
Un ítem tiene poder discriminativo si distingue entre los sujetos que puntúan
alto y los que puntúan bajo en el test (si permite distinguir entre sujetos eficaces
frente a ineficaces).

índice de discriminación = correlación entre las puntuaciones de los sujetos en
el ítem y sus puntuaciones en el test.

1.3.1 Cálculo
• Correlación biserial-puntual (Pbp) (aplicación de la correlación de Pearson
entre una variable dicotómica y otra cuantitativa; fórmula:

Fórmula N° 6
Donde:
µp: media en el test de los sujetos que aciertan el ítem
µx: media del test
sx: desviación típica del test
p: proporción de sujetos que aciertan el ítem
q: (1 – p).
Al calcular el índice de discriminación, a la puntuación total del test hay
que descontarle el ítem cuyo índice de discriminación se pretende hallar
(X – j); en caso contrario, se puede usar la siguiente corrección:

Formula N°7
A- E /(K -1)
N
ID =
p
q
x
µp -µx
s 2
?bp =
18 Ramos-álvarez, Manuel, (2005)Análisis de ítems de pruebas, tercera edición.
j x
? jxs x -s j
s 2 +s 2 -2? jxs js x
? j(x- j) =
UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

En ítems de elección múltiple, para corregir los efectos del azar, se suele utilizar la
siguiente fórmula:

Fórmula N° 5

Monografias.com

? – = j x j j x ) ( ? s s
CONSTRUCCIÓN DE INSTRUMENTOS
PSICOLÓGICOS MANUAL AUTOFORMATIVO
75
UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

Donde:
?j(x-j): Correlación entre el ítem j y el test tras descontar el ítem (x – j)
?jx: Correlación ítem-test cuando el ítem está incluido en el test
sx: Desviación típica del test
sj: Desviación típica del ítem

• Correlación biserial (?b): se usa cuando una variable no dicotómica se
dicotomiza (se pierde información)

Fórmula N° 8

µ p -µx p
?b =
s x y

Dónde:
µp: media en el test de los sujetos que aciertan el ítem
µx: media del test
sx: desviación típica del test
p: proporción de sujetos que aciertan el ítem
y: ordenada correspondiente al valor de la puntuación típica en la curva
normal que deja por debajo un área igual a p
Notas: es una estimación de la correlación de Pearson, y puede dar valores
superiores a 1 si alguna de las variables es platicúrtica o bimodal.

La relación entre ?bp y ?b viene dada por:
• Coeficiente phi (f): es la correlación de Pearson para dos variables dico-
tómicas
• Correlación tetracórica: ambas variables dicotomizadas y se asumen distri-
buidas normalmente
• índice basado en las proporciones de aciertos:

Fórmula N° 8

d = Pc – Pi

dónde:
Pc: proporcióndesujetoscompetentes(puntúan>Md)queaciertanelítem
Pi: proporción de sujetos incompetentes que también aciertan el ítem

1.3.2 Relación con algunos parámetros del test 19
a) Variabilidad: la desviación típica del test está estrechamente relaciona-
da con el índice de discriminación de los ítems

Fórmula N° 9
n

j=1

19 Ramos-álvarez, Manuel, (2005)Análisis de ítems de pruebas, tercera edición.

Monografias.com

s x =? PjQj? j(x- j)
n ?
n-1?
?s 2 j
(?s j? j(x- j)) ? ?
?
n ?
n-1? ?
?P (1- P )
?
[??
]
Pj(1-Pj) ? ?
76
Sustituyendo:
Donde Pj es la proporción de sujetos que aciertan el ítem (su ID)

b) Fiabilidad: la fiabilidad de un test puede expresarse en:

Fórmula N° 12
O en el caso de que los ítems sean dicotómicos:

Fórmula N° 13
2
En suma, los parámetros de los test, poder discriminativo (sx) y fiabilidad
(a) pueden expresarse en términos del índice de dificultad de los ítems
(Pj) y de su índice de discriminación (?jX).

FICHA TÉCNICA
Es toda la información básica del test cuya estructura es la siguiente:

FICHA TECNICA
• NOMBRE ORIGINAL: Nombre a partir del constructo
• APARICIÓN: Origen
• AUTORES:
• OBJETIVO: responde el para qué o el propósito clínico, educativo u organiza-
cional.
• VALIDEZ DE CONTENIDO:
• ADMINISTRACIÓN: Puede ser individual o colectivo.
• DURACION: Es variable, de 15 a 20 minutos aproximadamente por ejemplo.
• APLICACIÓN: Personas que pertenecen al ámbito laboral de los diferentes sec-
tores (ambos sexos).
• SIGNIFICACION: Apreciación de los indicadores y situaciones de medida.
• TIPO DE ITEMS: ítems verbales distribuidos por cada uno de los indicadores.
• PROCEDENCIA:
• AREA DE APLICACIÓN: Por ejemplo Laboral, clínica o educativa
Fórmula N° 10

s j = PjQj = Pj(1- Pj)
Fórmula N° 11
n

j=1
?
2
?1-
?
a =
?

?
?
2 ?
1-
jX
j j
a =
UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

dónde:
sX: desviación típica del test
sj: desviación típica del ítem j
?j(x-j): índice de discriminación del ítem j
Si los ítems son dicotómicos, su desviación típica vendrá dada por:

Monografias.com

CONSTRUCCIÓN DE INSTRUMENTOS
PSICOLÓGICOS MANUAL AUTOFORMATIVO
77
UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

TEMA N° 4: RESPUESTA A LOS ÍTEMS
En Los modelos y procedimientos de medición encontramos dos teorías la denominada
Teoría clásica del test y la Teoría de respuesta a los ítems (TRI).
1
TEORÍA CLÁSICA DE RESPUESTA A LOS ÍTEMS.
Asumen que las diferencias en las respuestas de los individuos a un test se deben
única y exclusivamente, a la variación en la “capacidad” ( actitud, percepción, opi-
nión, disposición, etc. ) de los evaluados.

Por consiguiente, todas los demás factores de variación, como las diferencias en el
grado de dificultad de las preguntas que forman el test, las condiciones externas
o las circunstancias personales) se consideran constantes o, a lo mucho, un efecto
aleatorio.

Esto es uno de los inconvenientes de la Teoría clásica del test, que fue iniciada con
los estudios de Spearman (1904) y desarrollada con la formulación axiomática de
Novick (1966).

Además, esta teoría define el concepto de capacidad en función de cada test par-
ticular, de tal forma que cuando un test es “difícil” el individuo tendrá baja capaci-
dad, mientras que cuando un test es “fácil” el individuo tendrá elevada capacidad.
Esta teoría clásica define la dificultad de un ítem como “la proporción de indivi-
duos del grupo que responde correctamente al ítem”. Es decir, la mayor o menor
dificultad de un ítem depende de la capacidad de los individuos, dicho a la inversa,
la capacidad de los individuos depende de si los ítems utilizados en el test son fáciles
o difíciles.

La teoría clásica gira en torno al test en su conjunto, y no en torno a cada ítem
particular que lo forma. Es decir, el valor alcanzado por el individuo en el test sólo
permite valorar su capacidad global ante dicho test, pero impide llegar a un análisis
individual de cada ítem. Por lo tanto, no es posible, realizar predicciones sobre el
comportamiento delos individuos ante un ítem concreto o responder a la pregunta
de cuál es la probabilidad de que un individuo responda de forma correcta a un
ítem determinado.

Este cúmulo de inconvenientes de la teoría clásica del test recomienda la utiliza-
ción de una metodología de medición alternativa que permita, entre otras cosas,
lo siguiente:
a. Que las características de los ítems no sean dependientes de los individuos que
responden al test.
b. Que los valores obtenidos por los individuos al realizar el test no sean depen-
dientes de éste último.
c. Que el análisis se realice a nivel de ítem, en lugar de hacerlo a nivel de test.
d. Que no sean necesarios test paralelos para verificar la fiabilidad del test.
Respondiendo a esta alternativa tenemos la Teoría de respuesta a los ítems.

2
LA TEORÍA DE RESPUESTA AL ÍTEM.
Analiza el comportamiento de los test, no a un nivel del test en conjunto, sino al
nivel de cada ítem. En el caso más simple, las respuestas a cada ítem se pueden codi-
ficar como respuesta “correcta” o como respuesta “incorrecta”, de tal forma que si
se asocia una variable Uij para representar la respuesta del individuo j al ítem i, esta
variable tomará el valor1 si la respuesta es correcta, y 0 si la respuesta es incorrecta.

La probabilidad de responder correctamente al ítem i dependerá del parámetro ?,
que es valor que toma la capacidad (latente) de cada individuo1. De esta forma, los
individuos que posean escasa capacidad latente tendrán probabilidades más bajas
de responder correctamente al ítem que aquellos otros individuos con una elevada
capacidad latente. Por consiguiente, la probabilidad Pi (?) es una función monó-

Monografias.com

78
3
ESCALA LIKERT Y DIFERENCIAL SEMÁNTICO.
3.1 ESCALA DE LIKERT.
La escala de tipo Likert (también denominada método de evaluaciones suma-
rias) es una escala psicométrica comúnmente utilizada en cuestionarios, y es
la escala de uso más amplio en encuestas para la investigación, principalmente
en ciencias sociales. Al responder a una pregunta de un cuestionario elaborado
con la técnica de Likert, se especifica el nivel de acuerdo o desacuerdo con una
declaración (elemento, ítem o reactivo o pregunta). La escala se llama así por
Rensis Likert, quien publicó en 1932 un informe donde describía su uso.

a. Elaboración de la escala:
Preparación de los ítems iniciales; se elaboran una serie de enunciados afir-
mativos y negativos sobre el tema o actitud que se pretende medir, el número
de enunciados elaborados debe ser mayor al número final de enunciados
incluidos en la versión final.

Administración de los ítems a una muestra representativa de la población
cuya actitud deseamos medir. Se les solicita a los sujetos que expresen su
acuerdo o desacuerdo frente a cada ítem mediante una escala.

Asignación de puntajes a los ítems; se le asigna un puntaje a cada ítem, a fin
de clasificarlos según reflejen actitudes positivas o negativas.

Asignación de puntuaciones a los sujetos; la puntuación de cada sujeto se
obtiene mediante la suma de las puntuaciones de los distintos ítems.

Análisis y selección de los ítems; mediante la aplicación de pruebas estadís-
ticas se seleccionan los datos ajustados al momento de efectuar la discrimi-
nación de la actitud en cuestión, y se rechazan los que no cumplan con este
requisito.

b. Ejemplo de pregunta formulada con un elemento de tipo Likert de 5 puntos
Hay que hacer una distinción importante entre escala de tipo Likert y ele-
mento de tipo Likert. La escala es la suma de las respuestas de los elemen-
tos del cuestionario. Los elementos de tipo Likert van acompañados por una
escala visual análoga (por ejemplo, una línea horizontal, en la que el sujeto
indica su respuesta eligiéndola con un círculo); a veces se llama escalas a los
elementos mismos. ésta es la razón de muchas confusiones y es preferible,
por tanto, reservar el nombre de escala de tipo Likert para aplicarlo a la suma
UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

tonamente creciente del parámetro ?. Esta función es conocida con el nombre de
función de respuesta al ítem o curva característica de ítem (CCI).

Además del parámetro ?, la probabilidad Pi (?) va a depender también, en fun-
ción del modelo que se proponga para su estimación, de otros dos parámetros, ai?
(-8;+8) y bi? (-8;+8) , conocidos con el nombre de parámetro de discriminación
y parámetro de dificultad, respectivamente.
El parámetro de dificultad es aquel punto de la escala latente de capacidad para el
cual la probabilidad de responder correctamente al ítem es, exactamente, del 50 %.
En realidad, este parámetro es un parámetro de localización, puesto que indica la
posición de la CCI en la escala latente. Así, cuanto mayor sea el valor de bi, mayor
será también la capacidad necesaria para que un individuo tenga una probabilidad
de 0,5 de responder correctamente al ítem en cuestión, lo cual significa que los
ítems “difíciles” tendrán una CCI situada en el extremo superior de la escala de
capacidad, mientras que la CCI de los ítems “fáciles” se ubicará en el extremo in-
ferior de dicha escala. Cuando los valores de capacidad se estandarizan, los valores
de bi suelen variar de -2 a +2, de manera que valores de bi próximos a -2 indican
una extrema facilidad del ítem, mientras que valores próximos a +2 denotan una
elevada dificultad.

Monografias.com

CONSTRUCCIÓN DE INSTRUMENTOS
PSICOLÓGICOS MANUAL AUTOFORMATIVO
79
UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

de toda la escala, y elemento de tipo Likert para referirse a cada elemento
individualmente.

Un elemento de tipo Likert es una declaración que se le hace a los sujetos
para que éstos lo evalúen en función de su criterio subjetivo; generalmente se
pide a los sujetos que manifiesten su grado de acuerdo o desacuerdo. Normal-
mente hay 5 posibles respuestas o niveles de acuerdo o desacuerdo, aunque
algunos evaluadores prefieren utilizar 7 a 9 niveles; un estudio empírico re-
ciente demostró que la información obtenida en escalas con 5, 7 y 10 niveles
posibles de respuesta muestra las mismas características respecto a la media,
varianza, asimetría y curtosis después de aplicar transformaciones simples.

El formato de un típico elemento de Likert con 5 niveles de respuesta sería:

• Me gusta el cine:
Muy de acuerdo
5
Algo de acuerdo
4
Ni de acuerdo ni en desacuerdo 3
Algo en desacuerdo
2
Muy en desacuerdo
1

La escala de Likert es un método de escala bipolar que mide tanto el grado
positivo como neutral y negativo de cada enunciado.

La escala de Likert, al ser una escala que mide actitudes, es importante que
pueda aceptar que las personas tienen actitudes favorables, desfavorables o
neutras a las cosas y situaciones lo cual es perfectamente normal en térmi-
nos de información. Debido a ello es importante considerar siempre que una
escala de actitud, que puede y debe estar abierta a la posibilidad de aceptar
opciones de respuesta neutrales.

Ejemplo: "La política exterior de los Estados Unidos afecta a la política de
Sudamérica."

Totalmente de acuerdo
5
De acuerdo
4
Ni de acuerdo ni en desacuerdo
3
En desacuerdo
2
Totalmente en desacuerdo
1

c. Puntuación y análisis
Después de completar el cuestionario, cada elemento se puede analizar por
separado o, en algunos casos, las respuestas a cada elemento se suman para
obtener una puntuación total para un grupo de elementos. Por ello las escalas
de tipo Likert son un tipo de escalas sumativas.

Se considera una escala de tipo ordinal, ya que no podemos asumir que los
sujetos perciban las respuestas como equidistantes, aunque podría asumirse
si cada elemento se acompaña de una escala visual horizontal en la cual deba
marcar su respuesta, y en la que cada respuesta esté situada de forma equi-
distante.

Cuando los datos se tratan como ordinales, es posible calcular la mediana y
la moda (pero no la media). La dispersión se calcula por medio del intervalo
entre cuartiles (no es posible calcular la desviación típica), o puede anali-
zarse mediante técnicas no paramétricas, la prueba de Mann – Whitney. Las
respuestas a los elementos se puede sumar, y hay que tener en cuenta que

Monografias.com

80
•

•

•
Las escalas de Likert presentan un sesgo si observamos su distribución
de frecuencias. Las aprobaciones siempre superan a las desaprobaciones,
independientemente de las afirmaciones planteadas. Esto significa que
las expresiones de (des) acuerdo no son equidistantes.
También está comprobado empíricamente que declararse “de acuerdo”
con cualquier frase de la batería Likert, implica un menor esfuerzo psí-
quico por parte del entrevistado.
La respuesta neutral “ni de acuerdo ni en desacuerdo”, que es la posición
central de la escala, es asociada con el “acuerdo moderado”, y no con la
respuesta “indeciso” (como muchos creen). Muchos entrevistados perci-
ben que declararse “indeciso” es negativo y por ello tienden a desplazarse
más cerca de las posiciones de acuerdo. Además los entrevistados perci-
ben que entre las posiciones de acuerdo hay más distancia que entre las
del desacuerdo (ver cuadro).
Al tratarse de una escala ordinal, no permite conocer con precisión la
“cantidad” de acuerdo o desacuerdo. Esto impide sumar sus valores in-
ternamente, ya que no se pueden sumar los números ordinales (primero
más segundo no es igual a tercero). Esto suele realizarse erróneamente, y
provoca una distorsión porque se suman los números naturales a los que
se le atribuyen cinco grados de acuerdo/desacuerdo, y se asigna al entre-
vistado un puntaje total que expresa su (supuesto) estado (ver gráfico).
La escala de Likert tiene un inconveniente relacionado con la compren-
sión de las frases evaluadas por el entrevistado: una afirmación puede ser
desaprobada por motivos diversos.
Si no se incluye una pregunta de respuesta abierta para conocer cuáles
son las causas – generalmente para reducir costos de la investigación – se
corre el riesgo de asignar los mismos puntajes a dos opiniones diferentes
(y que incluso pueden ser opuestas). Este es el denominado problema de
la “curvinealidad”.
Por lo general, los entrevistados al escuchar la afirmación leída por el
entrevistado, tienden a reaccionar a un solo término de la frase: al objeto
o al sujeto que ese término está designando. Este fenómeno ha sido de-
nominado “Reacción al objeto”. (Ej: En la afirmación “El alcohol solo en
mínimas cantidades es perjudicial para la salud”, se tenderá a relacionar
los términos “El alcohol” y “es perjudicial para la salud”.)
Por último, se suele reducir la fidelidad/confianza de las respuestas cuan-
do se organizan las frases en largas baterías (por ejemplo, una debajo
de la otra). Esto es aplicable no sólo a la escala de Likert sino también a
otras técnicas. Para evitar este fenómeno llamado “Response Set” es con-
veniente intercalar afirmaciones opuestas en la misma batería.

Los entrevistados perciben que declararse “indeciso” es negativo y por ello
UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

todos los elementos deben medir lo mismo (por ejemplo, la actitud hacia los
extranjeros). Podría aplicarse un análisis de varianza.

En la mayoría de las investigaciones, cuando se evalúan actitudes y opiniones,
se suele utilizar la escala de Likert. Esta escala se difundió ampliamente por su
rapidez y sencillez de aplicación, desde su desarrollo en 1932.

La escala de Likert es de nivel ordinal y se caracteriza por ubicar una serie de
frases seleccionadas en una escala con grados de acuerdo/desacuerdo. Estas
frases, a las que es sometido el entrevistado, están organizadas en baterías
y tienen un mismo esquema de reacción, permitiendo que el entrevistado
aprenda rápidamente el sistema de respuestas.

La principal ventaja que tiene es que todos los sujetos coinciden y comparten
el orden de las expresiones.

d. ¿Cuáles son las desventajas de emplear la Escala de Likert?

Monografias.com

CONSTRUCCIÓN DE INSTRUMENTOS
PSICOLÓGICOS MANUAL AUTOFORMATIVO
81
MUY DE ACUERDO
ALGO DE ACUERDO
NI DE ACUERDO NI EN DESACUERDO
5
4
3
_______________________________________________________
ALGO EN DESACUERDO
MUY EN DESACUERDO
2
1
3.2 DIFERENCIAL SEMáNTICO.
a. Antecedentes Teóricos.
El método es descrito por los autores como un método para medir el signi-
ficado que tiene un objeto para un individuo 20.

OSGOOD 21 supone que existe un espacio semántico de dimensionaldad
desconocida y de naturaleza geométrica. El espacio está constituido de
escalas semánticas. Cada escala consiste de un par de adjetivos que son
bipolares.

Se supone que estas escalas forman una función lineal que pasa a través del
origen, para estar en condiciones de definir el espacio adecuadamente, es
necesario usar una gran cantidad de escalas que son una muestra represen-
tativa extraída del universo de escalas.

Para diferenciar el significado de un objeto, el individuo hace una elección
entre las alternativas dadas, la función de cada elección es localizar cada
objeto en el espacio semántico, la validez de la localización de este punto
en el espacio depende del número y representatividad de las escalas.

De este modo, la diferencia semántica significa la estabilización sucesiva
de un objeto hasta un punto en el espacio multidimensional semántico, a
través del puntaje de un número de alternativas semánticas dadas presen-
tadas en forma de escalas. Una diferencia de significado entre dos objetos
es simplemente una función de las diferencias de su ubicación en el mismo
espacio, es decir, una función de la distancia multidimensional entre dos
puntos.

b. Dimensiones en el Espacio Semántico.
OSGOOD dio gran importancia al muestreo, el diferencial semántico está
influido por tres fuentes de variación: el individuo, las escalas y los objetos.

OSGOOD llego a la conclusión de que la estructura del factor no depen-
día de la elección de escalas, el seguir 3 factores de hecho explico la mayor
parte de la varianza total, mientras otras dimensiones solo explicaban una
pequeña parte de ellas.

• Dimensiones
–
La evaluación que hace el individuo del objeto o concepto que se está
POSITIVO
NEGATIVO
clasificando.

20 URBAN FERNANDEZ, Francisco. Un método de investigación de origen psicolingüístico.
21OSGOOD, C E. "Semantic differential technique in the comparative study of cultures", en. American Anthro-
pologist, n. 66, 1964, pp. 171-200
UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

tienden a desplazarse más cerca de las posiciones de acuerdo.

NEWSLETTER
No es conveniente sumar o contar con un promedio de respuesta

Monografias.com

82
–

–
La percepción del individuo, de la potencia o poder del objeto o con-
cepto.
Ejemplo escalas: grande – chico; fuerte – débil; pesado – liviano.
La percepción del individuo de la actividad del objeto o concepto.
Ejemplo escalas: activo – pasivo; rápido – lento; frio – caliente.

c. Construcción.
El método para el diferencial semántico debe ser visto como un método
para reunir cierto tipo de información (un método que pude ser generali-
zado), el cual tiene que constituirse por las demandas que presenta cierto
problema de investigación.
• selección del objeto (concepto): “objeto” se usa para determinar que
significa el “estimulo” que da ”reacción” (respuesta) en el individuo a
través de su indicación en las escalas de adjetivos.
El objeto puede ser verbal; puede consistir de solo una palabra o de
varias palabras.
Objetos no – verbales pueden ser diferenciados (cuadros u otros estí-
mulos estéticos).
El investigador deberá pensar en elegir objetos que se supone darán:
–

–

–
Diferencias individuales (para poder estudiar la variación en el ma-
terial)
Que tengan un solo significado (de otra manera hay riesgo de vaci-
lación en la elección).
Se supone que todos los individuos lo conozcan bien (de otro modo
habrá regresión al medio de la escala).

d. Selección de escalas.
Al seleccionar las escalas debe estar seguro de tener los tres factores: eva-
luación, potencia y actividad representada.

Para cada factor uno puede seleccionar cierta cantidad de escalas correla-
cionadas y a través de estas obtener el promedio de las escalas. Esto aumen-
tara la representatividad y la confiabilidad.

Los promedios son llamados factor scores. El criterio más importante para
la selección de escalas así es su patrón factorial (generalmente se seleccio-
nan tres escalas para cada factor. Las escalas elegidas cargadas en ese factor
son bajas en los otros).

Otro criterio es la relevancia de las escalas al objeto. Las escalas con com-
posición factorial desconocida pueden ser usadas si se suponen ser muy
relevantes para la investigación. En este caso uno puede incluir escalas
con composición factorial conocida y usarlas como escalas de referencia
y estudiar como las escalas “desconocidas” co varían con las escalas de re-
ferencia.

e. El test de OSGOOD y la medición de actitudes.
Tal como se ha hecho notar el test de OSGOOD no es una escala de acti-
tudes en el sentido corriente, sino que las investigaciones han demostrado
que los valores de escala pueden ser usados para la medición de actitudes.
La actitud general se mide pero no el contenido de la actitud en el signi-
ficado denotativo.
UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

Ejemplo escalas bipolares: regular – irregular; limpio – sucio; bueno
– malo; valioso – despreciable.

Monografias.com

Si considera que indica rigidez pero en menor grado, marcaria en:
CONSTRUCCIÓN DE INSTRUMENTOS
PSICOLÓGICOS MANUAL AUTOFORMATIVO
83
FLEXIBLE
NEGATIVO
DELICADO
—;
—;
—;
—;
—;
—;
—;
—;
—;
—;
—;
—;
—;
—;
—;
—;
—;
—;
—;
—;
—;
RIGIDO.
POSITIVO.
RUDO.
FLEXIBLE
—;
—;
—;
—;
—;
X
—;
RIGIDO.
Diagrama
Objetivos Inicio
Desarrollo
de contenidos
Actividades
Autoevaluación
LECTURA SELECCIONADAS N° 2
Lecturas Glosario Bibliografía
seleccionadas

De Anastasi, A 24.

Recordatorio Anotaciones
Constituye un nuevo enfoque en Psicometría que permite superar algunas de las
limitaciones de la Teoría Clásica de los test (TC).

Su propósito es similar al de la Teoría clásica. Pretende obtener la puntuación que
corresponde a una persona en una dimensión o rasgo, como su inteligencia, su
nivel en un rasgo de personalidad, su dominio en una materia, etc.

La TRI debe su nombre a que se centra más en las propiedades de los ítems indivi-
duales que en las propiedades globales del test, como hacía la TC.

Lo que vamos a aprender en esta lectura seleccionada sólo es aplicable a ítems que
puedan cuantificarse como cero o uno. La TRI permite también el análisis de ítems
con otros formatos de respuesta (por ejemplo, las categorías ordenadas), pero no
son tratados en esta lectura.

Buena parte de la Psicometría actual está relacionada con la TRI para ampliar tus
conocimientos, puedes consultar los libros de Muñiz (1997), Hambleton, Swami-
nathan y Rogers (1991) y Hambleton y Swaminathan (1985).

Entre las principales limitaciones de la TC se pueden exponer las siguientes:
a. La principal limitación consiste en que las características del test y las puntua-
ciones delas personas no pueden ser separados: Se define la puntuación de una
persona como el número de preguntas que acierta, y la dificultad de un ítem

22 OSGOOD, C E. "Semantic differential technique in the comparative study of cultures", en. American Anthro-
pologist, n. 66, 1964, pp. 210-223.
23 OSGOOD, C E. "Semantic differential technique in the comparative study of cultures", en. American Anthro-
pologist, n. 66, 1964, pp. 234-276.
24 ANASTASI, A, 1998. México, “Test Psicológicos” PRENTICE HALL, p.187
UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

OSGOOD 22 piensa que con la ayuda de los valores de escala es posible
formar una escala universal que podría ser usada para medir la actitud
hacia cualquier objeto.
La ventaja seria: 1) económica (tiempo, dinero, trabajo).2) disponible y
así hacer la medición de actitudes que no han sido previstas. 3) posibilidad
para comparar entre diferentes investigaciones de actitud y actitud hacia
diferentes objetos.

El procedimiento consiste en señalar con una x en la escala el lugar en el
cual usted ubicaría su opinión acerca del texto.
Por ejemplo: la palabra fanático podría ser evaluada en las siguientes es-
calas 23:

Monografias.com

84
–

–

–
Las características de los ítems dependen del grupo de personas en el que se
han aplicado.
La puntuación de una persona depende del conjunto particular de ítems
administrados.
La puntuación que una persona obtenga será diferente si le aplicamos dos
test que midan la misma característica pero cuyo nivel de dificultad sea dife-
rente. Esto hace muy difícil comparar dichas puntuaciones, que sólo podrán
interpretarse en relación al test en el que fueron obtenidas.
Frente a la TC, una de las propiedades de la TRI es su invarianza, en un doble
sentido: invarianza de los ítems respecto a posibles diferentes distribuciones de
la habilidad o del rasgo (en lo sucesivo nivel de habilidad y de rasgo serán sinó-
nimos), e invarianza de la habilidad medida a partir de diferentes conjuntos de
ítems. Haremos un breve comentario sobre cada tipo de invarianza.

Si las condiciones de aplicación de la TRI se cumplen, ha de ocurrir lo siguiente:
–

–
Sea cual sea la distribución de los niveles de rasgo obtendremos las mismas
estimaciones

Partes: 1, 2, 3, 4, 5

Página anterior

Volver al principio del trabajo

Página siguiente