La Confiabilidad 1. Medida de estabilidad: Un mismo instrumento de medición se aplica dos más veces a un mismo grupo de personas, después de cierto periodo. Confiabilidad por test-retest, r de Pearson. 2. Método de formas alternativas o paralelas: Aquí no se administra el mismo instrumento de medición, sino dos o más versiones equivalentes de este. Coeficiente de correlación producto-momento de Pearson. 3. Método de mitades partidas: Se necesita solo una aplicación, el total del ítems se divide en dos partes y se comparan los resultados. (Pearson y Spearman-Brown). 4. Medidas de consistencia interna: Requiere sólo una administración. Confiabilidad del test según el método de división de las mitades por Rulon y Guttman, Fórmula 20 de Kuder-Richardson, el Coeficiente 6 del Alfa de Cronbach.
La Validez Según Herrera (1998): Grado en el que un instrumento en verdad mide la variable que se busca medir. Ejm: Un instrumento válido para medir la inteligencia debe medir la inteligencia y no la memoria. 0 0,5 1 0,53 a menos Validez nula 0,54 a 0,59 Validez baja 0,60 a 0,65 Válida 0,66 a 0,71 Muy válida 0,72 a 0,99 Excelente validez 1.0 Validez perfecta 13.
Para ampliar, observa el siguiente video:

VALIDEZ DE CONTENIDO: Grado en que un instrumento refleja un dominio específico de contenido de lo que se mide. Ejm: Una prueba de operaciones aritméticas no tendrá validez de contenido si incluye sólo problemas de adición y ecluye problemas de sustracción, multiplicación y división (Validez de juicio de eperto).
VALIDEZ DE CRITERIO: Se establece al validar un instrumento de medición al compararlo con algún criterio eterno que pretende medir lo mismo. Validez concurrente y la validez predictiva. En las campañas electorales, los sondeos se comparan con los resultados finales de las elecciones. Ejm: Coeficiente de Contingencias, Spearman Brow, Pearson, Alfa de Cronbach y la Técnica Aiken.
VALIDEZ DE CONSTRUCTO: Debe eplicar el modelo teórico empírico que subyace a la variable de interés. Ejm: El Análisis de Factores y Análisis de Cofactores, el Análisis de Covarianza. Validez total =Validez de contenido+ Validez de criterio+ Validez de constructo 14
ASPECTOS DETERMINANTES EN LA CONFIABILIDAD DE UN INSTRUMENTO
Evitar preguntas ambiguas que puedan inducir respuestas distintas en momentos diferentes. qNo olvidar que la medición puede sufrir inestabilidad temporal. qEl contenido del instrumento debe abarcar todas las variables que se quieren medir.
PRUEBAS PARALELAS
También conocidas como ejecución de pruebas en paralelo, las pruebas paralelas ponen a prueba diferentes módulos o aplicaciones en varios navegadores al mismo tiempo, en lugar de hacerlo uno por uno. Esto se hace con la finalidad de reducir el tiempo de ejecución de pruebas.
Las pruebas en paralelo ayudan a reducir el tiempo y los esfuerzos de ejecución, resultando en un tiempo de entrega más rápido.
Lo opuesto a las pruebas paralelas son las pruebas secuenciales, donde las pruebas se ejecutan una por una. Este es un enfoque de prueba que consume mucho tiempo, recursos y esfuerzos.

VALIDEZ DE CONTENIDO: Grado en que un instrumento refleja un dominio específico de contenido de lo que se mide. Ejm: Una prueba de operaciones aritméticas no tendrá validez de contenido si incluye sólo problemas de adición y ecluye problemas de sustracción, multiplicación y división (Validez de juicio de eperto).
VALIDEZ DE CRITERIO: Se establece al validar un instrumento de medición al compararlo con algún criterio eterno que pretende medir lo mismo. Validez concurrente y la validez predictiva. En las campañas electorales, los sondeos se comparan con los resultados finales de las elecciones. Ejm: Coeficiente de Contingencias, Spearman Brow, Pearson, Alfa de Cronbach y la Técnica Aiken.
VALIDEZ DE CONSTRUCTO: Debe eplicar el modelo teórico empírico que subyace a la variable de interés. Ejm: El Análisis de Factores y Análisis de Cofactores, el Análisis de Covarianza. Validez total =Validez de contenido+ Validez de criterio+ Validez de constructo 14
ASPECTOS DETERMINANTES EN LA CONFIABILIDAD DE UN INSTRUMENTO
Evitar preguntas ambiguas que puedan inducir respuestas distintas en momentos diferentes. qNo olvidar que la medición puede sufrir inestabilidad temporal. qEl contenido del instrumento debe abarcar todas las variables que se quieren medir.
PRUEBAS PARALELAS
También conocidas como ejecución de pruebas en paralelo, las pruebas paralelas ponen a prueba diferentes módulos o aplicaciones en varios navegadores al mismo tiempo, en lugar de hacerlo uno por uno. Esto se hace con la finalidad de reducir el tiempo de ejecución de pruebas.
Las pruebas en paralelo ayudan a reducir el tiempo y los esfuerzos de ejecución, resultando en un tiempo de entrega más rápido.
Lo opuesto a las pruebas paralelas son las pruebas secuenciales, donde las pruebas se ejecutan una por una. Este es un enfoque de prueba que consume mucho tiempo, recursos y esfuerzos.
Beneficios
Aceleran la ejecución: las pruebas en paralelo ayudan a realizar pruebas en navegadores simultáneamente, lo que proporciona una mejor cobertura de pruebas en menos tiempo.
Aumenta la cobertura de prueba: una mejor cobertura de prueba es otro beneficio de las pruebas paralelas. Permiten realizar pruebas en más dispositivos móviles o combinaciones de navegadores y sistemas operativos a la vez. Una cobertura de prueba extendida mitiga el riesgo y reduce la posibilidad de que algún defecto pase desapercibido.
Rompe el cuello de botella de las pruebas: con mucha frecuencia, las pruebas son el cuello de botella en un ‘pipeline’ DevOps. Las pruebas tediosas demoran todo el ciclo de software. Las pruebas paralelas ayudan a eliminar este tipo de cuello de botella, acelerando las pruebas, reduciendo riesgos y permitiendo la visibilidad continua de la calidad.
Corrección temprana de errores: las pruebas paralelas también permiten corregir errores durante el sprint y no después. Esto reduce significativamente el tiempo de corrección de errores de los desarrolladores, dándoles más libertad para innovar y crear nuevas funciones, en lugar de dedicarse a corregir errores continuamente.
División por mitades
La prueba de división por mitades para la fiabilidad de la consistencia interna es el tipo más fácil y consiste en dividir una prueba en dos mitades. Por ejemplo, un cuestionario para medir la extroversión podría dividirse en preguntas pares e impares.
El coeficiente alfa de Cronbach es la forma más sencilla y conocida de medir la consistencia interna y es la primera aproximación a la validación del constructo de una escala. El coeficiente alfa de Cronbach debe entenderse como una medida de la correlación de los ítems que forman una escala.
Interpretación. El coeficiente Alfa de Cronbach oscila entre el 0 y el 1. Cuanto más próximo esté a 1, más consistentes serán los ítems serán entre sí (y viceversa). Por otro lado, hay que tener en cuenta que a mayor longitud del test, mayor será alfa (α).
El alfa de Cronbach se usa para determinar la consistencia interna de una prueba con una única dimensión. Cuando se usan instrumentos que miden dos o más dimensiones distintas, aunque sean de un mismo constructo, se corre el riesgo de subestimar la consistencia interna (Oviedo y Arias, 2005).
Método Kuder-Richardson
La fórmula 20 de Kuder-Richardson se indica para el cálculo de la consistencia interna de escalas dicotómicas y el coeficiente de alfa de Cronbach para escalas politómicas. Estos coeficientes tienen equivalencia matemática
También llamados KR20 y KR21 (Fórmula 20 y Fórmula 21 de Kuder-Richardson, respectivamente). Se trata de dos fórmulas empleadas para establecer la fiabilidad de un examen a partir de las características estadísticas de las preguntas del mismo, concretamente sus medias y sus varianza.
Estrategia test-retest
La estrategia test-retest consiste en la aplicación de un mismo instrumento a una misma muestra de sujetos en al menos dos momentos diferentes. No existe un criterio único respecto de cual debe ser el lapso adecuado entre la primera y segunda aplicación.
¿Qué es la confiabilidad test-retest?
La evaluación de la confiabilidad mediante el procedimiento test- retest implica la aplicación del mismo test dos veces a los mismos sujetos. La aplicaciones se pueden realizar inmediatamente o dejando un intervalo de tiempo entre el test y el retest.
Aceleran la ejecución: las pruebas en paralelo ayudan a realizar pruebas en navegadores simultáneamente, lo que proporciona una mejor cobertura de pruebas en menos tiempo.
Aumenta la cobertura de prueba: una mejor cobertura de prueba es otro beneficio de las pruebas paralelas. Permiten realizar pruebas en más dispositivos móviles o combinaciones de navegadores y sistemas operativos a la vez. Una cobertura de prueba extendida mitiga el riesgo y reduce la posibilidad de que algún defecto pase desapercibido.
Rompe el cuello de botella de las pruebas: con mucha frecuencia, las pruebas son el cuello de botella en un ‘pipeline’ DevOps. Las pruebas tediosas demoran todo el ciclo de software. Las pruebas paralelas ayudan a eliminar este tipo de cuello de botella, acelerando las pruebas, reduciendo riesgos y permitiendo la visibilidad continua de la calidad.
Corrección temprana de errores: las pruebas paralelas también permiten corregir errores durante el sprint y no después. Esto reduce significativamente el tiempo de corrección de errores de los desarrolladores, dándoles más libertad para innovar y crear nuevas funciones, en lugar de dedicarse a corregir errores continuamente.
División por mitades
La prueba de división por mitades para la fiabilidad de la consistencia interna es el tipo más fácil y consiste en dividir una prueba en dos mitades. Por ejemplo, un cuestionario para medir la extroversión podría dividirse en preguntas pares e impares.
Alfa de Cronbach
El coeficiente alfa de Cronbach es la forma más sencilla y conocida de medir la consistencia interna y es la primera aproximación a la validación del constructo de una escala. El coeficiente alfa de Cronbach debe entenderse como una medida de la correlación de los ítems que forman una escala.
Interpretación. El coeficiente Alfa de Cronbach oscila entre el 0 y el 1. Cuanto más próximo esté a 1, más consistentes serán los ítems serán entre sí (y viceversa). Por otro lado, hay que tener en cuenta que a mayor longitud del test, mayor será alfa (α).
El alfa de Cronbach se usa para determinar la consistencia interna de una prueba con una única dimensión. Cuando se usan instrumentos que miden dos o más dimensiones distintas, aunque sean de un mismo constructo, se corre el riesgo de subestimar la consistencia interna (Oviedo y Arias, 2005).
Método Kuder-Richardson
La fórmula 20 de Kuder-Richardson se indica para el cálculo de la consistencia interna de escalas dicotómicas y el coeficiente de alfa de Cronbach para escalas politómicas. Estos coeficientes tienen equivalencia matemática
También llamados KR20 y KR21 (Fórmula 20 y Fórmula 21 de Kuder-Richardson, respectivamente). Se trata de dos fórmulas empleadas para establecer la fiabilidad de un examen a partir de las características estadísticas de las preguntas del mismo, concretamente sus medias y sus varianza.
Estrategia test-retest
La estrategia test-retest consiste en la aplicación de un mismo instrumento a una misma muestra de sujetos en al menos dos momentos diferentes. No existe un criterio único respecto de cual debe ser el lapso adecuado entre la primera y segunda aplicación.
¿Qué es la confiabilidad test-retest?
La evaluación de la confiabilidad mediante el procedimiento test- retest implica la aplicación del mismo test dos veces a los mismos sujetos. La aplicaciones se pueden realizar inmediatamente o dejando un intervalo de tiempo entre el test y el retest.
No hay comentarios:
Publicar un comentario