Menú
gratis
Registro
Hogar  /  Héroes de cuento de hadas/ Términos y conceptos básicos de estadística médica. Importancia estadística: definición, concepto, significancia, ecuaciones de regresión y prueba de hipótesis

Términos y conceptos básicos de estadística médica. Importancia estadística: definición, concepto, significancia, ecuaciones de regresión y prueba de hipótesis

La confiabilidad estadística es esencial en la práctica de cálculo de la FCC. Se señaló anteriormente que del mismo población Se pueden seleccionar varias muestras:

Si se seleccionan correctamente, entonces sus indicadores promedio y los indicadores de la población general difieren ligeramente entre sí en la magnitud del error de representatividad, teniendo en cuenta la confiabilidad aceptada;

Si se seleccionan de diferentes poblaciones, la diferencia entre ellas resulta significativa. La estadística consiste en comparar muestras;

Si difieren de manera insignificante, no principal, insignificante, es decir, en realidad pertenecen a la misma población general, la diferencia entre ellos se considera estadísticamente poco confiable.

Estadísticamente confiable Una diferencia muestral es una muestra que difiere significativa y fundamentalmente, es decir, pertenece a poblaciones generales diferentes.

Evaluación de la FCC significancia estadística diferencias muestrales significa resolver muchos problemas prácticos. Por ejemplo, la introducción de nuevos métodos de enseñanza, programas, conjuntos de ejercicios, pruebas y ejercicios de control está asociada con sus pruebas experimentales, lo que debería mostrar que el grupo de prueba es fundamentalmente diferente del grupo de control. Por lo tanto, se utilizan métodos estadísticos especiales, llamados criterios de significación estadística, para detectar la presencia o ausencia de una diferencia estadísticamente significativa entre muestras.

Todos los criterios se dividen en dos grupos: paramétricos y no paramétricos. Los criterios paramétricos requieren la presencia de una ley de distribución normal, es decir Esto significa la determinación obligatoria de los principales indicadores de la ley normal: la media aritmética y la desviación estándar s. Los criterios paramétricos son los más precisos y correctos. Las pruebas no paramétricas se basan en diferencias de rango (ordinales) entre elementos de la muestra.

Estos son los principales criterios de significación estadística utilizados en la práctica de la FCC: prueba de Student y prueba de Fisher.

prueba t de Student lleva el nombre del científico inglés K. Gosset (Estudiante - seudónimo), quien descubrió este método. La prueba de Student es paramétrica y se utiliza para comparar los valores absolutos de muestras. Las muestras pueden variar en tamaño.

prueba t de Student se define así.

1. Encuentre la prueba t de Student usando la siguiente fórmula:


¿Dónde están los promedios aritméticos de las muestras comparadas? t 1, t 2: errores de representatividad identificados con base en los indicadores de las muestras comparadas.

2. La práctica en la FCC ha demostrado que para trabajo deportivo basta con aceptar la confiabilidad de la cuenta P = 0,95.

Para la confiabilidad del conteo: P = 0,95 (a = 0,05), con el número de grados de libertad

k = n 1 + n 2 - 2 usando la tabla del Apéndice 4 encontramos el valor del valor límite del criterio ( t gr).

3. Con base en las propiedades de la ley de distribución normal, el criterio de Student compara t y t gr.

Sacamos conclusiones:

si t t gr, entonces la diferencia entre las muestras comparadas es estadísticamente significativa;

si t t gr, entonces la diferencia es estadísticamente insignificante.

Para los investigadores en el campo de FCS, evaluar la significación estadística es el primer paso para resolver un problema específico: si las muestras que se comparan son fundamentalmente o no fundamentalmente diferentes entre sí. El siguiente paso es evaluar esta diferencia desde un punto de vista pedagógico, que viene determinado por las condiciones de la tarea.

Consideremos la aplicación de la prueba de Student usando un ejemplo específico.

Ejemplo 2.14. Se evaluó la frecuencia cardíaca (lpm) de un grupo de 18 sujetos antes de x i y después y yo calentamiento.

Evaluar la efectividad del calentamiento en función de la frecuencia cardíaca. Los datos iniciales y los cálculos se presentan en la tabla. 2.30 y 2.31.

Tabla 2.30

Procesamiento de indicadores de frecuencia cardíaca antes del calentamiento.


Los errores para ambos grupos coincidieron, ya que los tamaños de muestra son iguales (el mismo grupo se estudia en diferentes condiciones), y las desviaciones estándar fueron s x = s y = 3 latidos/min. Pasemos a definir la prueba de Student:

Fijamos la fiabilidad de la cuenta: P = 0,95.

Número de grados de libertad k 1 = n 1 + n 2 - 2 = 18 + 18-2 = 34. De la tabla del Apéndice 4 encontramos t gr= 2,02.

Inferencia estadística. Dado que t = 11,62 y la frontera t gr = 2,02, entonces 11,62 > 2,02, es decir t > t gr, por lo tanto la diferencia entre las muestras es estadísticamente significativa.

Conclusión pedagógica. Se encontró que en términos de frecuencia cardíaca la diferencia entre el estado del grupo antes y después del calentamiento es estadísticamente significativa, es decir. significativo, fundamental. Entonces, basándonos en el indicador de frecuencia cardíaca, podemos concluir que el calentamiento es efectivo.

Criterio de Fisher es paramétrico. Se utiliza al comparar tasas de dispersión de muestras. Esto suele significar una comparación en términos de estabilidad del rendimiento deportivo o estabilidad de los indicadores funcionales y técnicos en la práctica. cultura fisica y deportes. Las muestras pueden ser de diferentes tamaños.

El criterio de Fisher se define en la siguiente secuencia.

1. Encuentre el criterio de Fisher F usando la fórmula


donde , son las varianzas de las muestras comparadas.

Las condiciones del criterio de Fisher estipulan que en el numerador de la fórmula F hay una gran dispersión, es decir el número F es siempre mayor que uno.

Establecemos la confiabilidad del recuento: P = 0,95 - y determinamos el número de grados de libertad para ambas muestras: k 1 = n 1 - 1, k 2 = n 2 - 1.

Utilizando la tabla del Apéndice 4, encontramos el valor límite del criterio F gramo.

Comparación de los criterios F y F. gramo nos permite formular conclusiones:

si F > F gr, entonces la diferencia entre las muestras es estadísticamente significativa;

si F< F гр, то различие между выборками статически недо­стоверно.

Pongamos un ejemplo específico.

Ejemplo 2.15. Analicemos dos grupos de jugadores de balonmano: xyo (n 1= 16 personas) y y i (n 2 = 18 personas). Estos grupos de deportistas fueron estudiados para el tiempo o los tiempos de despegue al lanzar el balón a la portería.

¿Los indicadores de repulsión son del mismo tipo?

Los datos iniciales y los cálculos básicos se presentan en la tabla. 2,32 y 2,33.

Tabla 2.32

Procesamiento de indicadores de repulsión del primer grupo de jugadores de balonmano.


Definamos el criterio de Fisher:





Según los datos presentados en la tabla del Apéndice 6, encontramos Fgr: Fgr = 2,4

Prestemos atención al hecho de que en la tabla del Apéndice 6 se enumeran los números de grados de libertad de mayor y menor dispersión al acercarse grandes números se vuelve más áspero. Así, el número de grados de libertad de la dispersión mayor sigue en este orden: 8, 9, 10, 11, 12, 14, 16, 20, 24, etc., y la más pequeña: 28, 29, 30, 40. , 50, etc. d.

Esto se explica por el hecho de que a medida que aumenta el tamaño de la muestra, las diferencias en la prueba F disminuyen y es posible utilizar valores tabulares cercanos a los datos originales. Entonces, en el ejemplo 2,15 =17 está ausente y podemos tomar el valor más cercano a él k = 16, del cual obtenemos Fgr = 2,4.

Inferencia estadística. Dado que la prueba de Fisher F= 2,5 > F= 2,4, las muestras son estadísticamente distinguibles.

Conclusión pedagógica. Los valores del (los) tiempo(s) de salida al lanzar el balón a la portería para los jugadores de balonmano de ambos grupos difieren significativamente. Estos grupos deben considerarse diferentes.

Investigaciones futuras deberían revelar la razón de esta diferencia.

Ejemplo 2.20.(sobre la fiabilidad estadística de la muestra ). ¿Ha mejorado la calificación del futbolista si el (los) tiempo(s) desde que se da la señal hasta que se patea el balón al inicio del entrenamiento fue x i y al final y i ?

Los datos iniciales y los cálculos básicos se dan en la tabla. 2,40 y 2,41.

Tabla 2.40

Procesamiento de indicadores de tiempo desde dar una señal hasta golpear la pelota al inicio de una sesión de entrenamiento.


Determinemos la diferencia entre grupos de indicadores utilizando el criterio de Student:

Con confiabilidad P = 0.95 y grados de libertad k = n 1 + n 2 - 2 = 22 + 22 - 2 = 42, usando la tabla del Apéndice 4 encontramos t gr= 2,02. Dado que t = 8,3 > t gr= 2,02: la diferencia es estadísticamente significativa.

Determinemos la diferencia entre grupos de indicadores utilizando el criterio de Fisher:


Según la tabla del Apéndice 2, con confiabilidad P = 0,95 y grados de libertad k = 22-1 = 21, el valor F gr = 21. Dado que F = 1,53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

Inferencia estadística. Según la media aritmética, la diferencia entre grupos de indicadores es estadísticamente significativa. En términos de dispersión (dispersión), la diferencia entre grupos de indicadores no es estadísticamente confiable.

Conclusión pedagógica. Las calificaciones del futbolista han mejorado significativamente, pero se debe prestar atención a la estabilidad de su testimonio.

Preparándose para el trabajo

Antes de realizar este trabajo de laboratorio en la disciplina “Metrología Deportiva” a todos los estudiantes grupo de estudio es necesario formar equipos de trabajo de 3-4 estudiantes en cada uno, para completar conjuntamente la asignación de trabajo de todos los trabajos de laboratorio.

En preparación para el trabajo Familiarícese con las secciones relevantes de la literatura recomendada (consulte la sección 6 de estas pautas) y las notas de las conferencias. Estudiar los apartados 1 y 2 de este trabajo de laboratorio, así como el trabajo asignado al mismo (apartado 4).

Preparar un formulario de informe en hojas estándar de papel de escribir tamaño A4 y rellénelo con los materiales necesarios para el trabajo.

El informe debe contener :

Página delantera indicando el departamento (UC y TR), grupo de estudio, apellido, nombre, patronímico del estudiante, número y título del trabajo de laboratorio, fecha de su realización, así como apellido, grado académico, título académico y cargo del profesor aceptando el trabajo;

Objeto del trabajo;

Fórmulas con valores numéricos que explican los resultados intermedios y finales de los cálculos;

Tablas de valores medidos y calculados;

Requerido por asignación material grafico;

Breves conclusiones sobre los resultados de cada etapa del trabajo asignado y sobre el trabajo realizado en general.

Todos los gráficos y tablas se dibujan cuidadosamente utilizando herramientas de dibujo. Gráfico condicional y designaciones de letras debe cumplir con los estándares GOST. Está permitido preparar un informe utilizando tecnología informática.

Asignación de trabajo

Antes de realizar todas las mediciones, cada miembro del equipo debe estudiar las normas de uso. juego de deportes Dardos que figuran en el Apéndice 7, que son necesarios para llevar a cabo las siguientes etapas de la investigación.

Etapa I de la investigación“Estudio de los resultados del acierto al blanco del juego deportivo de Dardos por parte de cada miembro del equipo para el cumplimiento de la ley de distribución normal según el criterio χ 2 Pearson y el criterio tres sigma"

1. medir (probar) su velocidad (personal) y coordinación de acciones, lanzando dardos de 30 a 40 veces a un objetivo circular en el juego de deportes Dardos.

2. Resultados de las mediciones (pruebas) xyo(con vasos) organizar en la forma serie de variación e ingrese en la tabla 4.1 (columnas, haga todo cálculos necesarios, complete las tablas necesarias y saque conclusiones apropiadas sobre el cumplimiento de la distribución empírica resultante con la ley de distribución normal, por analogía con cálculos, tablas y conclusiones similares del ejemplo 2.12, que figura en la sección 2 de estas pautas en las páginas 7 -10.

Tabla 4.1

Correspondencia de la velocidad y coordinación de las acciones de los sujetos con la ley de distribución normal.

No. redondeado
Total

II – etapa de investigación

“Evaluación de los indicadores promedio de la población general de aciertos al objetivo del juego deportivo Dardos de todos los estudiantes del grupo de estudio en base a los resultados de las mediciones de los miembros de un equipo”

Evaluar los indicadores promedio de velocidad y coordinación de acciones de todos los estudiantes del grupo de estudio (según la lista del grupo de estudio en la revista de la clase) en función de los resultados de acertar en el objetivo de Dardos de todos los miembros del equipo, obtenidos en la primera etapa. de investigación de este trabajo de laboratorio.

1. Documentar los resultados de las mediciones de velocidad y coordinación de acciones. al lanzar dardos a un objetivo circular en un juego de deportes Dardos de todos los miembros de su equipo (2 - 4 personas), que representan una muestra de los resultados de las mediciones de la población general (resultados de las mediciones de todos los estudiantes de un grupo de estudio, por ejemplo, 15 personas), inscribiéndolas en la segunda y tercera columnas Tabla 4.2.

Tabla 4.2

Procesamiento de indicadores de rapidez y coordinación de acciones.

miembros de la brigada

No.
Total

En el cuadro 4.2 bajo debe ser entendido , puntuación media igualada (ver resultados del cálculo en la Tabla 4.1) miembros de su equipo ( , obtenido en la primera etapa de la investigación. Cabe señalar que, por regla general, La Tabla 4.2 contiene el valor promedio calculado de los resultados de medición obtenidos por un miembro del equipo en la primera etapa de la investigación. , ya que la probabilidad de que coincidan los resultados de las mediciones de diferentes miembros del equipo es muy pequeña. Entonces, por regla general, los valores en columna Tabla 4.2 para cada fila - igual a 1, A en la línea “Total "columnas" ", se escribe el número de miembros de su equipo.

2. Realice todos los cálculos necesarios para completar la tabla 4.2, así como otros cálculos y conclusiones similares a los cálculos y conclusiones del ejemplo 2.13 que se dan en la segunda sección de este desarrollo metodológico en las páginas 13-14. Se debe tener en cuenta al calcular el error de representatividad. "metro" es necesario utilizar la fórmula 2.4 dada en la página 13 de este desarrollo metodológico, ya que la muestra es pequeña (n, y se conoce el número de elementos de la población general N, y es igual al número de estudiantes del grupo de estudio, según el listado de la revista del grupo de estudio.

III – etapa de investigación

Evaluación de la efectividad del calentamiento según el indicador “Velocidad y coordinación de acciones” por cada miembro del equipo mediante la prueba t de Student

Evaluar la efectividad del calentamiento para el lanzamiento de dardos a la diana del juego deportivo "Dardos", realizado en la primera etapa de investigación de este trabajo de laboratorio, por cada miembro del equipo según el indicador "Velocidad y coordinación de acciones", utilizando el criterio de Student, un criterio paramétrico para la confiabilidad estadística de la ley de distribución empírica con respecto a la ley de distribución normal.

… Total

2. variaciones y RMS , resultados de las mediciones del indicador “Velocidad y coordinación de acciones” en base a los resultados del calentamiento, dado en la tabla 4.3, (ver cálculos similares dados inmediatamente después de la tabla 2.30 del ejemplo 2.14 en la página 16 de este desarrollo metodológico).

3. cada miembro equipo de trabajo medir (probar) su velocidad (personal) y coordinación de acciones después del calentamiento,

… Total

5. Realizar cálculos promedio variaciones y RMS ,resultados de las mediciones del indicador “Velocidad y coordinación de acciones” después del calentamiento, dado en la tabla 4.4, anote el resultado general de la medición basándose en los resultados del calentamiento (ver cálculos similares dados inmediatamente después de la tabla 2.31 del ejemplo 2.14 en la página 17 de este desarrollo metodológico).

6. Realice todos los cálculos y conclusiones necesarios similares a los cálculos y conclusiones del ejemplo 2.14 que figuran en la segunda sección de este desarrollo metodológico en las páginas 16-17. Se debe tener en cuenta al calcular el error de representatividad. "metro" es necesario utilizar la fórmula 2.1 dada en la página 12 de este desarrollo metodológico, ya que la muestra es n, y se desconoce el número de elementos de la población general N (.

IV – etapa de investigación

Evaluación de la uniformidad (estabilidad) de los indicadores “Rapidez y coordinación de acciones” de dos miembros del equipo utilizando el criterio de Fisher

Evaluar la uniformidad (estabilidad) de los indicadores “Rapidez y coordinación de acciones” de dos miembros del equipo utilizando el criterio de Fisher, con base en los resultados de medición obtenidos en la tercera etapa de la investigación en este trabajo de laboratorio.

Para hacer esto necesitas hacer lo siguiente.

Utilizando los datos de las tablas 4.3 y 4.4, los resultados del cálculo de las varianzas de estas tablas obtenidos en la tercera etapa de la investigación, así como la metodología para calcular y aplicar el criterio de Fisher para evaluar la uniformidad (estabilidad) de los indicadores deportivos, dados en ejemplo 2.15 en las páginas 18-19 de este desarrollo metodológico, extraiga conclusiones estadísticas y pedagógicas apropiadas.

V – etapa de investigación

Evaluación de grupos de indicadores “Rapidez y coordinación de acciones” de un miembro del equipo antes y después del calentamiento

Veamos un ejemplo de aplicación típica. métodos estadísticos en medicina. Los creadores del fármaco sugieren que aumenta la diuresis en proporción a la dosis tomada. Para probar esta hipótesis, administran a cinco voluntarios diferentes dosis del fármaco.

Según los resultados de la observación, se traza una gráfica de diuresis versus dosis (fig. 1.2A). La dependencia es visible a simple vista. Los investigadores se felicitan unos a otros por el descubrimiento y al mundo por el nuevo diurético.

De hecho, los datos sólo nos permiten afirmar de forma fiable que se observó una diuresis dosis-dependiente en estos cinco voluntarios. El hecho de que esta dependencia se manifestará en todas las personas que toman el medicamento no es más que una suposición.
zy

Con

vida No se puede decir que sea infundado; de lo contrario, ¿por qué realizar experimentos?

Pero la droga salió a la venta. Todo mas gente tomarlo con la esperanza de aumentar su producción de orina. Entonces, ¿qué vemos? Vemos la Figura 1.2B, que indica la ausencia de cualquier conexión entre la dosis del fármaco y la diuresis. Los círculos negros indican datos del estudio original. La estadística tiene métodos que nos permiten estimar la probabilidad de obtener una muestra tan “poco representativa” y, de hecho, confusa. Resulta que, en ausencia de una conexión entre la diuresis y la dosis del fármaco, la “dependencia” resultante se observaría en aproximadamente 5 de cada 1000 experimentos. Entonces, en este caso, los investigadores simplemente no tuvieron suerte. Incluso si hubieran utilizado los métodos estadísticos más avanzados, eso no les habría impedido cometer errores.

Hemos dado este ejemplo ficticio, pero nada alejado de la realidad, para no señalar la inutilidad.
ness de las estadísticas. Habla de otra cosa, del carácter probabilístico de sus conclusiones. Como resultado de aplicar el método estadístico, no obtenemos la verdad última, sino sólo una estimación de la probabilidad de un supuesto particular. Además, cada método estadístico se basa en su propio modelo matemático y sus resultados son correctos en la medida en que dicho modelo se corresponda con la realidad.

Más sobre el tema CONFIABILIDAD Y SIGNIFICADO ESTADÍSTICO:

  1. Diferencias estadísticamente significativas en los indicadores de calidad de vida.
  2. Población estadística. Características contables. El concepto de investigación continua y selectiva. Requisitos para datos estadísticos y el uso de documentos contables y de presentación de informes.
  3. ABSTRACTO. ESTUDIO DE CONFIABILIDAD DE LAS INDICACIONES DE TONÓMETRO PARA MEDIR LA PRESIÓN INTRAOCULAR A TRAVÉS DEL PÁRPADO 2018, 2018

FUNCIÓN PAGO. La función de significación estadística solo está disponible en planes seleccionados. Comprueba si está dentro.

Podrás averiguar si existen diferencias estadísticamente significativas en las respuestas recibidas de diferentes grupos encuestados a las preguntas de la encuesta. Para utilizar la función de significancia estadística en SurveyMonkey, debes:

  • Habilite la función de significación estadística al agregar una regla de comparación a una pregunta de su encuesta. Seleccione grupos de encuestados para compararlos y ordenar los resultados de la encuesta en grupos para realizar una comparación visual.
  • Examine las tablas con datos sobre las preguntas de su encuesta para identificar la presencia de estadísticas. diferencias significativas en las respuestas recibidas de diferentes grupos de encuestados.

Ver significación estadística

Si sigue los pasos a continuación, puede crear una encuesta que muestre significación estadística.

1. Agregue preguntas cerradas a su encuesta

Para mostrar significancia estadística al analizar los resultados, deberá aplicar una regla de comparación a cualquier pregunta de su encuesta.

Puede aplicar la regla de comparación y calcular la significancia estadística de las respuestas si utiliza uno de los siguientes tipos de preguntas en el diseño de su encuesta:

Es necesario asegurarse de que las opciones de respuesta propuestas se puedan dividir en grupos completos. Las opciones de respuesta que seleccione para comparar cuando cree una regla de comparación se utilizarán para organizar los datos en tablas cruzadas a lo largo de la encuesta.

2. Recoge respuestas

Una vez que haya completado su encuesta, cree un recopilador para distribuirla. Hay varias maneras.

Debe recibir al menos 30 respuestas para cada opción de respuesta que planee usar en su regla de comparación para activar y ver la significación estadística.

Ejemplo de encuesta

Quiere saber si los hombres están significativamente más satisfechos con sus productos que las mujeres.

  1. Agregue dos preguntas de opción múltiple a su encuesta:
    ¿Cuál es tu género? (masculino, femenino)
    ¿Está satisfecho o insatisfecho con nuestro producto? (satisfecho, insatisfecho)
  2. Asegúrese de que al menos 30 encuestados seleccionen "masculino" para la pregunta de género Y que al menos 30 encuestados seleccionen "femenino" como género.
  3. Agregue una regla de comparación a la pregunta "¿Cuál es su género?" y seleccione ambas opciones de respuesta según sus grupos.
  4. Utilice la tabla de datos debajo del cuadro de preguntas "¿Está satisfecho o insatisfecho con nuestro producto?" para ver si alguna opción de respuesta muestra una diferencia estadísticamente significativa

¿Qué es una diferencia estadísticamente significativa?

Una diferencia estadísticamente significativa significa que el uso análisis estadístico Se estableció que existían diferencias significativas entre las respuestas de un grupo de encuestados y las respuestas de otro grupo. La significación estadística significa que los números obtenidos son significativamente diferentes. Este conocimiento le será de gran ayuda en el análisis de datos. Sin embargo, usted determina la importancia de los resultados obtenidos. Eres tú quien decide cómo interpretar los resultados de la encuesta y qué acciones se deben tomar en base a ellos.

Por ejemplo, recibe más quejas de clientas que de clientes masculinos. ¿Cómo podemos determinar si esa diferencia es real y si es necesario tomar medidas al respecto? Una excelente manera de probar sus observaciones es realizar una encuesta que le mostrará si los clientes masculinos están significativamente más satisfechos con su producto. Utilizando una fórmula estadística, nuestra función de significación estadística le permitirá determinar si su producto es realmente mucho más atractivo para los hombres que para las mujeres. Esto le permitirá tomar medidas basadas en hechos en lugar de conjeturas.

Diferencia estadísticamente significativa

Si sus resultados están resaltados en la tabla de datos, significa que los dos grupos de encuestados son significativamente diferentes entre sí. El término "significativo" no significa que los números resultantes tengan ninguna importancia o significado particular, sólo que existe una diferencia estadística entre ellos.

Ninguna diferencia estadísticamente significativa

Si sus resultados no están resaltados en la tabla de datos correspondiente, esto significa que, aunque puede haber una diferencia en las dos cifras que se comparan, no existe una diferencia estadística entre ellas.

Las respuestas sin diferencias estadísticamente significativas demuestran que no hay diferencias significativas entre los dos elementos que se comparan dado el tamaño de la muestra que se utiliza, pero esto no significa necesariamente que no sean significativas. Quizás al aumentar el tamaño de la muestra pueda identificar una diferencia estadísticamente significativa.

Tamaño de la muestra

Si tiene un tamaño de muestra muy pequeño, sólo serán significativas las diferencias muy grandes entre los dos grupos. Si tiene un tamaño de muestra muy grande, tanto las diferencias pequeñas como las grandes se considerarán significativas.

Sin embargo, el hecho de que dos números sean estadísticamente diferentes no significa que la diferencia entre los resultados suponga una diferencia para usted. significado práctico. Tendrá que decidir por sí mismo qué diferencias son significativas para su encuesta.

Calcular la importancia estadística

Calculamos la significación estadística utilizando un nivel de confianza estándar del 95%. Si una opción de respuesta se muestra como estadísticamente significativa, significa que solo por casualidad o debido a un error de muestreo hay menos del 5% de probabilidad de que ocurra la diferencia entre los dos grupos (a menudo se muestra como: p<0,05).

Para calcular diferencias estadísticamente significativas entre grupos utilizamos las siguientes fórmulas:

Parámetro

Descripción

a1El porcentaje de participantes del primer grupo que respondieron la pregunta de cierta manera, multiplicado por el tamaño de la muestra de este grupo.
b1El porcentaje de participantes del segundo grupo que respondieron la pregunta de cierta manera, multiplicado por el tamaño de la muestra de este grupo.
Proporción de muestra agrupada (p)La combinación de dos acciones de ambos grupos.
Error estándar (SE)Un indicador de en qué medida su participación difiere de la participación real. Un valor más bajo significa que la fracción está cerca de la fracción real, un valor más alto significa que la fracción es significativamente diferente de la fracción real.
Estadístico de prueba (t)Estadística de prueba. El número de desviaciones estándar en las que un valor dado difiere de la media.
Importancia estadísticaSi el valor absoluto del estadístico de prueba es mayor que 1,96* desviaciones estándar de la media, se considera una diferencia estadísticamente significativa.

*1,96 es el valor utilizado para el nivel de confianza del 95% porque el 95% del rango manejado por la función de distribución t de Student se encuentra dentro de 1,96 desviaciones estándar de la media.

Ejemplo de cálculo

Siguiendo con el ejemplo anterior, averigüemos si el porcentaje de hombres que dicen estar satisfechos con su producto es significativamente mayor que el porcentaje de mujeres.

Digamos que 1000 hombres y 1000 mujeres participaron en su encuesta y los resultados de la encuesta mostraron que el 70% de los hombres y el 65% de las mujeres dicen que están satisfechos con su producto. ¿El nivel del 70% es significativamente mayor que el nivel del 65%?

Sustituya los siguientes datos de la encuesta en las fórmulas dadas:

  • p1 (% de hombres satisfechos con el producto) = 0,7
  • p2 (% de mujeres satisfechas con el producto) = 0,65
  • n1 (número de hombres encuestados) = 1000
  • n2 (número de mujeres entrevistadas) = ​​1000

Dado que el valor absoluto del estadístico de prueba es mayor que 1,96, significa que la diferencia entre hombres y mujeres es significativa. En comparación con las mujeres, los hombres tienen más probabilidades de estar satisfechos con su producto.

Ocultar significación estadística

Cómo ocultar la significación estadística para todas las preguntas

  1. Haga clic en la flecha hacia abajo a la derecha de la regla de comparación en la barra lateral izquierda.
  2. Seleccione un elemento Editar regla.
  3. Deshabilitar la función Mostrar significación estadística usando un interruptor.
  4. Haga clic en el botón Aplicar.

Para ocultar la significación estadística de una pregunta, debe:

  1. Haga clic en el botón Melodía encima del diagrama de este número.
  2. Abre la pestaña Opciones de visualización.
  3. Desmarque la casilla junto a Importancia estadística.
  4. Haga clic en el botón Ahorrar.

La opción de visualización se habilita automáticamente cuando se habilita la visualización de significancia estadística. Si desactiva esta opción de visualización, la visualización de significancia estadística también se desactivará.

Active la función de significancia estadística cuando agregue una regla de comparación a una pregunta de su encuesta. Examine las tablas de datos de las preguntas de su encuesta para determinar si existen diferencias estadísticamente significativas en las respuestas recibidas de diferentes grupos de encuestados.

Importancia estadística

Los resultados obtenidos mediante un procedimiento de investigación particular se denominan estadísticamente significativo, si la probabilidad de que ocurran aleatoriamente es muy pequeña. Este concepto se puede ilustrar con el ejemplo de lanzar una moneda al aire. Supongamos que se lanza la moneda 30 veces; Salió cara 17 veces y cruz 13 veces. Es significativo desviación de este resultado del esperado (15 caras y 15 cruces), ¿o es esta desviación aleatoria? Para responder a esta pregunta, puedes, por ejemplo, lanzar la misma moneda muchas veces, 30 veces seguidas, y al mismo tiempo observar cuántas veces se repite la proporción de “cara” a “cruz” de 17:13. El análisis estadístico nos salva de este tedioso proceso. Con su ayuda, después de los primeros 30 lanzamientos de una moneda, se puede estimar el número posible de apariciones aleatorias de 17 “caras” y 13 “cruces”. Esta evaluación se denomina enunciado probabilístico.

En la literatura científica sobre psicología industrial-organizacional, un enunciado probabilístico en forma matemática se denota mediante la expresión r(probabilidad)< (менее) 0,05 (5 %), которое следует читать как «вероятность менее 5 %». В примере с киданием монеты это утверждение будет означать, что если исследователь проведет 100 опытов, каждый раз кидая монету по 30 раз, то он может ожидать случайного выпадения комбинации из 17 «орлов» и 13 «решек» менее, чем в 5 опытах. Этот результат будет сочтен статистически значимым, поскольку в индустриально-организационной психологии уже давно приняты стандарты статистической значимости 0,05 и 0,01 (pag< 0,01). Este hecho es importante para comprender la literatura, pero no debe interpretarse como que no tiene sentido realizar observaciones que no cumplan con estos estándares. Los llamados resultados de investigación no significativos (observaciones que pueden obtenerse por casualidad) más una a cinco veces de cada 100) puede ser muy útil para identificar tendencias y como guía para futuras investigaciones.

También cabe señalar que no todos los psicólogos están de acuerdo con los estándares y procedimientos tradicionales (p. ej., Cohen, 1994; Sauley y Bedeian, 1989). Las cuestiones relacionadas con la medición son en sí mismas un tema importante de trabajo para muchos investigadores, que estudian la precisión de los métodos de medición y los supuestos que subyacen a los métodos y estándares existentes, así como el desarrollo de nuevos médicos e instrumentos. Quizás en algún momento en el futuro, la investigación con este poder conduzca a cambios en los estándares tradicionales para evaluar la significancia estadística, y estos cambios ganarán una aceptación generalizada. (La Quinta División de la Asociación Estadounidense de Psicología es un grupo de psicólogos que se especializan en el estudio de la evaluación, la medición y la estadística).

En los informes de investigación, una declaración probabilística como r< 0,05, debido a algunos estadística, es decir, un número que se obtiene como resultado de un determinado conjunto de procedimientos computacionales matemáticos. La confirmación probabilística se obtiene comparando estas estadísticas con datos de tablas especiales que se publican para este fin. En industrial-organizacional investigación psicológica A menudo hay estadísticas como r, F, t, r>(léase “chi cuadrado”) y R(léase "plural" R"). En cada caso, las estadísticas (un número) obtenidas del análisis de una serie de observaciones se pueden comparar con números de una tabla publicada. Después de esto, puede formular un enunciado probabilístico sobre la probabilidad de obtener este número al azar, es decir, sacar una conclusión sobre la importancia de las observaciones.

Para comprender los estudios descritos en este libro, basta con tener una comprensión clara del concepto de significancia estadística y no necesariamente saber cómo se calculan las estadísticas mencionadas anteriormente. Sin embargo, sería útil discutir un supuesto que subyace a todos estos procedimientos. Esta es la suposición de que todas las variables observadas tienen una distribución aproximadamente normal. Además, al leer informes de investigaciones psicológicas industriales y organizativas, a menudo se encuentran otros tres conceptos que juegan un papel importante. papel importante- en primer lugar, correlación y correlación, en segundo lugar, variable determinante/predictiva y "ANOVA" (análisis de varianza), en tercer lugar, un grupo de métodos estadísticos bajo el nombre general de "metaanálisis".

Nivel de significancia - esta es la probabilidad de que consideremos que las diferencias son significativas, pero en realidad son aleatorias.

Cuando indicamos que las diferencias son significativas al nivel de significancia del 5%, o cuando r< 0,05 , entonces queremos decir que la probabilidad de que no sean confiables es 0,05.

Cuando indicamos que las diferencias son significativas al nivel de significancia del 1%, o cuando r< 0,01 , entonces queremos decir que la probabilidad de que no sean confiables es 0,01.

Si traducimos todo esto a un lenguaje más formalizado, entonces el nivel de significancia es la probabilidad de rechazar la hipótesis nula, mientras sea cierta.

Error,consistente enel unolo que nosotrosrechazadohipótesis nulasi bien es correcto, se denomina error tipo 1.(Ver Tabla 1)

Mesa 1. Hipótesis nulas y alternativas y posibles condiciones de prueba.

La probabilidad de tal error generalmente se denota como α. En esencia, tendríamos que indicar entre paréntesis no p < 0,05 o p < 0,01 y α < 0,05 o α < 0,01.

Si la probabilidad de error es α , entonces la probabilidad de una decisión correcta: 1-α. Cuanto menor sea α, mayor será la probabilidad de tomar una decisión correcta.

Históricamente, en psicología generalmente se acepta que el nivel más bajo de significancia estadística es el nivel del 5% (p≤0.05): suficiente es el nivel del 1% (p≤0.01) y el más alto es el nivel del 0.1% (p≤0.001) , por tanto, las tablas de valores críticos suelen contener los valores de criterios correspondientes a los niveles de significancia estadística p≤0,05 y p≤0,01, en ocasiones - p≤0,001. Para algunos criterios, las tablas indican el nivel de significancia exacto de sus diferentes valores empíricos. Por ejemplo, para φ*=1,56 p=0,06.

Sin embargo, hasta que el nivel de significación estadística alcance p=0,05, todavía no tenemos derecho a rechazar la hipótesis nula.

Nos adheriremos a la siguiente regla para rechazar la hipótesis de que no hay diferencias (Ho) y aceptar la hipótesis de significación estadística de las diferencias (H 1).

Regla para rechazar Ho y aceptar h1

Si el valor empírico del criterio es igual o mayor que el valor crítico correspondiente a p≤0,05, entonces se rechaza H 0, pero aún no podemos aceptar definitivamente H 1 .

Si el valor empírico del criterio es igual al valor crítico correspondiente a p≤0,01 o lo supera, entonces se rechaza H 0 y se acepta H 1. : Excepciones

Prueba del signo G, prueba T de Wilcoxon y prueba U de Mann-Whitney. Para ellos se establecen relaciones inversas.

Arroz. 4. Ejemplo de un “eje de significancia” para el criterio Q de Rosenbaum.

Los valores críticos del criterio se designan como Q o, o5 y Q 0,01, el valor empírico del criterio como Q em. Está encerrado en una elipse. Desde Q 0,01 amplía la "zona de importancia": esto incluye valores empíricos que superan Q 0,01 y, por lo tanto, ciertamente significativos.

A la izquierda del valor crítico Q 0,05 se extiende la "zona de insignificancia", que incluye valores Q empíricos que están por debajo de Q 0,05 y, por tanto, ciertamente insignificantes.

vemos que q 0,05 =6; q 0,01 =9; q em. =8;

El valor empírico del criterio se sitúa en la región entre Q 0,05 y Q 0,01. Ésta es una zona de “incertidumbre”: ya podemos rechazar la hipótesis sobre la falta de confiabilidad de las diferencias (H 0), pero aún no podemos aceptar la hipótesis sobre su confiabilidad (H 1).

En la práctica, sin embargo, el investigador puede considerar confiables aquellas diferencias que no caen en la zona de insignificancia, declarando que son confiables en p. < 0,05, o indicando el nivel exacto de significancia del valor del criterio empírico obtenido, por ejemplo: p=0,02. Utilizando tablas estándar, que se encuentran en todos los libros de texto sobre métodos matemáticos, esto se puede hacer en relación con el criterio H de Kruskal-Wallis, χ 2 r Friedman, L de Page, φ* de Fisher .

El nivel de significancia estadística, o valores de prueba críticos, se determina de manera diferente cuando se prueban hipótesis estadísticas direccionales y no direccionales.

Con una hipótesis estadística direccional, se utiliza una prueba de una cola, con una hipótesis no direccional, se utiliza una prueba de dos colas. La prueba de dos colas es más estricta porque prueba diferencias en ambas direcciones y, por lo tanto, el valor empírico de la prueba que anteriormente correspondía al nivel de significancia p. < 0,05, ahora corresponde sólo al nivel p < 0,10.

No tendremos que decidir por nosotros mismos cada vez si utiliza un criterio unilateral o bilateral. Las tablas de valores críticos de los criterios se seleccionan de tal manera que las hipótesis direccionales correspondan a un criterio unilateral, y las hipótesis no direccionales correspondan a un criterio bilateral, y los valores dados satisfagan los requisitos que aplicar a cada uno de ellos. El investigador sólo necesita asegurarse de que sus hipótesis coincidan en significado y forma con las hipótesis propuestas en la descripción de cada uno de los criterios.