Curso de bioestadística y diseños experimentales
-
Upload
escuela-militar-de-ingenieria-emi -
Category
Education
-
view
4.934 -
download
0
description
Transcript of Curso de bioestadística y diseños experimentales
BIOESTADISTICA Y DISEÑOS EXPERIMENTALES
26/09 al 07/10/2011
Por: Ing. M.Sc. Francisco Martínez Solaris
Mgs. En Educación [email protected]
Cuenta en Skype….fmartinezsolaris
UNIVERSIDAD AUTONOMA “GABRIEL RENE MORENO”
UNIDAD DE POSTGRADO DE CIENCIAS DE LA SALUD
ESTADISTICANociones Generales
Programa a Desarrollar
ESTADISTICANociones Generales
¿Por qué se tiene que estudiar Estadística Diseños Experimentales?
ESTADÍSTICA
DESCRIPTIVA
PROPOSITO
METODOS
INFERENCIAL
PROPOSITO
METODO
• TABULARES• GRAFICOS• NUMERICOS
PROBABILISTICO
¿Qué es?...
ESTADISTICA
Nociones Generales
Características
Ciencia encargada de la Recolección,Manipulación, Organización yPresentación de información demanera tal que ésta tenga unaConfiabilidad determinada
ESTADISTICANociones Generales
PoblaciónN
Parámetros µ, σ2, p, etc
Muestran=?
EstadísticosEstadígrafos
Deducción
TECNICAS DE MUESTREO
INFERENCIA
ESTIMACION
ESTADISTICANociones Generales
CENSO
MUESTREO
ESTADISTICA Nociones Generales
MUESTRA Tipos
Probabilística
No Probabilística
Azar
Arbitraria
MUESTREO
Probabilístico
No Probabilístico
MAS, MAP y MAE
POBLACION
ESTADISTICANociones Generales (Búsqueda de Información)
MUESTRA
Atributo (Información)
Variable
Cambiar
• Nombre
• Definición
• Rango de Valores
• Clasificación
Elementos
Tipos
Cualitativas
Cuantitativas
Categorías
Discretas
Continuas
ESTADISTICANociones Generales
Variable
• Nombre
• Definición
• Rango de Valores
• Clasificación
Elementos
Medirse
Escalas de Medición
Nominal
De Razón
+
Ordinal
De Intervalo
ESTADISTICAMétodos Tabulares
DESCRIPTIVA
METODOS
TABULARES
Sea X y Y dos variables y sea x1, x2, … xn yy1, y2, … yn, valores que toman las variablesX y Y, y sean “a” y “b” dos constantes.Entonces:
Sumatoria
Propiedades
x1 + x2 + x3 + …xn y1 + y2 + y3 + …yn
n
iyi
1
n
ixi
1
ESTADISTICAPropiedades de Sumatoria
ESTADISTICAMétodos Tabulares/Ordenamiento
17
18
18
16
21
15
17
19
20
18
16
18
Edad (años)
Ordenándolo
15
16
16
17
17
18
18
18
18
19
20
21
Edad (años)
Valores extremos
Valores mas frecuente
Valores extremos
Desventaja
ESTADISTICACuadro de Frecuencia
Edad (años)
fi fr Fia Fra
15 1 8.3 1 8.3
16 2 16.7 3 25.0
17 2 16.7 5 41.7
18 4 33.3 9 75.0
19 1 8.3 10 83.3
20 1 8.3 11 91.7
21 1 8.3 12 100
Total 12 100
Cuadros de Frecuencia
ESTADISTICACuadro de Frecuencia
Lugar de realización del Diplomado
n %
Extranjero 19 13.87
Universidad Objeto de Estudio 87 63.50
Otras universidades bolivianas 31 22.63
Total 137 100
ESTADISTICACuadro de Frecuencia
67.7 39.2 52.5 42.3 69.8 61.2
63.9 37.2 45.7 41.7 69.1 55.5
64.9 38.9 52.4 41.9 69.2 58.9
68.3 39.2 52.6 42.7 70.0 61.9
68.3 39.2 53.3 45.5 70.1 63.2
Cuadro deFrecuencia
La Estadística ofrece otraalternativa Tablas de FrecuenciasAbsolutas y Relativas
ESTADISTICATabla de Frecuencia Absoluta y Relativa
Procedimiento
Definir el Número de Intervalos
K = 1 + 3.33* log n
≥ 5 ó ≤ 20 ó 25
Sturges
Tipo de Intervalos (Li - LS]
Ac = A/kA = Valor Máx.- Valor Mín.
Ac = Ajustada
MD = (RI – A)/2
RI = Ac*K > A
Construir la Tabla
ESTADISTICATabla de Frecuencia
Intervalos de Clases PMC fi fr Fia Fra
37.1 a 42.6 39.85 8 0.27 8 0.27
42.6 a 48.1 45.35 3 0.10 11 0.37
48.1 a 53.6 50.85 4 0.13 15 0.50
53.6 a 59.1 56.35 2 0.07 17 0.57
59.1 a 64.6 61.85 4 0.13 21 0.70
64.6 a 70.1 67.35 9 0.30 30 1
30 1
ESTADISTICAMétodos Gráficos
Métodos Gráficos Clásicos
Diagrama de Puntos
Histograma
Polígono de Frecuencias
Ojiva
Diagrama de Sectores
ESTADISTICADiagrama de Puntos
15 16 17 18 19 20 21
Edad (años)
ESTADISTICAHistograma
ESTADISTICAPolígono de Frecuencias
ESTADISTICAOjiva
ESTADISTICADiagrama de Sectores
137-------360
19 ------- x
(19*360)
X= = 49.9
137
Lugar de realización de estudios Postgraduales
fi Grados
Extranjero 19 49.927
Universidad de Interés 87 228.613
Otras universidades bolivianas 31 81.460
Total 137 360
ESTADISTICADiagrama de Sectores
ESTADISTICAMétodos Numéricos
Cuando se desea comparar dos o máspoblaciones o bien muestras, y si lasvariables de interés son de carácternumérico …
Los métodos tabulares no son los másrecomendables
La Estadística oferta otra herramienta
llamada Métodos Numéricos
ESTADISTICAMétodos Numéricos
Métodos Numéricos
Medidas de TendenciaCentral
Medidas de Dispersión
Localizan el centro deuna base de datosnumérica
Cuantifican cuánto sedispersan los datosalrededor de una medidade tendencia central
ESTADISTICAMedidas de Tendencia Central
Medidas de Tendencia Central
Promedio
Moda
Media Ponderada
Mediana
ESTADISTICAMedidas de Tendencia Central/Promedio
Promedio
Población
Muestra
Media µ Poblacional
Es la sumatoria de las observaciones que toma una variable dividido entre el total de éstas
Se interpreta como el punto de equilibrio de una base de datos numéricas
Media Muestral x
Tiempo (minutos)
52.6
38.9
68.3
67.2
63.9
64.9
68.3
39.2
42.3
61.9
567.5
56.75
Suma
Promedio
Desviaciones
-4.15
-17.85
11.55
10.45
7.15
8.15
11.55
-17.55
-14.45
5.15
0Suma
Propiedad
ESTADISTICAMedidas de Tendencia Central
01
n
i
xxi
xxi
ESTADISTICA APLICADAMedidas de Tendencia Central
Media en datos tabulados
Si la tabla no presenta clases abierta es posible hacer una estimación de la media tomando en cuenta lo siguiente:
• PMC es el promedio de las observaciones de las observaciones que caben dentro del intervalos.
• PMC*fi proporciona una estimación de la suma de las observaciones que caben en el intervalo y como una tabla tiene k-ésimo intervalos entonces:
ESTADISTICA APLICADAMedidas de Tendencia Central
Intervalos de Clases PMC fi
37.1 a 42.6 39.85 8
42.6 a 48.1 45.35 3
48.1 a 53.6 50.85 4
53.6 a 59.1 56.35 2
59.1 a 64.6 61.85 4
64.6 a 70.1 67.35 9
30
PMC*fi
318.8
136.05
203.4
112.7
247.4
606.15
1624.5
1624.5= = 54.15
30 x
ESTADISTICAMedidas de Tendencia Central
Cargo fi Salario
Rector 1 2000
Asesores 2 1200
Vic. Académico 1 1150
Vic. Administrativo 1 1250
Jefe de Carrera C.S 2 1000
Jefe de Carrera 5 800
Administrativo 2 600
Secretarias 9 120
Cuando los datos tienen diferente peso dentro de labase de datos, si desea obtener el promedio, la mediaaritmética no es la más indicada
ESTADISTICAMedidas de Tendencia Central
Cargo fi (wi)Salario
(xi)
Rector 1 2000
Asesores 2 1200
Vic. Académico 1 1150
Vic. Administrativo 1 1250
Jefe de Carrera C.S 2 1000
Jefe de Carrera 5 800
Administrativo 2 600
Secretarias 9 120
Xiwi
2000
2400
1150
1250
2000
4000
1200
1080
15080
15080= = 655.65
23wx
ESTADISTICAMedidas de Tendencia Central
Mediana (Me)
Datos sin tabular
Datos tabulados
Si los datos no se distribuyensimétricamente (curva simétrica) elpromedio no es la mejor medida paralocalizar el centro de los mismos
(b-a)(0.5- c)Me = a +
d
Me = xn/2 + 0.5
Impar
•Ordenar
Par
n
Me = (xn/2 + x n/2 + 1 )/2
ESTADISTICAMedidas de Tendencia Central
Tiempo (minutos)
39.2
38.9
52.6
42.3
61.9
63.9
68.3
67.2
64.9
Tiempo (minutos)
38.9
39.2
42.3
52.6
61.9
63.9
64.9
67.2
68.3
n es impar
Me
Me = xn/2 + 0.5
ESTADISTICAMedidas de Tendencia Central
Tiempo (minutos)
38.9
39.2
42.3
52.6
61.9
63.9
64.9
67.2
68.3
68.3
Tiempo (minutos)
38.9
39.2
42.3
52.6
61.9
63.9
64.9
67.2
68.3
68.3
n es par
Me = (xn/2 + x n/2 + 1 )/2
61.9 + 63.9Me = = 62.9
262.9
Mediana es aquella medida detendencia central que antes ydespués de ella no existe másdel 50% de la información
ESTADISTICAMedidas de Tendencia Central
(b-a)(0.5- c)Me = a +
d
a = Límite inferior de la clase de la Me
b = Límite superior de la clase de la Me
c = Fra una clase antes de la clase de la Me (Nj-1)
d = fr de la clase de la Me
Clase de la Mediana
• Complete la columna Fia
• Localice la menor Fia > n/2
• La clase a la que pertenece esta frecuencia es la clase de la mediana (Nj)
• La Clase antes de Nj es Nj -1
Intervalos
de ClasesPMC fi fr Fia Fra
37.1 a 42.6 39.85 8 0.27 8 0.27
42.6 a 48.1 45.35 3 0.10 11 0.37
48.1 a 53.6 50.85 4 0.13 15 0.50
53.6 a 59.1 56.35 2 0.07 17 0.57
59.1 a 64.6 61.85 4 0.13 21 0.70
64.6 a 70.1 67.35 9 0.30 30 1
ESTADISTICAMedidas de Tendencia Central
(b-a)(0.5- c)Me = a +
d
a = Límite inferior de la clase de la Me
b = Límite superior de la clase de la Me
c = Fra una clase antes de la clase de la Me (Nj-1)
d = fr de la clase de la Me
n = 30
n/2 = 15
Nj = 17… (53.6 – 59.1)
Nj- 1 = (48.1 – 53.6)
(59.1-53.6)(0.5- 0.5)Me = 53.6 + = 53.6
0.07
Ubicación de la clase de la Me
ESTADISTICAMedidas de Tendencia Central
Connotancia de Moda (Mo) en Estadística
En caso de existir es la(s) observación (nes) quemás se repiten en unabase de datos
Tiempo (minutos)
38.9
39.2
42.3
52.6
61.9
63.9
64.9
67.2
68.3
68.3
Distribuciones:
Unimodales
Bimodales
Etc.
Mo
ESTADISTICAMedidas de Tendencia Central
(ficmo- ficpremo)
Mo = Licmo + Acmo
(ficmo-ficpremo) + (ficmo – ficpostmo)
Donde:
Licmo: Límite inferior de la Clase Modal
Acmo: Ancho de clase de la Clase Modal
Ficmo: Frecuencia absoluta de la Clase Modal
Ficpremo: Frecuencia absoluta de la Clase Premodal
Ficpostmo: Frecuencia absoluta de la Clase Postmodal
Clase Modal es la (s) que tiene(n) la mayor (es) fi
Intervalos
de ClasesPMC fi
37.1 a 42.6 39.85 8
42.6 a 48.1 45.35 3
48.1 a 53.6 50.85 4
53.6 a 59.1 56.35 2
59.1 a 64.6 61.85 4
64.6 a 70.1 67.35 9
ESTADISTICAMedidas de Tendencia Central
(ficmo- ficpremo)
Mo = Licmo + Acmo
(ficmo-ficpremo) + (ficmo – ficpostmo)
(9 - 4)
Mo = 64.6 + 5.5 = 66.56
(9 - 4) + (9 – 0)
ESTADISTICAMedidas de Dispersión
Medidas de Dispersión
Rango/Distancia/Amplitud o Recorrido
Varianza (Variancia)
Desviación Típica o Estándar
Coeficiente de Variación
Una medida de tendencia central por si sola no es tanimportante. Por esta razón debe estar acompañada de unamedida de dispersión
ESTADISTICAMedidas de Dispersión
Rango Rango = Valor Máximo – Valor Mínimo
Varianza
Población ( σ²)
Muestra (S²)
Es el promedio de las desviaciones al cuadrado de las observaciones que toma una variable respecto a su media
2
12
N
xiN
i
ESTADISTICAMedidas de Dispersión
xi (Desviaciones)2
52.6 17.2225
38.9 318.6225
68.3 133.4025
67.2 109.2025
63.9 51.1225
64.9 66.4225
68.3 133.4025
39.2 308.0025
42.3 208.8025
61.9 26.5225
Sumatoria 567.5 1372.725
Promedio 56.75
1372.725
S² = = 152.525mi²/est²
10 - 1
Desventaja
Desviación Típica S = √S²
S = √152.525 = 12.35 min/est
Interpretación x S
56.75 12.35 min/est.
ESTADISTICA
Intervalos de Clases
PMC fi
37.1 a 42.6 39.85 8
42.6 a 48.1 45.35 3
48.1 a 53.6 50.85 4
53.6 a 59.1 56.35 2
59.1 a 64.6 61.85 4
64.6 a 70.1 67.35 9
Si la tabla no presenta clases abierta es posiblehacer una estimación de la varianza de la siguienteforma:
ESTADISTICAMedidas de Dispersión
Intervalos de Clases
PMC fi
37.1 a 42.6 39.85 8
42.6 a 48.1 45.35 3
48.1 a 53.6 50.85 4
53.6 a 59.1 56.35 2
59.1 a 64.6 61.85 4
64.6 a 70.1 67.35 9
PMC*fi PMC2*fi
318.8 12704.18
136.05 6169.8675
203.4 10342.89
112.7 6350.645
247.4 15301.69
606.15 40824.203
1624.5 91693.475
5103448.128130
30
5.1624475.91693
2
2S
33624033.115103448.128S
ESTADISTICAMedidas de Dispersión
Todas las medidas de dispersión expuestas anteriormente son dimensionales (toman las unidades de medidas de las variables)
Existe otra medida de dispersión pero adimensional llamadas Coeficiente de Variación o Dispersión Relativa
x
SVC. 100*.
x
SVC
ESTADISTICADeformación de Curvas Unimodales
Las medidas de dispersión cuantifican cuánto se dispersanlos datos alrededor de una medida de tendencia central,pero, ¿Para donde se desvían los datos?, a la izquierda de lamedia, a la derecha o se distribuyen simétricamente.
Existen otras medidas aplicable solo a curvas unimodales quetratan de las deformación de curvas tanto de formahorizontal como vertical
ESTADISTICADeformación de Curvas Unimodales
Asimetría
Asimetría Negativa
Asimetría Positiva
Curvas Simétricas
> Me > Mox
< Me < Mox
= Me = Mox
ESTADISTICADeformación de Curvas Unimodales
ESTADISTICADeformación de Curvas Unimodales
Curtosis
Curva Platicúrtica
Curva Leptocúrtica
Curva Mesocúrtica
Kur > 3
Kur < 3
Kur = 3
ESTADISTICARegresión Lineal Simple
Y
X1
X2.
.
.
Xi
En el desarrollo de los eventos, puedeser que una variable sea afectada porel comportamiento de otra (s) variable(s)
Es de interés poder cuantificar estetipo de relación de manera que sepueda predecir una variable en funciónde otra
En Regresión Lineal Simple es deinterés cuando una variable afecta elcomportamiento de otra variable
Y: Variable Dependiente
X: Variable Independiente
Y = f(X)Propósito de la R.L.S: Predicción
ESTADISTICARegresión Lineal Simple
Por análisis de regresión se entiende al conjunto de métodosestadísticos que tratan con la formulación de modelos matemáticosque describen la relación entre variables y el uso de estasrelaciones modeladas con el propósito de predecir e inferir.
Por Regresión Lineal Simple se entiende …
Supuestos del Análisisde Regresión LinealSimple
“Y” es una variable aleatoria cuyadistribución probabilística depende de“X”
Modelo de la Línea Recta
Homogeneidad de Varianza
Normalidad
Independencia
ESTADISTICARegresión Lineal Simple/Diagrama de Dispersión
Llamado también Ploteo de Datos, tiene como propósito mostrar laposible tendencia (en caso de existir) entre las variables “X” y “Y”.
Consiste en llevar los pares de valores “x, y” a un sistema decoordenadas (bidimensional)
Y
X
(x, y)
Rango de Sueldo (X) Inasistencias (Y)11 1810 178 295 369 119 267 283 3511 148 207 322 399 168 266 313 40
ESTADISTICARegresión Lineal Simple/Diagrama de Dispersión
0
5
10
15
20
25
30
35
40
45
0 2 4 6 8 10 12
Inasi
stencia
Rango de Salario
ESTADISTICARegresión Lineal Simple/Métodos de Mínimos Cuadrados
El supuesto No 2 de RLS plantea que de existir una relación entre“X” y “Y”, ésta es una línea recta, por lo tanto se puede pensar enuna ecuación de la siguiente forma:
De tal manera que se llegue a obtener una ecuación de la siguientenaturaleza:
Parámetros
Estimación
ESTADISTICARegresión Lineal Simple/Métodos de Mínimos Cuadrados
Uso de la Técnica de MínimosCuadrados (Carl Gauss)
A partir de muestras (x1, y1), (x2, y2), …(xi, yi) de las variables “X” y “Y”, se trata de obtener los estimadores . Para ello la Técnica de Mínimos Cuadrados minimiza la suma de cuadrado de las distancias entre los valores observados y los estimados de tal manera que :
Y
X
ESTADISTICARegresión Lineal Simple/Recta de Estimación
Estimada una vez la recta de Predicción y teniendo en cuenta que elpropósito de la R.L.S es la predicción, se hace necesario estarseguro que la ecuación estimada es capaz de predecir.
Por esta razón es necesario validar la ecuación estimada
ESTADISTICARegresión Lineal Simple/Validación de la Recta de Estimación
Validación
Cálculo de Coeficientede Determinación R²
Análisis de Varianzade la Regresión “ANARE”
Cuantifica la cantidad de la variabilidad de “Y” que puede ser explicada por “X”
R² ≥ 70%
ESTADISTICARegresión Lineal Simple/Validación de la Recta de Estimación/ANARE
Por análisis de Varianza se entiende, de forma general, a la particiónde la variación total en fuente de variación conocida que en el casode R.L.S son de acuerdo al siguiente modelo aditivo lineal:
xi= Variación debida a Regresión
εi = Variación debida al Error
FV gl SC CM Fc Ft (α, 1 glerror)
Regresión 1 SCRegresión CMRegresiónCMRegresión/
CMError
Error n-2 SCError CMError
Total n.1 SCTotales
Regla de Decisión
NRHo : Fc ≤ Ft
RHo : Fc > Ft
ESTADISTICARegresión Lineal/Dibujo de la Recta de Estimación
La Recta de Estimación debe pasar por dos puntos obligados dentrodel área de exploración, Las coordenadas de estos puntos son lassiguientes:
y = -2.927x + 47.34
R² = 0.789
0
10
20
30
40
50
0 5 10 15
Ina
sist
enc
ia
Nivel Salarial
Diagrama de Dispersión y Recta de
Estimación
Dispersión
Linear (Dispersión)
ESTADISTICARegresión Lineal Simple/Bandas de Confianza
¿Hasta dónde es capaz de predecir la recta de predicción estimada?
0
10
20
30
40
50
60
0 5 10 15
Ina
sist
enc
ia
Nivel Salarial
Diagrama de dispersión, recta de estimación y
bandas de confianza
Diagrama de
Dispersión
Recta de Estimación
Banda Inferior
Banda Superior
ESTADISTICACorrelación Lineal Simple
Así como existen técnicas que cuantifican los cambios de unavariable dependiente por un único cambio de la variableindependiente, existen técnicas que cuantifican la asociación linealentre dos variables, esta técnica es llamada Correlación LinealSimple que se exprese como el coeficiente de correlación (r)
Este coeficiente indica el sentido de la asociación como también lamagnitud de ésta, partiendo del hecho que el coeficiente decorrelación lineal simple toma valores en el rango de: r es -1 ≤ r ≤ 1.Entre más se acerca a 1 el valor de r mayor es la asociación entredichas variables.
ESTADISTICACorrelación Lineal Simple
Regresión Lineal Simple Correlación Lineal Simple
Mide la cantidad de cambios en “Y”por un único cambio en “X”.
Mide asociación linealentre dos variables
Existe una variable dependiente yotra independiente
Es indistinto x, y ó y, x
β1 puede tomar cualquier valor en larecta numérica
El coeficiente decorrelación toma valores enel intervalo -1 ≤ r ≤ 1
ESTADISTICA
Correlación Lineal Simple
-1 ≤ r < -0.8 Asociación
fuerte y
negativa
0 ≤ r < 0.4 No hay
asociación
-0.8 ≤ r < -0.4 Asociación
débil y
negativa
0.4 ≤ r < 0.8 Asociación
débil y
positiva
-0.4 ≤ r ≤ 0 No hay
asociación
0.8 ≤ r ≤ 1 Asociación
fuerte y
positiva
ESTADISTICACorrelación Lineal Simple
Probabilidad
PROBABILIDADES
Experimentos Aleatorios
Espacio Muestral,Eventos y Sucesos
Tipos de Experimentos Aleatorios
Relaciones entre Eventos
Enfoques de Probabilidad/Teoremas Básicos de Probabilidad
Eventos Dependientes/Independientes
Probabilidad Total/Teorema de Bayes
Experimentos
Determinísticos
No Determinísticos
Sus resultados se conocen con anticipación sin necesidad de realizar el experimento
Sus resultados se conocen una vez que el experimento ha finalizado
Es un proceso planificado a través del cual se obtiene una observación (o una medición) de un fenómeno
Se pueden describir los posibles resultados pero no se puede decir cuál de ellos ocurrirá
Experimentos AleatoriosSon experimentos no determinísticos cuyos resultados están regidos por el azar
PROBABILIDADES
Supóngase que se lanzan dos monedas legales al mismo tiempo y que a una cara de cada moneda se la llama “Cara” a la otra “Sol” entonces:
={CC, CS, SC, SS}
Supóngase ahora que se lanza un dado legal. Entonces:
={1, 2, 3, 4, 5, 6,}
Experimentos Aleatorios
Son aquellos experimentos no determinísticos cuyos resultados están regidos por la casualidad (azar)
PROBABILIDADES
M = {CC, CS, SC, SS}
O bien en el caso del lanzamiento del dado
M = {1, 2, 3, 4, 5, 6,}
Espacio Muestral
Retomando el caso del lanzamiento de las dos monedas, ¿hay otro posible resultado en este experimento?.
Son todos los resultados que están asociados a un experimento aleatorio
Supóngase que el lanzamiento del dado se está interesado en la ocurrencia de una cara impar
A = {1,3,5} Evento
Es subconjunto del espacio muestral, es decir, sus resultados pertenecen al espacio muestral
PROBABILIDADES
Espacio Muestral
Evento
2
1
3
4
5
6
M
A
Suceso (wi)
Letras Mayúsculas del Alfabeto
A= (wiεA /wi ε M)
PROBABILIDADES
Experimentos
Aleatorios
Simples
Compuestos
Un solo experimento aleatorio
Cuando ocurren dos o más experimentos simples al mismo tiempo o bien uno después del otro
Unidos por la partícula “ó” (v)
Unidos por la partícula “y” ( )
Los experimentos simples que lo componen ocurren de forma sucesiva
Los experimentos simples que lo componen ocurren al mismo tiempo
M = {M1∩M2…Mi} M = {M1UM2U…Mi}
PROBABILIDADES
Experimentos
Aleatorios
Simples
Compuestos
Un solo experimento aleatorio
Cuando ocurren dos o más experimentos simples al mismo tiempo o bien uno después del otro
M = {1, 2, 3, 4, 5, 6,}
M = {CC, CS, SC, SS}
PROBABILIDADES
M2
M1 C S
C CC CS
S SC SS
Experimentos compuestos unidos por la partícula “y”
M3
M1*M2 C S
CC CCC CCS
CS CSC CSS
SC SCC SCS
SS SSC SSS
El espacio muestral es el producto cartesiano de los espacios muestrales simples que lo conforman
PROBABILIDADES
Experimentos compuestos unidos por la partícula “y”
C
S
C
S
C
S
C
S
C
S
C
S
C
S
M
CCC
CCS
CSC
CSS
SCC
SCS
SSC
SSS
Diagrama del Árbol
Diagrama de Senderos
1ra Moneda
2da Moneda
3era Moneda
PROBABILIDADES
De acuerdo a cómo ocurren los eventos se pueden establecer algunas relaciones entre ellos tales como:
AUB
A B M
AUB
A B M
AΠB
A B MM
AA
PROBABILIDADES
Enfoques de
Probabilidades
Clásico
Frecuencia Relativa
Probabilidad A priori. Llamada También Probabilidad de Laplace
Probabilidad A posteriore
Subjetivo
PROBABILIDADES
Probabilidad
Clásica
Supuesto
Frecuencia Relativa
Probabilidad A posteriore
Subjetivo
Todos los sucesos de unexperimento aleatorio tienenla misma posibilidad deocurrir, entonces:
M
naAP
10 AP
Si en la realización deexperimento aleatorio apareceun evento A “n veces ≤N”,entonces:
N
nAP
PROBABILIDADES
Teoremas Básicos de
Probabilidades
P[AUB] = P [A] + P [B]
P[AUB] = P [A] + P [B] – P[AΠB]
P[Ø] = 0
P[M] = 1
%1000/10 APAP
APAP c 1
PROBABILIDADES
Cuando la ocurrencia de un evento está en dependencia de otro evento, se dice que éste es dependiente.
Sea A y B dos eventos en el espacio muestral “M”, se dice que A es un evento dependiente de B sí;
Estas probabilidades se pueden calcular de dos formas:
• Respecto al espacio muestral original
• Respecto al espacio muestral del evento condicionante
0; BPBP
BAPB
AP 0; APAP
ABPA
BP
PROBABILIDADESEventos Dependientes
En una institución de Educación Superior se tiene 300 docentes, de los cuales 100 son casados y 30 divorciados. En dicha institución hay 200 hombres, 85 de los cuales son casados y 95 son solteros. Determinar cual es la probabilidad de seleccionar un docente al azar:a. Que sea mujerb. Que sea soltero (a)c. Que sea un hombre y esté casado (a)d. Que sea una mujer divorciadae. Dado que el docente es casado (a), ¿cuál es la probabilidad que
sea hombre?f. Si el docente seleccionado es hombre, ¿cuál es la probabilidad que
sea casado?
PROBABILIDADES
En una universidad el 70% de los estudiantes son de Ciencias, 30% de Letras. De los estudiantes de Ciencias el 60% son varones y los de Letras son varones el 40%. Si se elige al azar un estudiante, calcule la probabilidad que:a. Sea mujerb. Se estudiante varón dado si es de Cienciasc. Sea estudiante de Ciencias dado que es varónd. Sea estudiante de Ciencias y varón.
PROBABILIDADES
Cuando la ocurrencia de un evento no está en dependencia de la ocurrencia de otro evento, se dice que éstos son independientes.
Sea A y B dos eventos en el espacio muestral “M”, se dice que A es un evento independiente de B sí se cumple con cualquiera de las siguientes condiciones:
BPAPBAP *
0; APBPAP
ABPA
BP
0; BPAPBP
BAPB
AP
PROBABILIDADESEventos Independientes
Sea A1, A2, …, Ak, eventos que forman una partición del espacio muestral M y sea B, un evento en M. Si las probabilidades P[A1], P[A2], P[A3]…, P[Ak], si P[B/A1], P[B/A2], P[B/A3]…, P[B/Ak] son probabilidades conocidas entonces:
]/[][...]2/[]2[1/1 AkBPAkPABPAPABPAPBP
Probabilidad Total = AkBPAkPBPk
i/
1
PROBABILIDADESProbabilidad Total
Sea A1, A2, …, Ak, eventos que forman una partición del espacio muestral M y sea B, un evento en M. Si las probabilidades P[A1], P[A2], P[A3]…, P[Ak], si P[B/A1], P[B/A2], P[B/A3]…, P[B/Ak]. Si B ya ha ocurrido y se está interesado en saber a cual de los eventos que forman la partición muestral se ha debido su ocurrencia, entonces se usa el denominado Teorema de Bayes
k
i AkBPAkP
AkBPAkP
BAkP
1
PROBABILIDADESTeorema de Bayes
25/09/2011Ing.M.Sc. Francisco Martínez Solaris; Mgs. En
Educación Superior
Experimento:
En sí viene a ser aquel proceso intencionadoprovocado por el investigador con el fin deestudiar su origen, esencia e interrelacióncon otros procesos o fenómenos.Tratamiento:
Viene a ser el conjunto de condiciones experimentales queel investigador impone a las unidades experimentales.Ejemplo: efecto de dosis desparasitante, tipo dedesparasitante, etc.
DISEÑOS EXPERIMENTALES
25/09/2011Ing.M.Sc. Francisco Martínez Solaris; Mgs. En
Educación Superior
Unidad Experimental
*Es el material o lugar sobre el cual se aplican lostratamientos
Tamaño de la Unidad Experimental
*Depende depende mucho del tipo de materialexperimental que se utilice y muchas veces de laesperanza de vida en el caso de usar seres vivos.
DISEÑOS EXPERIMENTALES
25/09/2011Ing.M.Sc. Francisco Martínez Solaris; Mgs. En
Educación Superior
Factor
*Es un tratamiento que genera más tratamientos (nivelesdel factor)
Error Experimental
Es la variación aleatoria (no explicada) ajena al controlrazonable del investigador. Este término no es sinónimo deerror, si no que forma parte de las características propiase innatas de la unidad experimental
DISEÑOS EXPERIMENTALES
25/09/2011Ing.M.Sc. Francisco Martínez Solaris; Mgs. En
Educación Superior
Testigo
*Es el tratamiento de comparaciónadicional, que no debe faltar en unexperimento; la elección deltratamiento testigo es de granimportancia en cualquier investigación
DISEÑOS EXPERIMENTALES
Por: Ing. M.Sc. Francisco Martínez Solaris
Diseño de Investigación
DISEÑOS EXPERIMENTALES PUROS
DISEÑOS CLASICOS DISEÑOS FACTORIALES
DCA
BCA
CL FACTORIALES/DCA
FACTORIALES/BCA
FACTORIALES/CL
SIMPES COMPLEJOS
PARCELAS DIVIDIDAS
PARCELA SUBDIVIDIDAS
Diseños Experimentales
Diseños Experimentales Puros Cuasiexperimentos
25/09/2011
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
Se Provoca una Causa Proceso
Se Mide efecto
ANALISIS DE VARIANZA (ANDEVA)
¿QUE ES UN ANALISIS DE VARIANZA?Homogeneida de varianzas
Normalidad
Linealidad y Aditividad
Independencia
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
DISEÑOS EXPERIMENTALES
Es un método científico de investigación que consiste en hacer operaciones prácticas destinadas a demostrar, comprobar o descubrirfenómenos o principios básicos.
Tiene como propósito proporcionar la máxima cantidad de información a un costo mínimo.
Principios Básicos de la Experimentación
Azarización
Repetición
Control Local
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
DISEÑOS EXPERIMENTALES
Exigencias de la Experimentación
Tipicidad
Uniformidad en el Manejo de las Unidades Experimentales
DISEÑO COMPLETAMENTE AL AZAR(DCA)
*
• Unidades Experimentales homogéneas
• Se utiliza en experimentos en:
• Invernadero, Macetas, Galpones, Corrales, Laboratorio
¿Cuándo se utiliza este diseño?
Modelo Aditivo Lineal (MAL)
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
DISEÑO COMPLETAMENTE AL AZAR(DCA)
Modelo Aditivo Lineal (MAL)
F.V gl SC CM Fc Ft
Tratamiento t-1 SCTRAT.
Error t(r-1) SCError
Total tr-1 SCTotales
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
DISEÑO COMPLETAMENTE AL AZAR(DCA)
Salida de Varianza según Modelo Aditivo Lineal (MAL)
F.V gl SC CM Fc Ft
Tratamiento t-1 SCTRAT.
Error n-t SCError
Total n-1 SCTotales
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
DISEÑO COMPLETAMENTE AL AZAR(DCA)
Vaciamiento de Información
TRATAMIENTOSREPETICIONES
ΣYi.1 2 3 … j
1 Y11 Y12 Y13 Y1j Y1.
2 Y21 Y22 Y23 Y2j Y2.
3 Y31 Y32 Y33 Y3j Y3.
…i Yi1 Yi2 Yi3 Yij Yi.
ΣY.j Y.1 Y.2 Y.3 Y.j Y..
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
DISEÑO COMPLETAMENTE AL AZAR(DCA)
Ecuaciones de Trabajo
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
DISEÑO COMPLETAMENTE AL AZAR(DCA)
Hipótesis
Ho: µ1 = µ2 = µ3 =… µi (T1 = T2 = T3 = …Ti)
Ho: µ1 - µ2 - µ3 -… µi = 0 (T1 - T2 - T3 - …Ti = 0)
Ha: µ1 - µ2 - µ3 -… µi 0 (T1 T2 T3 …Ti)
NRHo si Fc Ft
Regla de Decisión
RHo si Fc > Ft
Ho
Verdadera
Falsa
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
DISEÑO COMPLETAMENTE AL AZAR(DCA)
VariedadesRepeticiones
1 2 3 4
Martí 656.3 718.4 586.6 746.2
Topacio 784.4 713.4 915.8 629.6
Estela 924.5 822.8 824.2 978.5
VF-134 534.4 685.1 567.2 655.5
UC - 82 640.7 658.8 532.7 614.4
Peso de jugo (gramos) de tomate obtenido de cincovariedades de tomate industrial.
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
DISEÑO COMPLETAMENTE AL AZAR(DCA)
Resultados del Análisis de Varianza a un α =0.05
FV gl SC CM Fc Ft (0.05, 4, 15)
Variedades 4 218983.21 54745.8025 8.08634861 3.05556828
Error 15 101552.268 6770.15117
Total 19 320535.478
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
PRUEBAS DE RANGOS MULTIPLES, SEPARACIONDE MEDIAS O PRUEBAS OBLIGADAS POR LOS DATOS
Ho
NRHo
RHo Entonces Ha es verdadera
¿Cuál (es) es o son los tratamientos que provocaron el RHo?
Pregunta que no responde el ANDEVA
Pruebas de Rangos Múltiples
Contrastes Ortogonales
Polinomios Ortogonales
Decisión
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
PRUEBAS DE RANGOS MULTIPLES, SEPARACIONDE MEDIAS O PRUEBAS OBLIGADAS POR LOS DATOS
Obtener los promedios de las fuentes de variación de interés
Procedimiento para realiza una Pruebas de Rangos Múltiples
Ordenar los promedios de forma descendente
Seleccionar la prueba de rangos múltiples a usar
Determinar el valor crítico de la prueba de seleccionada
Establecer las comparaciones a realizar según la prueba seleccionada
Determinar las diferencias de medias de acuerdo a las comparaciones establecidas
Contrastar las diferencias de medias con el valor crítico de la prueba
Establecer el rango de mérito
Emitir conclusiones según el rango de mérito25/09/2011
Por: Ing. M.Sc. Francisco Martínez Solaris
PRUEBAS DE RANGOS MULTIPLES, SEPARACIONDE MEDIAS O PRUEBAS OBLIGADAS POR LOS DATOS
Pruebas de Rangos Múltiples
• Diferencia Mínima Significativa (DMS) (LSD)
• Método de Duncan
• Método de Student-Newman-Keuls (SNK)
• Método de Tukey (Diferencia Significativa Honesta)
• Método de Scheffé
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
PRUEBAS DE RANGOS MULTIPLES, SEPARACIONDE MEDIAS O PRUEBAS OBLIGADAS POR LOS DATOS
¿Cuál Pruebas de Rangos Múltiples Utilizar?
VariedadesPrueba de Rangos Múltiples
DMS Duncan SNK Tukey Scheffé
Estela a a a a a
Topacio b ab ab ab ab
Martí bc bc b b b
UC - 82 c c b b b
VF-134 c c b b b
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
DISEÑO EN BLOQUES COMPLETAMENTE AL AZAR(BCA)
*
• Cuando el material experimental presenta un factor deestorbo que no es de interés estudiar pero que si puedeafectar los resultados del experimento.
• Tiene como principio maximizar la variabilidad entrebloques y minimizar la variabilidad interbloque ovariabilidad interna.
¿Cuándo se utiliza este diseño?
Modelo Aditivo Lineal (MAL)
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
DISEÑO EN BLOQUES COMPLETAMENTE AL AZAR(BCA)
• Deben existir tantas unidades experimentales dentro de cadabloque como tratamientos se tenga, de manera que cadatratamiento tenga una repetición en cada bloque
• Desventaja (cuando se pierde una unidad experimental en unbloque) por que se pierde la simetría del bloque (principio debloqueo.
• Cuando se pierde todo un tratamiento o bien todo un bloque, nohay problema ni necesidad de estimar parcela o datos perdidos
Principio de bloqueo
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
Salida de Varianza según Modelo Aditivo Lineal (MAL)
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
F.V gl SC CM Fc Ft
Bloque r-1 SCBloque CMBloque
Tratamiento t-1 SCTRAT. CMTRAT.
Error (t-1)(r-1) SCError CMError
Total tr-1 SCTotales
DISEÑO EN BLOQUES COMPLETAMENTE AL AZAR(BCA)
Concentración de información
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
TRATAMIENTOSBLOQUES
ΣYi.
1 2 3 … j
1 Y11 Y12 Y13 Y1j Y1.
2 Y21 Y22 Y23 Y2j Y2.
3 Y31 Y32 Y33 Y3j Y3.
…i Yi1 Yi2 Yi3 Yij Yi.
ΣY.j Y.1 Y.2 Y.3 Y.j Y..
DISEÑO EN BLOQUES COMPLETAMENTE AL AZAR(BCA)
Ecuaciones de trabajo
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
DISEÑO EN BLOQUES COMPLETAMENTE AL AZAR(BCA)
Producción de cebadas sometidas a seis niveles de fertilización nitrogenada (kg/unidad experimental)
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
DISEÑO EN BLOQUES COMPLETAMENTE AL AZAR(BCA)
Tratamientos I II III IV
1 32.10 35.60 41.90 35.40
2 30.10 31.50 37.10 30.80
3 25.40 27.40 33.80 31.10
4 24.10 33.00 35.60 31.40
5 26.10 31.00 33.80 31.90
6 23.20 24.80 26.70 26.70
Salida de varianza para producción de cebadassometidas a seis niveles de fertilización nitrogenada(kg/unidad experimental)
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
DISEÑO EN BLOQUES COMPLETAMENTE AL AZAR(BCA)
F.V gl SC CM Fc Ft (0.01)
Tratamientos 5 255.277083 51.0554167 17.1989014 4.55561398
Bloques 3 192.554583 64.1848611 21.6217822 5.41696486
Error 15 44.5279167 2.96852778
Total 23 492.359583
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
DISEÑO CUADRADO LATINO (CL)
• Es considerado una variante del BCA, ya que bloquea en dossentidos, por hileras (filas) y por columna
• Se utiliza cuando existen dos factores de estorbo que nointeresan estudiar pero que si pueden afectar los resultados
• Para que los efectos de hieleras y columnas no se confundancon el de los tratamientos, éstos no se deben repetir tantopor hilera y por columna (principio de bloque con doblebloqueo).
¿Cuándo se utiliza este diseño?
Modelo Aditivo Lineal (MAL)
Yij(k) = µ + Hi + Cj + Tk(ij) + Eijk
25/09/2011Por: Ing. M.Sc. Francisco Martínez Solaris
DISEÑO CUADRADO LATINO (CL)
Salida de Varianza para un CL
FV gl SC CM Fc Ft
Hileras t-1 SCHileras CMHileras
Columnas t-1 SCColumn CMColumn
Tratamiento t-1 SCTRAT. CMTRAT.
Error (t-1)(t-2) SCError CMError
Total t²-1 SCTotales