Introdução a Interação Humano- Computador (IHC)inf1403/docs/alberto2011_1/12_Testes... · 2011....

Post on 24-Aug-2020

2 views 0 download

Transcript of Introdução a Interação Humano- Computador (IHC)inf1403/docs/alberto2011_1/12_Testes... · 2011....

Introdução a Interação Humano-Computador (IHC)Introdução a Interação Humano-Computador (IHC)

INF 1403

Departamento de Informática, PUC-Rio

INF 1403

Departamento de Informática, PUC-Rio

Testes com usuáriosTestes com usuários

Como avaliar?Como avaliar?

• inspeção (por especialistas) – avaliação analítica

– rápida e de baixo custo

– pode ser realizada ao longo de todo o projeto

• testes com usuários – avaliação empírica

• inspeção (por especialistas) – avaliação analítica

– rápida e de baixo custo

– pode ser realizada ao longo de todo o projeto

• testes com usuários – avaliação empírica

3

– permite identificar “imprevistos”

– utilizando

• maquetes em papel

• protótipos implementados rapidamente

• o próprio sistema

• sistemas concorrentes

– permite identificar “imprevistos”

– utilizando

• maquetes em papel

• protótipos implementados rapidamente

• o próprio sistema

• sistemas concorrentes

Teste de UsabilidadeTeste de Usabilidade

• Envolve gravação do desempenho de usuários típicos, realizando tarefas típicas.

• Ambiente controlado.

• Usuários são observados e cronometrados.

• Dados são gravados em vídeo e aperto de teclas são logados.

• Envolve gravação do desempenho de usuários típicos, realizando tarefas típicas.

• Ambiente controlado.

• Usuários são observados e cronometrados.

• Dados são gravados em vídeo e aperto de teclas são logados.

• Os dados são usados para calcular os tempos gastos pelos usuários nas tarefas, bem como para identificar e explicar erros.

• Satisfação do usuário é avaliada por meio de questionários e entrevistas.

• Estudos de campo podem ser usados para prover entendimento contextual.

• Os dados são usados para calcular os tempos gastos pelos usuários nas tarefas, bem como para identificar e explicar erros.

• Satisfação do usuário é avaliada por meio de questionários e entrevistas.

• Estudos de campo podem ser usados para prover entendimento contextual.

Experimentos & testes de usabilidadeExperimentos & testes de usabilidade

• Experimentos testam hipóteses para descobrir novos conhecimento através da investigação da relação entre duas coisas ou mais (variáveis).

• Teste de usabilidade é experimentação aplicada.

• Desenvolvedores checam se o sistema é utilizável pela

• Experimentos testam hipóteses para descobrir novos conhecimento através da investigação da relação entre duas coisas ou mais (variáveis).

• Teste de usabilidade é experimentação aplicada.

• Desenvolvedores checam se o sistema é utilizável pela • Desenvolvedores checam se o sistema é utilizável pela população de usuários prevista, para a realização de suas tarefas.

• Desenvolvedores checam se o sistema é utilizável pela população de usuários prevista, para a realização de suas tarefas.

Testes de usabilidade e PesquisaTestes de usabilidade e Pesquisa

Testes de usabilidade

• Melhorar produtos

• Poucos participantes

• Resultados informam projeto

• Geralmente não

Testes de usabilidade

• Melhorar produtos

• Poucos participantes

• Resultados informam projeto

• Geralmente não

Experimentos para pesquisa

• Desenvolver conhecimento

• Muitos participantes

• Resultados validados estatisticamente

Experimentos para pesquisa

• Desenvolver conhecimento

• Muitos participantes

• Resultados validados estatisticamente • Geralmente não

replicáveis

• Condições controladas tanto quanto possível

• Procedimento planejado

• Resultados reportados aos desenvolvedores

• Geralmente não replicáveis

• Condições controladas tanto quanto possível

• Procedimento planejado

• Resultados reportados aos desenvolvedores

estatisticamente

• Têm que ser replicáveis

• Condições altamente controladas

• Design experimental

• Resultados reportados à comunidade científica

estatisticamente

• Têm que ser replicáveis

• Condições altamente controladas

• Design experimental

• Resultados reportados à comunidade científica

Teste de UsabilidadeTeste de Usabilidade

• Objetivos & questões focam em quão bem os usuários realizam tarefas com o produto.

• Comparação de produtos ou protótipos são comuns.

• O foco é no tempo para completar tarefas, e também no número e tipos de erros.

• Dados coletados por vídeo e logging de interação.

• Objetivos & questões focam em quão bem os usuários realizam tarefas com o produto.

• Comparação de produtos ou protótipos são comuns.

• O foco é no tempo para completar tarefas, e também no número e tipos de erros.

• Dados coletados por vídeo e logging de interação.• Dados coletados por vídeo e logging de interação.

• Teste é central.

• Questionários & entrevistas provêem dados sobre satisfação dos usuários.

• Dados coletados por vídeo e logging de interação.

• Teste é central.

• Questionários & entrevistas provêem dados sobre satisfação dos usuários.

Laboratórios de UsabilidadeLaboratórios de Usabilidade

O Laboratório do SERG – sala de testesO Laboratório do SERG – sala de testes

ObservadorObservadorUsuárioUsuário

© SERG, 2008 9

O Laboratório do SERG – sala de observaçãoO Laboratório do SERG – sala de observação

Monitor “clone”Monitor “clone” ObservadorObservador

© SERG, 2008 10

Equipamento portátil para pesquisa de campoEquipamento portátil para pesquisa de campo

Condições de testeCondições de teste

• Lab de usabilidade ou outro espaço controlado.

• Ênfase em:

– Selecionar usuários representativos;

– Desenvolver tarefas representativas.

• Tipicamente seleciona-se 5-10 usuários.

• Tarefas geralmente não demoram mais que 30 minutos.

• Lab de usabilidade ou outro espaço controlado.

• Ênfase em:

– Selecionar usuários representativos;

– Desenvolver tarefas representativas.

• Tipicamente seleciona-se 5-10 usuários.

• Tarefas geralmente não demoram mais que 30 minutos.• Tarefas geralmente não demoram mais que 30 minutos.

• Condições de teste devem ser as mesmas para todos os participantes.

• Termos de consentimento informam os procedimentos e lidam com questões éticas.

• Tarefas geralmente não demoram mais que 30 minutos.

• Condições de teste devem ser as mesmas para todos os participantes.

• Termos de consentimento informam os procedimentos e lidam com questões éticas.

Alguns tipos de dados coletadosAlguns tipos de dados coletados

• Tempo pra completar uma tarefa.

• Tempo pra completar uma tarefa após determinado tempo sem usar o produto.

• Número e tipos de erros por tarefa.

• Número de erros por unidade de tempo.

• Tempo pra completar uma tarefa.

• Tempo pra completar uma tarefa após determinado tempo sem usar o produto.

• Número e tipos de erros por tarefa.

• Número de erros por unidade de tempo.

•• Número de interações necessárias para help online ou manuais.

• Número de usuários cometendo determinado erro.

• Número de usuários completando a tarefa com sucesso.

• Número de interações necessárias para help online ou manuais.

• Número de usuários cometendo determinado erro.

• Número de usuários completando a tarefa com sucesso.

Engenharia de UsabilidadeEngenharia de Usabilidade

• Objetivo é melhorar o sistema a cada versão.

• Nível atual de desempenho.

• Nível mínimo aceitável de desempenho.

• Objetivo é melhorar o sistema a cada versão.

• Nível atual de desempenho.

• Nível mínimo aceitável de desempenho.• Nível mínimo aceitável de desempenho.

• Nível desejado de desempenho.

• Nível mínimo aceitável de desempenho.

• Nível desejado de desempenho.

Quantos usuários são necessários para testes de usabilidade?Quantos usuários são necessários para testes de usabilidade?

• O número é uma questão de ordem prática.

• Depende de:

– Prazo para os testes;

– Disponibilidade de participantes;

• O número é uma questão de ordem prática.

• Depende de:

– Prazo para os testes;

– Disponibilidade de participantes;– Disponibilidade de participantes;

– Custo de execução dos testes.

• Tipicamente 5-10 participantes.

• Alguns especialistas argumentam que teste deve continuar até que nenhum novo insight seja obtido.

– Disponibilidade de participantes;

– Custo de execução dos testes.

• Tipicamente 5-10 participantes.

• Alguns especialistas argumentam que teste deve continuar até que nenhum novo insight seja obtido.

Custo x benefício para execução de testesCusto x benefício para execução de testes

• (segundo Jakob Nielsen)• (segundo Jakob Nielsen)

ExperimentosExperimentos

• Predizem a relação entre duas ou mais variáveis.

• Variável independente é manipulada pelo pesquisador.

• Variável dependente depende da variável

• Predizem a relação entre duas ou mais variáveis.

• Variável independente é manipulada pelo pesquisador.

• Variável dependente depende da variável • Variável dependente depende da variável independente.

• Desenho experimental típico tem 1 ou 2 variáveis independentes.

• Variável dependente depende da variável independente.

• Desenho experimental típico tem 1 ou 2 variáveis independentes.

Desenhos experimentaisDesenhos experimentais

• Participantes diferentes - grupo único de participantes é alocado aleatoriamente para as condições experimentais.

• Mesmos participantes – todos os participantes aparecem em ambas a condições

• Participantes diferentes - grupo único de participantes é alocado aleatoriamente para as condições experimentais.

• Mesmos participantes – todos os participantes aparecem em ambas a condições aparecem em ambas a condições experimentais.

• Participantes “casados” - participantes são colocados em pares, e.g., baseado em experiência, gênero, etc.

aparecem em ambas a condições experimentais.

• Participantes “casados” - participantes são colocados em pares, e.g., baseado em experiência, gênero, etc.

Desenhos ExperimentaisDesenhos Experimentais

Desenho Vantagens Desvantagens

Participantes

diferentes

Sem efeito de ordem dos experimentos

Muitas pessoas & problema com diferenças individuais

Mesmos

participantes

Poucas pessoas, sem diferenças individuais

Precisa algum tipo de contra-balanço por participantes diferenças individuais contra-balanço por causa do efeito da ordem dos experimentos

Participantes

casados

Sem efeito de ordem, com redução das diferenças individuais (com relação aos participantes diferentes)

Não dá pra garantir casamento perfeito em todas as diferenças

Estudos de campoEstudos de campo

• Feitos no ambiente natural.

• Objetiva entender o que os usuários fazem naturalmente e como a tecnologia os impactam.

• Estudos de campo podem ser usados no projeto de produtos para:- identificar oportunidades para novas tecnologias;

• Feitos no ambiente natural.

• Objetiva entender o que os usuários fazem naturalmente e como a tecnologia os impactam.

• Estudos de campo podem ser usados no projeto de produtos para:- identificar oportunidades para novas tecnologias;- identificar oportunidades para novas tecnologias;- determinar requisitos de projeto; - decidir como melhor introduzir uma nova tecnologia;- avaliar tecnologia em uso.

- identificar oportunidades para novas tecnologias;- determinar requisitos de projeto; - decidir como melhor introduzir uma nova tecnologia;- avaliar tecnologia em uso.

Coleta e análise de dadosColeta e análise de dados

• Observação & entrevistas

– Notas, fotos, gravações

– Vídeo

• Observação & entrevistas

– Notas, fotos, gravações

– Vídeo

– Logging

• Análises

– Categorização

– Categorias podem ser fornecidas por teorias• Grounded theory

• Activity theory

– Logging

• Análises

– Categorização

– Categorias podem ser fornecidas por teorias• Grounded theory

• Activity theory

Pontos-chavePontos-chave

• Testes com usuários são a parte central dos testes de usabilidade.

• Testes de usabilidade são feitos em condições controladas.

• Testes de usabilidade são uma forma adaptada de experimentação.

• Experimentos visam testar hipóteses através da manipulação de certas variáveis, enquanto outras são mantidas constantes.

• O experimentador controla as variáveis independentes, mas não as dependentes.

• Há 3 tipos de desenho experimental: participantes diferentes, mesmos-

• Testes com usuários são a parte central dos testes de usabilidade.

• Testes de usabilidade são feitos em condições controladas.

• Testes de usabilidade são uma forma adaptada de experimentação.

• Experimentos visam testar hipóteses através da manipulação de certas variáveis, enquanto outras são mantidas constantes.

• O experimentador controla as variáveis independentes, mas não as dependentes.

• Há 3 tipos de desenho experimental: participantes diferentes, mesmos-• Há 3 tipos de desenho experimental: participantes diferentes, mesmos-participantes, & participantes casados.

• Estudos de campo são feitos em ambientes naturais.

• Tipicamente, observação e entrevistas são usadas para coletar dados de estudos de campo.

• Categorização e técnicas baseadas em teoria são usadas para analisar dados.

• Há 3 tipos de desenho experimental: participantes diferentes, mesmos-participantes, & participantes casados.

• Estudos de campo são feitos em ambientes naturais.

• Tipicamente, observação e entrevistas são usadas para coletar dados de estudos de campo.

• Categorização e técnicas baseadas em teoria são usadas para analisar dados.

Análise, Interpretação e Apresentação de DadosAnálise, Interpretação e Apresentação de Dados

Tipos de dados e análisesTipos de dados e análises

• Dados quantitativos – expressos como números

• Dados qualitativos – difícil medir razoavelmente como números, e.g. marcar o tempo para medir satisfação

• Análise quantitativa – métodos numéricos para

• Dados quantitativos – expressos como números

• Dados qualitativos – difícil medir razoavelmente como números, e.g. marcar o tempo para medir satisfação

• Análise quantitativa – métodos numéricos para garantir significância

• Análise qualitativa – expressa a natureza dos elementos representados como temas, padrões, estórias

• Cuidado com a forma como vocês manipulam dados e números!

garantir significância

• Análise qualitativa – expressa a natureza dos elementos representados como temas, padrões, estórias

• Cuidado com a forma como vocês manipulam dados e números!

Análise, interpretação e apresentação dos dadosAnálise, interpretação e apresentação dos dados

• análises quantitativas

– Levantamento das estatísticas de ocorrências de determinados fenômenos observados

• Caso a condição e o tamanho da amostra sejam estatisticamente significativos, este levantamento permite que se façam PREVISÕES sobre a relação causal entre determinada característica do design de interação e

• análises quantitativas

– Levantamento das estatísticas de ocorrências de determinados fenômenos observados

• Caso a condição e o tamanho da amostra sejam estatisticamente significativos, este levantamento permite que se façam PREVISÕES sobre a relação causal entre determinada característica do design de interação e

© SERG, 2008 27

determinada característica do design de interação e determinado tipo de ação, reação e atitude do usuário.

• análises qualitativas

– Interpretação e categorização (i.e., levantamento de tipos de coisas que têm algo em comum) dos dados

– Descrição e formulação de hipóteses explicativas dos fenômenos observados

determinada característica do design de interação e determinado tipo de ação, reação e atitude do usuário.

• análises qualitativas

– Interpretação e categorização (i.e., levantamento de tipos de coisas que têm algo em comum) dos dados

– Descrição e formulação de hipóteses explicativas dos fenômenos observados

Análise quantitativa simplesAnálise quantitativa simples

• Médias

– Média

– Mediana

• valor do meio ao ordenar os dados

– Moda

• o valor que aparece com mais freqüência

• Médias

– Média

– Mediana

• valor do meio ao ordenar os dados

– Moda

• o valor que aparece com mais freqüência• o valor que aparece com mais freqüência

• Porcentagem

• Representações gráficas dão visão geral dos dados

• o valor que aparece com mais freqüência

• Porcentagem

• Representações gráficas dão visão geral dos dados

Number of errors made

00.5

11.5

22.5

33.5

44.5

1 3 5 7 9 11 13 15 17

User

Nu

mb

er

of e

rro

rs m

ad

e

Internet use

< once a day

once a day

once a week

2 or 3 times a week

once a month

Number of errors made

0

2

4

6

8

10

0 5 10 15 20

User

Nu

mb

er

of

err

ors

ma

de

Visualização de dados de logVisualização de dados de log

Perfis de interação de jogadores de games online

Registro da atividade numa página web

Análise qualitativa simplesAnálise qualitativa simples

• Padrões ou temas recorrentes

– emergem dos dados, dependentes do framework de observação utilizado

• Categorização dos dados

– esquema de categorização pode ser emergente

• Padrões ou temas recorrentes

– emergem dos dados, dependentes do framework de observação utilizado

• Categorização dos dados

– esquema de categorização pode ser emergente – esquema de categorização pode ser emergente ou pré-especificado

• Busca por incidentes críticos

– ajuda a focar em eventos-chave

– esquema de categorização pode ser emergente ou pré-especificado

• Busca por incidentes críticos

– ajuda a focar em eventos-chave

Ferramentas de apoio à análiseFerramentas de apoio à análise

• Planilhas – simples de utilizar, grafos básicos

• Pacotes estatísticos, e.g. SPSS

• Ferramentas de análise de dados qualitativos

– Análise através de categorização e temas

– Análise quantitativa de dados com base de texto

• Planilhas – simples de utilizar, grafos básicos

• Pacotes estatísticos, e.g. SPSS

• Ferramentas de análise de dados qualitativos

– Análise através de categorização e temas

– Análise quantitativa de dados com base de texto– Análise quantitativa de dados com base de texto– Análise quantitativa de dados com base de texto

Apresentando os resultadosApresentando os resultados

• Somente faça afirmações evidenciadas pelos seus dados

• A melhor forma de apresentar seus resultados depende do público, objetivo, captura de dados e análise

• Representações gráficas podem ser adequadas

• Somente faça afirmações evidenciadas pelos seus dados

• A melhor forma de apresentar seus resultados depende do público, objetivo, captura de dados e análise

• Representações gráficas podem ser adequadas• Representações gráficas podem ser adequadas

• Outras notações

– notações rigorosas (modelos, e.g. UML)

– utilizando estórias (e.g. cenários)

– sumarização dos resultados

• Representações gráficas podem ser adequadas

• Outras notações

– notações rigorosas (modelos, e.g. UML)

– utilizando estórias (e.g. cenários)

– sumarização dos resultados

ResumoResumo

• A análise dos dados que pode ser feita depende da captura dos dados

• Dados qualitativos e quantitativos

• Porcentagens e médias são utilizadas com freqüência em IHC

• A análise dos dados que pode ser feita depende da captura dos dados

• Dados qualitativos e quantitativos

• Porcentagens e médias são utilizadas com freqüência em IHC

• Média, mediana e moda são tipos diferentes de "média" e podem dar visões diferentes para o mesmo conjunto de dados

• A apresentação dos resultados não pode extrapolar as evidências

• Média, mediana e moda são tipos diferentes de "média" e podem dar visões diferentes para o mesmo conjunto de dados

• A apresentação dos resultados não pode extrapolar as evidências