APRENDIZAGEM DE MAQUINA APLICADA NA CLASSIFICAC˘...

8
APRENDIZAGEM DE M ´ AQUINA APLICADA NA CLASSIFICA¸ C ˜ AO DE PADR ˜ OES DE MASTIGA ¸ C ˜ AO DE RUMINANTES Vinicius Pegorini * , Richardson Ribeiro * , Jean Carlos Cardozo da Silva * , Tangriani Simioni Assmann * , Christiano Santos Rocha Pitta , Rafael Cardoso * * UniversidadeTecnol´ogicaFederaldoParan´a Pato Branco, Paran´a, Brasil Instituto Federal do Paran´a Palmas, Paran´a, Brasil Emails: [email protected], [email protected], [email protected], [email protected], [email protected], [email protected] Abstract— In this paper it is proposed an application of machine learning to pattern classification in food intake process by goats. Pattern classification of ingestive behavior in grazing animals can be useful in studies related to animal nutrition and health. Machine learning techniques were applied on data collected by sensors based on optical fiber Bragg gratings (FBG) fixed in a cadaveric mandible of a goat. The data acquisition was performed employing emulation of chewing movements. Different types of materials were used to measure biomechanical forces involved in food handling process. For the pattern classification a classic model of decision tree algorithm was used. Experimental results show that the proposed approach for pattern classification has been capable of differentiate the materials involved in the chewing process, the data were correctly classified in 78.75% of the cases. Keywords— Pattern Classification, Machine Learning, Ingestive Behavior. Resumo— Neste artigo ´ e proposta uma abordagem baseada no uso de aprendizagem de m´aquina para clas- sifica¸c˜ ao de padr˜oes no processo de ingest˜ao de alimentos por caprinos. Classificar padr˜oes do comportamento ingestivo de animais em pastejo serve como base para estudos relacionados `a nutri¸c˜ao animal bem como a identifi- ca¸c˜ao de dados relacionados a sa´ ude animal. Na classifica¸ c˜ao de padr˜oes foram aplicadas t´ ecnicas de aprendizagem de m´ aquina em dados coletados atrav´ es de sensores a fibra ´otica baseados em redes de Bragg (FBG) fixados em uma mand´ ıbula cadav´ erica de um caprino. A coleta de dados foi realizada por meio da emula¸c˜ao de movimentos de mastiga¸ c˜ao. Diferentes tipos de materiais foram usados para medir for¸cas biomecˆanicas envolvidas no pro- cesso de manipula¸c˜ao de alimento. Na classifica¸c˜ao dos padr˜oes foi utilizado um modelo cl´assico de algoritmo de ´arvores de decis˜ao. Resultados experimentais mostram que a abordagem proposta para a classifica¸c˜ao dos dados permite diferenciar os materiais utilizados no processo de mastiga¸c˜ ao, o classificador gerado obteve taxa m´ edia de acerto de 78,75%. Palavras-chave— Classifica¸c˜ ao de Padr˜ oes, Aprendizagem de M´ aquina, Comportamento Ingestivo. 1 Introdu¸c˜ ao Avaliar o consumo de forragem e o compor- tamento ingestivo de animais em pastejo ´ e im- portante para a compreens˜ ao dos processos envol- vidos no sistema de pastejo (Ungar (1996)). O estudo do comportamento ingestivo animal tem como um dos seus objetivos avaliar a qualidade da alimenta¸c˜ ao e consequentemente selecionar forra- geiras que resultam em aumento de ganho de peso ou melhoria de outros ´ ındices zoot´ ecnicos. Tipica- mente, o manejo de animais no que tange a sua ali- menta¸ ao em pastagem ´ e bastante emp´ ırico (Silva et al. (2009)). Monitorar o consumo de alimentos pelos ru- minantes ajuda a determinar a produtividade das pastagens e ´ e, tamb´ em, uma importante medida de impacto dos animais nos ecossistemas pasto- ris (Carvalho et al. (2009)), podendo influenciar na agricultura e pecu´ aria de precis˜ ao. O monito- ramento das atividades de consumo de alimentos tamb´ em fornece indica¸c˜ oes sobre a sa´ ude e bem- estar do animal (Clapham et al. (2011)). Desta maneira, torna-se relevante o uso de abordagens que permitam identificar diferentes aspectos en- volvidos no processo de pastejo de ruminantes. As principais t´ ecnicas utilizadas para avaliar o comportamento ingestivo de ruminantes utili- zam o m´ etodo ac´ ustico (Galli et al. (2006), Ungar e Rutter (2006) e Griffiths et al. (2006)). O uso de tal m´ etodo pode produzir resultados n˜ ao satis- fat´ orios, pois a presen¸ca de ru´ ıdos nas amostras de ´ audio e o tipo de alimento ingerido pelo ani- mal podem comprometer a qualidade dos dados e como consequˆ encia as amostras coletadas devem ser descartadas (Galli et al. (2011)). Outro as- pecto ´ e a necessidade da classifica¸c˜ ao dos dados de maneira manual. O uso de abordagens computacionais para classifica¸c˜ ao de padr˜ oes no comportamento in- gestivo de ruminantes permite a automatiza¸c˜ ao desse processo, como na abordagem proposta por Clapham et al. (2011). Uma maneira de melhorar o processo de classifica¸c˜ ao de padr˜ oes ´ e o uso de aprendizagem de m´ aquina, como descrito por Mi- lone et al. (2009) e Wosniack et al. (2012). O em- prego de aprendizagem de m´ aquina permite cons- truir sistemas capazes de adquirir conhecimento Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014 1034

Transcript of APRENDIZAGEM DE MAQUINA APLICADA NA CLASSIFICAC˘...

Page 1: APRENDIZAGEM DE MAQUINA APLICADA NA CLASSIFICAC˘ …swge.inf.br/CBA2014/anais/PDF/1569935433.pdf · gestivo de ruminantes emergiram a partir de m eto-dos indiretos de monitora˘cao,

APRENDIZAGEM DE MAQUINA APLICADA NA CLASSIFICACAO DE PADROESDE MASTIGACAO DE RUMINANTES

Vinicius Pegorini∗, Richardson Ribeiro∗, Jean Carlos Cardozo da Silva∗, TangrianiSimioni Assmann∗, Christiano Santos Rocha Pitta†, Rafael Cardoso∗

∗Universidade Tecnologica Federal do ParanaPato Branco, Parana, Brasil

†Instituto Federal do ParanaPalmas, Parana, Brasil

Emails: [email protected], [email protected], [email protected],

[email protected], [email protected], [email protected]

Abstract— In this paper it is proposed an application of machine learning to pattern classification in foodintake process by goats. Pattern classification of ingestive behavior in grazing animals can be useful in studiesrelated to animal nutrition and health. Machine learning techniques were applied on data collected by sensorsbased on optical fiber Bragg gratings (FBG) fixed in a cadaveric mandible of a goat. The data acquisitionwas performed employing emulation of chewing movements. Different types of materials were used to measurebiomechanical forces involved in food handling process. For the pattern classification a classic model of decisiontree algorithm was used. Experimental results show that the proposed approach for pattern classification hasbeen capable of differentiate the materials involved in the chewing process, the data were correctly classified in78.75% of the cases.

Keywords— Pattern Classification, Machine Learning, Ingestive Behavior.

Resumo— Neste artigo e proposta uma abordagem baseada no uso de aprendizagem de maquina para clas-sificacao de padroes no processo de ingestao de alimentos por caprinos. Classificar padroes do comportamentoingestivo de animais em pastejo serve como base para estudos relacionados a nutricao animal bem como a identifi-cacao de dados relacionados a saude animal. Na classificacao de padroes foram aplicadas tecnicas de aprendizagemde maquina em dados coletados atraves de sensores a fibra otica baseados em redes de Bragg (FBG) fixados emuma mandıbula cadaverica de um caprino. A coleta de dados foi realizada por meio da emulacao de movimentosde mastigacao. Diferentes tipos de materiais foram usados para medir forcas biomecanicas envolvidas no pro-cesso de manipulacao de alimento. Na classificacao dos padroes foi utilizado um modelo classico de algoritmo dearvores de decisao. Resultados experimentais mostram que a abordagem proposta para a classificacao dos dadospermite diferenciar os materiais utilizados no processo de mastigacao, o classificador gerado obteve taxa mediade acerto de 78,75%.

Palavras-chave— Classificacao de Padroes, Aprendizagem de Maquina, Comportamento Ingestivo.

1 Introducao

Avaliar o consumo de forragem e o compor-tamento ingestivo de animais em pastejo e im-portante para a compreensao dos processos envol-vidos no sistema de pastejo (Ungar (1996)). Oestudo do comportamento ingestivo animal temcomo um dos seus objetivos avaliar a qualidade daalimentacao e consequentemente selecionar forra-geiras que resultam em aumento de ganho de pesoou melhoria de outros ındices zootecnicos. Tipica-mente, o manejo de animais no que tange a sua ali-mentacao em pastagem e bastante empırico (Silvaet al. (2009)).

Monitorar o consumo de alimentos pelos ru-minantes ajuda a determinar a produtividade daspastagens e e, tambem, uma importante medidade impacto dos animais nos ecossistemas pasto-ris (Carvalho et al. (2009)), podendo influenciarna agricultura e pecuaria de precisao. O monito-ramento das atividades de consumo de alimentostambem fornece indicacoes sobre a saude e bem-estar do animal (Clapham et al. (2011)). Destamaneira, torna-se relevante o uso de abordagens

que permitam identificar diferentes aspectos en-volvidos no processo de pastejo de ruminantes.

As principais tecnicas utilizadas para avaliaro comportamento ingestivo de ruminantes utili-zam o metodo acustico (Galli et al. (2006), Ungare Rutter (2006) e Griffiths et al. (2006)). O usode tal metodo pode produzir resultados nao satis-fatorios, pois a presenca de ruıdos nas amostrasde audio e o tipo de alimento ingerido pelo ani-mal podem comprometer a qualidade dos dados ecomo consequencia as amostras coletadas devemser descartadas (Galli et al. (2011)). Outro as-pecto e a necessidade da classificacao dos dadosde maneira manual.

O uso de abordagens computacionais paraclassificacao de padroes no comportamento in-gestivo de ruminantes permite a automatizacaodesse processo, como na abordagem proposta porClapham et al. (2011). Uma maneira de melhoraro processo de classificacao de padroes e o uso deaprendizagem de maquina, como descrito por Mi-lone et al. (2009) e Wosniack et al. (2012). O em-prego de aprendizagem de maquina permite cons-truir sistemas capazes de adquirir conhecimento

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1034

Page 2: APRENDIZAGEM DE MAQUINA APLICADA NA CLASSIFICAC˘ …swge.inf.br/CBA2014/anais/PDF/1569935433.pdf · gestivo de ruminantes emergiram a partir de m eto-dos indiretos de monitora˘cao,

de maneira automatica, utilizando-se de conjun-tos de dados existentes para melhorar seu desem-penho em uma tarefa de classificacao (Mitchell(1997)).

Neste trabalho, sera empregada aprendizagemde maquina utilizando a tecnica de arvore de de-cisao para classificar padroes no processo de mas-tigacao por caprinos. As regras para classificacaodos dados foram geradas usando o algoritmo C4.5(Quinlan (1993)). Os sinais correspondentes aosmovimentos de mastigacao foram adquiridos atra-ves de sensores a fibra otica baseados em redesde Bragg (FBG) (Vasil’ev et al. (2005)) conformeproposto por Wosniack et al. (2012).

Este artigo esta organizado da seguinte ma-neira: a Secao 2 descreve o estado da arte sobre otema. Na secao 3 esta apresentada a estrategia declassificacao proposta. Resultados sao apresenta-dos na Secao 4. Por fim, a Secao 5 apresenta asconclusoes do trabalho.

2 Embasamento teorico

As tecnicas para avaliar o comportamento in-gestivo de ruminantes emergiram a partir de meto-dos indiretos de monitoracao, onde os dados eramcalculados atraves do comportamento digestivodos animais (Cordova et al. (1978)). Esses me-todos indiretos consistiam em comparar a quan-tidade de alimento ingerido com a quantidade dematerial expelido apos os processos digestivos dosanimais. Apos, surgiram as pesquisas utilizandometodos diretos de observacao. Chambers et al.(1981) e Champion et al. (1998) utilizaram sen-sores mecanicos para avaliar os movimentos dasmandıbulas dos animais.

Laca et al. (1992) e Laca et al. (1994) utiliza-ram gravacao acustica para monitorar o compor-tamento de pastagem de ruminantes. Tal tecnicafoi usada por Galli et al. (2006), Ungar e Rut-ter (2006) e Griffiths et al. (2006), no qual ummicrofone foi usado para gravar os sons de bo-cados e da mastigacao junto com a gravacao devıdeo durante o perıodo de pastejo. Os dados fo-ram coletados de maneira sincronizada, podendoser comparados para se obter os diferentes even-tos envolvidos no processo de mastigacao. Porem,existe a necessidade da classificacao manual dosdados, tarefa lenta e exaustiva que pode gerar im-precisao nos resultados. A presenca de ruıdos nasamostras de audio e outro fator que pode compro-meter os resultados.

Outra tecnica existente e o metodo IGERBehaviour Recorder (Rutter et al. (1997)). Nessemetodo um aparelho registra amostras de audiocontendo os movimentos mandibulares do animal.Entao, essas amostras sao processadas pelo soft-ware Graze Analysis Program (Rutter (2000)),que identifica os eventos de bocado e movimen-tos mandibulares de nao bocado. Ungar e Rutter

(2006) compararam o metodo IGER com a moni-toracao acustica e observaram diferencas ao com-parar os resultados obtidos pelas duas tecnicas,sendo os resultados coletados com a monitoracaoacustica mais proximos aos coletados pelos obser-vadores.

Mezzalira et al. (2011) utilizaram observacaodireta para medir o comportamento ingestivo, tec-nica que pode ser exaustiva para observadores, di-ficultando a coleta de dados e a precisao das ob-servacoes por longos perıodos de tempo, principal-mente no perıodo noturno.

Visando melhorar o processo de classifica-cao dos eventos ingestivos em ovinos Miloneet al. (2009) propuseram uma abordagem com-putacional utilizando modelos ocultos de Markov.Clapham et al. (2011) utilizaram um software deprocessamento de audio para identificar padroesem eventos de bocado e mastigacao de bovinos.

Wosniack et al. (2012) introduziram umaabordagem para automatizar o processo de classi-ficacao de padroes em movimentos mastigatoriosde caprinos. Esse estudo utilizou sensores a fibraotica baseados em redes de Bragg (FBG) para co-leta de dados referentes a mastigacao e utilizouredes neurais artificiais para classificacao dos da-dos.

Uma maneira de automatizar o processo declassificacao de dados e o emprego de tecnicas deaprendizagem de maquina. Na literatura, diferen-tes tecnicas de aprendizagem por inducao forampropostas: arvores de decisao, redes neurais arti-ficiais, support vector machines, algoritmos geneti-cos (Mitchell (1997)), floresta de caminhos otimos(Papa et al. (2012)). O algoritmo de arvore dedecisao C4.5 (Quinlan (1993)), e conhecido pelasua capacidade de generalizacao em dados susce-tıveis a ruıdos. E um metodo de aprendizagem demaquina simbolico que utiliza aprendizagem porinducao. Esse algoritmo utiliza um conjunto deinstancias (exemplos) durante o processo de trei-namento. Cada instancia deve ser rotulada deacordo com uma classe (atributo meta). Apos afase de treinamento do algoritmo, a arvore de de-cisao gerada deve ser capaz de classificar novasinstancias.

Tecnicas de aprendizagem de maquina utili-zando arvores de decisao tem sido empregadas naarea medica (Mohanty et al. (2013), Azar e El-Metwally (2013)), na area de seguranca (Sindhuet al. (2012)), na classificacao de padroes em da-dos de sensores na area quımica (Cho e Kurup(2011)).

Apesar do sucesso de tais abordagens, exis-tem poucos estudos relacionados ao uso de tec-nicas de aprendizagem de maquina aplicadas emproblemas de classificacao de padroes no compor-tamento ingestivo de ruminantes. Assim, neste ar-tigo, e proposto o uso de arvores de decisao paraclassificar padroes de mastigacao de caprinos.

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1035

Page 3: APRENDIZAGEM DE MAQUINA APLICADA NA CLASSIFICAC˘ …swge.inf.br/CBA2014/anais/PDF/1569935433.pdf · gestivo de ruminantes emergiram a partir de m eto-dos indiretos de monitora˘cao,

3 Abordagem Proposta

3.1 Aquisicao dos dados

Para aquisicao dos dados foi empregada aabordagem proposta por Wosniack et al. (2012),na qual foram coletados sinais de mastigacao paradois diferentes materiais. Os sinais foram coleta-dos utilizado um cranio cadaverico de caprino paraa implantacao do sensor a fibra otica. Este craniofoi utilizado para a emulacao de movimentos mas-tigatorios. Os sensores a fibra otica baseados emredes de Bragg (FBG) possuem as seguintes van-tagens, quando aplicados na area de biomecanica:biocompatibilidade; nao ha rejeicao do organismodevido ao material (sılica) nao ser toxico; estabili-dade quımica; imunidade eletromagnetica; dimen-soes reduzidas, na ordem de micrometros de dia-metro e milımetros de comprimento; e possibili-dade de multiplexacao de sensores em uma mesmafibra (sensoriamento quase distribuıdo) (Fresviget al. (2008) e Mishra et al. (2011)).

Os ensaios realizados envolveram a coletade dados correspondentes a mastigacao de cincoclasses, rotuladas de acordo com o tipo de ma-terial utilizado durantes as simulacoes. Estascinco classes formam o conjunto C={aveia, feno,ausencia material, plasticina A, plasticina B}.

Inicialmente, foram coletados dados para aclasse ausencia material (AM) que simula a mas-tigacao sem a existencia de materiais na arcadadentaria. Tambem realizou-se o mesmo movi-mento com a presenca de aveia (Avena sativa),feno de Tifton (Cynodon) e duas plasticinas detexturas diferentes. A primeira plasticina uti-lizada possuıa uma textura maleavel e elastica,composta basicamente por pasta de goma e agua,aqui denominada de plasticina A (PA). A se-gunda apresentava textura esponjosa e resistente,composta por espuma polimerica, denominada deplasticina B (PB). As diferencas texturais adota-das para as platicinas tiveram como objetivo asimulacao das diferentes caracterısticas inerentesas especies forrageiras, as quais afetam o padraodo processo mastigatorio animal. Com a aveia(AV) procurou-se fazer as simulacoes mastigato-rias com a pastagem recem colhida, para que asimulacao da mastigacao fosse proximo do real.Com o feno (FE) foi utilizada a pastagem desi-dratada que apresenta um percentual menor deagua. Consequentemente, oferece maior resisten-cia a mastigacao.

Nos ensaios, utilizou-se o interrogador DI410e o programa CatmanEasy para a aquisicao dossinais. A taxa de amostragem utilizada nos en-saios foi de 1.000 amostras por segundo. O sensorFBG utilizado apresenta comprimento de onda emtorno de 1.545 nm. A Figura 1 ilustra as etapasdo processo de aquisicao e classificacao dos dados.

Foram coletados 80 segundos de simulacao demastigacao para cada material. Esses dados fo-

Figura 1: Ilustracao das etapas de aquisicao e clas-sificacao dos dados.

ram armazenados em vetores Sx. Cada vetor Sx

forma um conjunto de 80.000 elementos, denomi-nados atributos e representados por ai, onde i ∈{1, 2, · · · , 80.000}, isto e, Sx = {a1, a2, ..., a80.000}e x ∈ {1, 2, 3, 4, 5}, sendo que para classe aveiax = 1, para o feno x = 2, ausencia materialx = 3, para a plasticina A x = 4 e para aplasticina B x = 5.

Os dados contidos nos vetores Sx foramreorganizados em em uma matriz F de dimensao5x80.000, isto e,

F =

S1,1 S1,2 ... S1,80

S2,1 S2,2 ... S2,80

S3,1 S3,2 ... S3,80

S4,1 S4,2 ... S4,80

S5,1 S5,2 ... S5,80

na qual, Sm,n = Sm = (ai)1x1.000, ondem ∈ {1, 2, 3, 4, 5}, n ∈ {1, 2, · · · , 80},i ∈ {y, y + 1, y + 2, · · · , z}, y = 1.000n − 999 ez = 1.000n. Cada submatriz Sm,n possui 1.000atributos previsores e representa uma instanciada classe m. Os 1.000 atributos previsores corres-pondem aproximadamente a um movimento demastigacao.

Apos esse processo foi gerada a matriz D,que representa o conjunto de dados utilizado parao treinamento e teste do algoritmo classificador.Em cada uma das linhas da matriz D foi armaze-nada uma submatriz Sm,n, e apos a ultima colunada submatriz foi adicionada uma nova coluna. Ovalor armazenado nessa coluna e utilizado paraindicar a qual classe a instancia pertence, dadonecessario no processo de treinamento e teste daarvore de decisao. A matriz D possui dimensao400x1.001. Assim,

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1036

Page 4: APRENDIZAGEM DE MAQUINA APLICADA NA CLASSIFICAC˘ …swge.inf.br/CBA2014/anais/PDF/1569935433.pdf · gestivo de ruminantes emergiram a partir de m eto-dos indiretos de monitora˘cao,

D =

S1,1 T1

S1,2 T1

......

S1,80 T1

......

S2,1 T2

......

S5,80 T5

onde Ti = {AV,FE,AM,PA,PB}.

A Figura 2 apresenta um conjunto de dadosreferentes a 6 segundos de simulacao para cadamaterial e a Figura 3 mostra o histograma de todoo conjunto de treinamento. Observa-se que cadaum dos materiais apresenta forma de onda espe-cıfica, e tambem valores de comprimento de ondadiferentes, isso devido a textura dos materiais uti-lizados nos testes. Na Figura 2(a) e possıvel ob-servar que os dados referentes a aveia possuemcomprimento de onda variando entre 1.545,92 nme 1.545,94 nm, valores diferentes dos demais ma-teriais. Os dados referentes as mastigacoes comfeno e plasticina A, Figuras 2(b) e 2(d), respecti-vamente, apresentam comprimento de onda seme-lhantes, variando entre 1.545,93 nm e 1.545,96 nm,dado que tambem pode ser observado nos histo-gramas apresentados na Figura 3. As mastigacoesreferentes a ausencia material apresentam com-primento de onda entre 1.545,94 nm e 1.545,96nm, o padrao gerado pode ser observado na Fi-gura 2(c). Ja a plasticina B possui comprimentode onda com valores diferentes dos demais, comvalores entre 1.545,70 nm e 1.545,72 nm. A formade onda ou os diferentes valores de comprimentode onda para cada atributo sao importantes, poise atraves deles que o algoritmo classificador seracapaz de diferenciar as classes.

3.2 Construcao da arvore de decisao

No trabalho realizado por Wosniack et al.(2012) foi utilizada uma rede neural artificialpara classificacao dos dados oriundos dos senso-res FBG. Porem, com o aumento do numero demateriais utilizados nas simulacoes, a tendenciado classificador baseado em rede neural artificiale apresentar um desempenho inferior. Em Ka-ram et al. (2014) pode ser visto um outro estudo,similar, onde foram utilizados tres padroes paraserem classificados e o resultado e inferior quandocomparado com apenas dois padroes. Testes reali-zados utilizando RNAs para classificacao de cincopadroes de mastigacao, quando conduzidos, no ce-nario desse artigo, forneceram desempenho infe-rior ao obtido com a presente proposta.

Na geracao da arvore de decisao foi utilizadoo algoritmo C4.5, proposto por Quinlan (1993).Para o conjunto de dados de treinamento e vali-dacao foram utilizados os dados adquiridos com

(a) Aveia

(b) Feno

(c) Ausencia material

(d) Plasticina A

(e) Plasticina B*

Figura 2: Sinais de mastigacao para: (a) aveia,(b) feno, (c) ausencia material, (d) plasticina A e(e) plascitina B.*Os valores associados a plasticina B estao em escaladiferente dos demais materiais, para uma melhor vi-sualizacao.

as etapas apresentadas na subsecao 3.1.

Uma arvore de decisao tem a estrutura for-mada por vertices (nos) que representam os atri-butos de uma instancia, por arestas (ligacoes) pro-venientes desses vertices, que recebem os possıveisvalores do atributo em questao e de vertices ter-minais (nos folha), que representam as diferentesclasses presentes no conjunto de dados. A classi-ficacao consiste em seguir o caminho determinadopelos sucessivos vertices dispostos ao longo da ar-vore ate ser alcancado um vertice terminal, quecontem a classe a ser atribuıda a respectiva ins-

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1037

Page 5: APRENDIZAGEM DE MAQUINA APLICADA NA CLASSIFICAC˘ …swge.inf.br/CBA2014/anais/PDF/1569935433.pdf · gestivo de ruminantes emergiram a partir de m eto-dos indiretos de monitora˘cao,

Figura 3: Histograma do conjunto de dados.

tancia.O algoritmo C4.5 utiliza os atributos que ge-

ram maior razao de ganho de informacao para es-colha dos vertices de decisao da arvore. A razao doganho e calculada por meio do ganho relativo decada vertice e a forma com que cada atributo di-vide os dados (divisao da informacao), como pro-posto por Quinlan (1993). Inicialmente e efetuadoo calculo da entropia. Para um conjunto de dadosD com 5 classes a entropia e calculada por:

E(D) =5∑

x=1

−px log2 px (1)

no qual px e o percentual de instancias que perten-cem a classe x do total de instancias do conjuntode dados.

Calcula-se o ganho de informacao GI (ganhomedio) para cada um dos atributos aj de Sm,n,presentes em D, onde j ∈ {1, 2, · · · 1.000}. Paramelhor entendimento, esse atributos serao repre-sentados pelos elementos dkl da matriz D, ondek ∈ {1, 2, · · · , 400} e l ∈ {1, 2, · · · , 1.000}. Assim,

GI(D, dkl) = E(D)−∑

v∈V (dkl)

|Dv||D|

E(Dv) (2)

no qual V (dkl) e o conjunto dos possıveis valo-res para o atributo dkl, e Dv e o subconjunto deD para o qual o atributo dkl tem valor v, isto e,Dv = {p ∈ D|dkl(p) = v}. O primeiro termo daEquacao 2 e a entropia para o conjunto de da-dos D e o segundo termo e o valor esperado paraentropia depois da particao de D utilizando o atri-buto dkl. No segundo termo o valor esperado paraentropia e a soma das entropias de cada subcon-junto Dv, ponderado pela fracao das instancias do

conjunto de dados |Dv||D| que pertencem a Dv.

Calcula-se o valor da divisao de informacaoDI para um atributo dkl no conjunto de dados D:

DI(D, dkl) = −q∑

r=1

|Dr||D|

log2

|Dr||D|

(3)

o qual representa a informacao gerada pela divisaodo conjunto de dados D em q particoes, correspon-dentes aos q possıveis valores do atributo dkl.

Entao, e calculada a razao do ganho de infor-macao:

RGI(D, dkl) =GI(D, dkl)

DI(D, dkl)(4)

4 Resultados e Discussao

A divisao do conjunto de dados em treina-mento e teste para geracao da arvore de decisao foiutilizada validacao cruzada k-fold(Kohavi (1995)),que e utilizada para avaliar a capacidade de ge-neralizacao do conjunto de regras geradas paraarvore de decisao a partir do conjunto de dadosutilizado para treinamento e teste.

No procedimento de validacao cruzada k-foldo conjunto de dados e dividido, aleatoriamente,em k subconjuntos. Destes, k − 1 sao utilizadospara o treinamento e um e utilizado para teste.Esse processo e repetido k vezes, para que todosos subconjuntos de dados sejam utilizados umavez como conjunto de teste. Dessa forma, dife-rentes classificadores sao obtidos, e a precisao dasclassificacoes dos conjuntos de treinamento e testepodem ser avaliadas e assim a arvore ideal podeser selecionada. Os testes foram realizados utili-zando validacao cruzada com 10-fold.

A Figura 4 representa a arvore gerada utili-zando o algoritmo de treinamento C4.5, contendo45 vertices, sendo 23 vertices terminais. Dos 1.000atributos coletados para cada instancia, os 22 queobtiveram maior razao de ganho de informacaoestao sendo utilizados na estrutura de decisao daarvore. O vertice raiz da arvore e o atributo 301,onde que todos os valores de comprimento de ondamenores ou iguais a 1.545,71 nm foram classifica-dos como sendo plasticina B. A partir desse pontoocorreu a ramificacao da arvore, o proximo verticede teste utilizou o atributo 831 para classificar al-gumas instancias pertencentes a classe aveia. De-pois desse vertice de decisao surgiram sub-arvoresclassificando as instancias pertencentes a aveia e

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1038

Page 6: APRENDIZAGEM DE MAQUINA APLICADA NA CLASSIFICAC˘ …swge.inf.br/CBA2014/anais/PDF/1569935433.pdf · gestivo de ruminantes emergiram a partir de m eto-dos indiretos de monitora˘cao,

Figura 4: Arvore de decisao gerada com o algoritmo C4.5 utilizando validacao cruzada 10-fold.AV = aveia; FE = feno; AM = ausencia material ; PA = plasticina A; PB = plasticina B.

as demais classes.

O conhecimento obtido com a aplicacao daaprendizagem de maquina e representado por umconjunto de regras ordenadas. A Figura 5 apre-senta um conjunto de regras ordenadas geradaspelo algoritmo C4.5. A regra R1 e lida da se-guinte maneira: “SE (o valor do atributo a301e menor ou igual a 1.545, 7661nm) entao (classeplasticina B)”.

Figura 5: Conjunto de regras geradas pelo classi-ficador C4.5

A Tabela 1 mostra a matriz de confusao queapresenta os resultados de acertos e erros para aarvore gerada com o algoritmo C4.5 utilizando va-lidacao cruzada k-fold. Nessa matriz o numero deacertos para cada classe se localiza na diagonalprincipal. Para classe aveia 72 instancias foramclassificadas corretamente e 8 foram classificadas

incorretamente. Isso corresponde a uma taxa deacerto de 90% para esta classe. O melhor resul-tado e referente a plasticina B, em que todas as80 instancias foram classificadas corretamente, ouseja, tem-se 100% de taxa de acerto para a classe.Ja a plasticina A apresentou o maior numero deerros durante a classificacao, com 45 instanciasclassificadas incorretamente, e 35 classificadas cor-retamente. Assim, tem-se 43,75% de acerto. Nosresultados referentes ao feno, 50 instancias foramclassificadas corretamente e 30 foram classifica-das incorretamente. Logo, a taxa de acerto foide 62,5%. Nas mastigacoes realizadas para classeausencia material 78 instancias classificadas cor-retamente e 2 foram classificadas incorretamente,fornecendo 97,5% de acerto.

O numero de acertos atribuıdos a plasticina Bjustifica-se pela textura esponjosa e resistente domaterial utilizado nos testes, que difere da tex-tura dos demais materiais utilizados. Isso gerouvalores de comprimento de onda entre 1.545,70nm e 1.545,72 nm, como pode ser visto na Figura2(e). Os movimentos para ausencia material tam-bem apresentaram numeros de acertos superioresaos demais materiais, sendo que o comprimentode onda desse material esta entre 1.545,94 nm e

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1039

Page 7: APRENDIZAGEM DE MAQUINA APLICADA NA CLASSIFICAC˘ …swge.inf.br/CBA2014/anais/PDF/1569935433.pdf · gestivo de ruminantes emergiram a partir de m eto-dos indiretos de monitora˘cao,

Tabela 1: Classificacao fornecida pelo algoritmoC4.5 utilizando Validacao Cruzada

AV FE AM PA PB

AV72 3 0 5 0

(90%) (3,75%) (0%) (6,25%) (0%)

FE5 50 0 25 0

(6,25%)(62,5%) (0%) (31,25%)(0%)

AM0 0 78 2 0

(0%) (0%) (97,5%)(2,5%) (0%)

PA4 34 7 35 0

(5%) (42,5%)(8,75%)(43,75%)(0%)

PB0 0 0 0 80

(0%) (0%) (0%) (0%) (100%)

Classes: (AV) Aveia; (FE) Feno; (AM)Ausencia material ; (PA) Plasticina A; (PB)Plasticina B

1.545,96 nm. O mesmo ocorreu com as mastiga-coes realizadas com aveia, sendo que o compri-mento de onda desse material esta entre 1.545,92nm e 1.545,94 nm. O numero de erros atribuıdosao feno e plasticina A, justificam-se devido aos va-lores de comprimento de onda desses dois materi-ais estarem proximos um do outro, entre 1.545,93nm e 1.545,96 nm. Os sinais medidos para os doismateriais estao exibidos nas Figuras 2(b) e 2(d),respectivamente. Os histogramas apresentados naFigura 3 reforcam esta baixa taxa de acertos de-vido a sobreposicao dos histogramas das classesfeno e plasticina A, o que dificulta a classificacao.

A taxa media de acerto foi de 78,75%, ou seja,das 400 instancias do conjunto de treinamento 315foram classificadas corretamente durante o pro-cesso de geracao e teste da arvore de decisao.

5 Conclusoes

Neste artigo, foi apresentada uma abordagembaseada no uso de aprendizagem de maquina paraclassificacao de padroes envolvidos no processo deingestao de alimentos por caprinos. O algoritmode aprendizagem utiliza dados oriundos de sen-sores a fibra otica baseados em redes de Braggque sao capazes de medir os esforcos na mandı-bula do caprino. O principal esforco da pesquisafoi a inducao de regras para classificar os padroesde mastigacao, a partir das instancias coletadas.Para isso, foi usado o algoritmo de arvore de de-cisao C4.5 que utiliza a razao do ganho de infor-macao para a escolha dos vertices de decisao. Oalgoritmo e capaz de trabalhar com atributos con-tınuos e tem boa capacidade de generalizacao.

A solucao proposta foi capaz de classificar cor-retamente a maior parte do conjunto de dadosutilizado, apresentando taxa media de acerto de78,75%. Isto ocorre porque o conjunto de regras

induzidas generaliza a maior parte dos padroesde maneira adequada. No entanto, o classifica-dor tambem gerou regras que nao foram capazesde classificar corretamente os dados de algumasclasses, gerando em alguns casos resultados naosatisfatorios. Mesmo os resultados iniciais sendoencorajadores, estudos adicionais podem ser rea-lizados visando melhorar o desempenho do algo-ritmo classificador.

Agradecimentos

Os autores agradecem a CAPES, CNPq, FI-NEP, SETI, Fundacao Araucaria e UTFPR Cam-pus Pato Branco pelo apoio financeiro.

Referencias

Azar, A. T. e El-Metwally, S. M. (2013). Decisiontree classifiers for automated medical diagno-sis, Neural computing & applications 23: 2387–2403.

Carvalho, P. C. F., da Trindade, J. K., Mezza-lira, J. C., Poli, C. H. E. C., Nabinger, C.,Genro, T. C. M. e Gonda, H. L. (2009). Dobocado ao pastoreio de precisao: Compreen-dendo a interface planta-animal para explo-rar a multi-funcionalidade das pastagens, Re-vista Brasileira de Zootecnia 38: 109–122.

Chambers, A. R. M., Hodgson, J. e Milne, J. A.(1981). The development and use of equip-ment for the automatic recording of ingestivebehaviour in sheep and cattle, Grass ForageScience 36: 97–105.

Champion, R. A., Rutter, S. M. e Delagarde, R.(1998). Recent developments with the igerbehaviour recorder, Proceedings of the NinthEuropean Intake Workshop pp. 31–34.

Cho, J. H. e Kurup, P. U. (2011). Decision treeapproach for classification and dimensiona-lity reduction of electronic nose data, Sensorsand Actuators, B: Chemical 160: 542–548.

Clapham, W. M., Fedders, J. M., Beeman, K. eNeel, J. P. S. (2011). Acoustic monitoringsystem to quantify ingestive behavior of free-grazing cattle, Computers and Electronics inAgriculture 76: 96–104.

Cordova, F. J., Wallace, J. D. e Pieper, R. D.(1978). Forage intake by grazing livestock: areview, Journal Range Management 31: 430–438.

Fresvig, T., Ludvigsen, P., Steen, H. e Reikeras,O. (2008). Fibre optic bragg grating sensors:An alternative method to strain gauges formeasuring deformation in bone, Medical En-gineering and Physics 30: 104–108.

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1040

Page 8: APRENDIZAGEM DE MAQUINA APLICADA NA CLASSIFICAC˘ …swge.inf.br/CBA2014/anais/PDF/1569935433.pdf · gestivo de ruminantes emergiram a partir de m eto-dos indiretos de monitora˘cao,

Galli, J., Cangiano, C., Milone, D. e Laca, E. A.(2011). Acoustic monitoring of short-term in-gestive behavior and intake in grazing sheep,Livestock Science. 140: 32–41.

Galli, J. R., Cangiano, C. A., Demment, M. W.e Laca, E. A. (2006). Acoustic monitoringof chewing and intake of fresh and dry fora-ges in steers, Animal Feed Science Technology128: 14–30.

Griffiths, W. M., Alchanatis, V., Nitzan, R., Os-trovsky, V., Ben-Moshe, E., Yonatan, R.,Brener, S., Baram, H., Genizi, A. e Ungar,E. D. (2006). A video and acoustic methodo-logy to map bite placement at the patch scale,Applied Animal Behaviour Science 98: 196–215.

Karam, L. Z., Pegorini, V., Pitta, C. S. R., As-smann, T. S., Cardoso, R. e Silva, H. J. K.J. C. C. (2014). Ex vivo determination ofchewing patterns using fbg and artificial neu-ral networks, 23rd International Conferenceon Optical Fiber Sensors 9157: 91573Z–1–91573Z–4.

Kohavi, R. (1995). A study of cross-validation andbootstrap for accuracy estimation and modelselection, Proceedings of the 14th Internati-onal Joint Conference on Artificial Intelli-gence - Volume 2, IJCAI’95, Morgan Kauf-mann Publishers Inc., San Francisco, CA,USA, pp. 1137–1143.

Laca, E. A., Ungar, E. D. e Demment, M. W.(1994). Mechanisms of handling time and in-take rate of a large mammalian grazer, Ap-plied Animal Behaviour Science 39: 3–19.

Laca, E. A., Ungar, E. D., Seligman, N. G., Ra-mey, M. R. e Demment, M. W. (1992). Anintegrated methodology for studying short-term grazing behavior of cattle, Grass ForageScience 47: 81–90.

Mezzalira, J. C., de Faccio Carvalho, P. C., Fon-seca, L., Bremm, C., Reffatti, M. V., Poli, C.H. E. C. e da Trindade, J. K. (2011). Aspec-tos metodologicos do comportamento inges-tivo de bovinos em pastejo, Revista Brasileirade Zootecnia 40: 1114–1120.

Milone, D. H., Rufinera, H. L., Galli, J. R., Laca,E. A. e Cangiano, C. A. (2009). Computati-onal method for segmentation and classifica-tion of ingestive sounds in sheep, Computersand Electronics in Agriculture 65: 228–237.

Mishra, V., Singh, N., Tiwari, U. e Kapur, P.(2011). Fiber grating sensors in medicine:Current and emerging applications. sensorsand actuators, Sensors and Actuators A:Physical 167: 279–290.

Mitchell, T. M. (1997). Machine Learning, 1 edn,McGraw-Hill, Inc., New York, NY, USA.

Mohanty, A. K., Senapati, M. R., Beberta, S. eLenka, S. K. (2013). Texture-based featuresfor classification of mammograms using de-cision tree, Neural Computing and Applicati-ons 23: 1011–1017.

Papa, J. P., Falcao, A. X., de Albuquerque, V.H. C. e Tavares, J. M. R. (2012). Effici-ent supervised optimum-path forest classifi-cation for large datasets, Pattern Recognition45: 512–520.

Quinlan, J. R. (1993). C4.5: Programs for ma-chine learning, Morgan Kaufmann.

Rutter, S. M. (2000). Graze: Aprogram to analyzerecordings of the jaw movements of rumi-nants, Behavior Research Methods, Instru-ments, & Computers 32: 86–92.

Rutter, S. M., Champion, R. A. e Penning, P. D.(1997). An automatic system to record fo-raging behaviour in free-ranging ruminants,Applied Animal Behaviour Science 54: 185–195.

Silva, C. J. A., Dittrich, J. R., Monteiro, A. L. G.,Moraes, A., Barros, C. S. e Oliveira, E. B.(2009). Preferencia de caprinos em pastejo:Efeito da altura dos dosseis das forrageirasaruana e hemartria, Revista Ciencia AnimalBrasileira 10: 698–710.

Sindhu, S. S. S., Geetha, S. e Kannan, A. (2012).Decision tree based light weight intrusion de-tection using a wrapper approach, ExpertSystems with Applications 39: 129–141.

Ungar, E. D. (1996). Ingestive behavior, in C. In-ternational (ed.), The Ecology of manage-ment of grazing systems, 1 edn, J. Hodgsonand Illius A. W., pp. 185–218.

Ungar, E. D. e Rutter, S. M. (2006). Classifyingcattle jaw movements: comparing iger beha-vior recorder and acoustic techniques, Ap-plied Animal Behaviour Science 98: 11–27.

Vasil’ev, S., Medvedkov, O., Korolev, I., Bozh-kov, A., Kurkov, A. e Dianov, E. (2005). Fi-bre gratings and their applications, QuantumElectronics 35: 1085–1103.

Wosniack, C., Silva, W. J., Cardoso, R., Assmann,T. S., Hill, J. A. G., Silveira, A. L. F., Sousa,K. M., Kalinowski, H. J. e Silva, J. C. C.(2012). Determination of chewing patterns ingoats using fiber bragg gratings, SPIE 8421,OFS2012 22nd International Conference onOptical Fiber Sensors 8421: 84214F.

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1041