...

IDENTIFICAÇÃO DE INDIVÍDUOS PELA DINÂMICA DO CAMINHAR

by user

on
Category: Documents
17

views

Report

Comments

Transcript

IDENTIFICAÇÃO DE INDIVÍDUOS PELA DINÂMICA DO CAMINHAR
IDENTIFICAÇÃO DE INDIVÍDUOS PELA DINÂMICA DO CAMINHAR
ROWENA M. T. VIEIRA1, EVANDRO O. T. SALLES1, JOÃO M. SALOMÃO2
1
Lab. de Computadores e Sistemas Neurais, Depto. de Eng. Elétrica, UFES
Av. Fernando Ferrari, Campus de Goiabeiras, 2Coordenadoria de Eletrotécnica, IFES, Vitória, ES, BRASIL
E-mails: [email protected], [email protected], [email protected]
Abstract
 This paper shows an implementation of a recognition system using the dynamics of the human gait as feature to person identification. In this case the silhouettes are extracted after nonlinear preprocessing and segmentation methods. In order to
reduce the dimensionality of the data, it was used the Principal Components Analysis applied over the extracted features of each
person . For the human identification, was used a stochastic classifier, the Hidden Markov Models HMM, to capture the dynamics of the movement. The tests carried out show good results, encouraging further studies in this biometrics feature.
Keywords
 Gait recognition, principal component analysis, hidden markov models.
Resumo
 Neste trabalho foi implementado um sistema de reconhecimento utilizando como característica a dinâmica de caminhar de indivíduos, sendo necessária, primeiramente, a extração das silhuetas através de métodos de pré-processamento não linear e segmentação. Após a extração das características de cada pessoa, foi utilizado a Análise em Componentes Principais para
diminuição de dimensionalidade dos dados. Para a identificação dos indivíduos, empregou-se o classificador estocástico baseado nas Cadeias Ocultas de Markov (HMM) de modo a levar em conta a dinâmica do caminhar. Os testes realizados mostraram
bons resultados, incentivando ainda mais estudos nesta característica biométrica.
Palavras-chave
 Reconhecimento pela forma de caminhar, análise em componentes principais, modelos ocultos de markov.
1
Introdução
A sociedade moderna tem buscado sistemas computacionais cada vez mais sofisticados que possam oferecer sistemas seguros e confiáveis. Aeroportos, metrôs, bancos, áreas de acesso público em geral são os
principais interessados por métodos de identificação
de indivíduos isentos de falhas ou que possibilitem o
máximo de segurança por aqueles que nestes ambientes circulem (Nikolaos et al., 2005).
Os principais métodos de reconhecimento computacional utilizam características físicas e comportamentais de pessoas para criarem estes sistemas,
estas características são denominadas como características biométricas (Jain, 2004). As mais comumente
utilizadas são: face, impressão digital, íris e voz. Neste trabalho será mostrada uma característica biométrica que tem ganhado destaque nas mais recentes
pesquisas da área de visão computacional, a forma de
caminhar.
Em relação às outras características biométricas
mais comuns, a forma de caminhar possui como vantagem o fato de poder ser capturada à distância através de uma câmera e não necessitar da colaboração
direta do indivíduo em questão (Nikolaos et al.,
2005). Isto possibilita que o sistema não necessite de
instrumentos digitais tão sofisticados e caros, tornando-o acessível e de baixo custo.
O sistema de reconhecimento utilizando a forma
de caminhar proposto utiliza como característica a
silhueta de indivíduos. Pode-se considerar duas abordagens para a utilização da silhueta de indivíduos
como característica na forma de caminhar. A primeira delas é fazer uma abordagem por modelos que se
aproximem de uma silhueta, utilizando formas geométricas como conjuntos de elipses, circunferências,
retângulos ou a combinação destas, e medidas de
ângulos de membros. A segunda é fazer uma abordagem holística operando diretamente na seqüência do
caminhar do indivíduo, sem assumir modelos específicos. Esta última abordagem utiliza a silhueta em si
como característica e tem como vantagem a possibilidade de se analisar a dinâmica de cada indivíduo
numa sequência de imagens. A Figura 1 ilustra alguns
exemplos de medidas da silhueta utilizando esta última abordagem, como por exemplo, a largura da silhueta, as projeções horizontais e verticais do contorno da silhueta e a silhueta através de uma representação angular (Nikolaos et al., 2005).
Alguns trabalhos, como o de (Kale et al., 2004),
utilizam a silhueta humana como vetor de características de duas formas, extraindo apenas o contorno da
silhueta e medindo a largura desta ou extraindo a
silhueta cheia, mas aumentando consideravelmente a
dimensão do vetor. A extração do contorno da silhueta é uma forma de se reduzir a dimensionalidade dos
dados, sem perder a forma e moldura do corpo, mas
tentando manter, em certa medida, a dinâmica do
caminhar, já que as silhuetas são obtidas a partir de
sequências de imagens (Wang e Tan, 2003). Desta
forma, o vetor de característica é formado por sequências de silhuetas que variam ao longo dos quadros do vídeo capturado.
Em (Salomão et al., 2006a) e (Salomão et al.,
2006b), empregou-se a técnica ESC (Energia das
Silhuetas do Caminhar) para a formação dos vetores
de características. Tal técnica foi adaptada da abordagem conhecida como Imagem da Energia do Movimento/Imagem do Histórco do Movimento (motion-energy image/motion-history image - MEI/MHI)
se a Análise em Componentes Principais (Principal
Components Analysis - PCA) empregada neste trabalho, tendo em vista que sua aplicação na área de reconhecimento de padrões tem mostrado resultados
satisfatórios (Wang e Tan, 2003).
As seções a seguir apresentam cada etapa descrita e os métodos utilizados no sistema de identificação
de indivíduos proposto.
2 Algoritmo para extração do vetor de características e identificação de indivíduos
2.1 Extração dos dados da sequência de vídeo
Figura 1. Características extraídas de silhuetas binárias, em relação ao tempo: (a) largura da silhueta, (b) projeção vertical e horizontal, (c) representação angular (Nikolaos et al., 2005).
(Bobick e Davis, 2001) (Han e Bhanu, 2006), onde
se projeta as informações de uma sequência de caminhar em uma única imagem. Desta forma, utilizando
a silhueta cheia e armazenando seus níveis de energia
em nível de cinza, busca-se preservar as informações
temporais da forma de caminhar.
Entretanto, a projeção de todos os quadros de
um vídeo de movimento em uma única imagem,
mesmo codificando-se parte da informação nos níveis
de cinza da imagem criada (técnica ESC), pode não
ser suficiente para se avaliar, de maneira adequada, a
dinâmica do problema. A fim de se capturar a dinâmica da caminhada, acredita-se que abordagens estocásticas sejam mais adequadas que abordagens estáticas com extração estatísticas de parâmetros. Neste
sentido, em (Kale et al., 2004) e (Liu e Sarkar, 2006)
foi abordado o uso de modelagem dinâmica, por
meio de Modelos Ocultos de Markov (Hidden Markov Models - HMM), na identificação da forma de
caminhar, mostrando bons resultados.
Assim, o presente trabalho tem como objetivo
avaliar um modelo dinâmico que tenha a capacidade
de absorver as informações da dinâmica de cada indivíduo ao longo do tempo. Neste caso, empregou-se
o HMM por sua capacidade de representar e de modelar as mudanças contidas nas características estatísticas que se manifestam nas observações. Desta forma, pode-se capturar as características dinâmicas
através dos estados e da estimação do modelo de
cada classe. As características extraídas foram baseadas em medidas sobre as silhuetas. Para melhorar a
capacidade de extração de características, empregouse um método de estimação robusta de modo a se ter
silhuetas de qualidade aceitável.
Para a característica extraída, conforme Figura
1a, empregou-se um método de redução de dimensionalidade, a fim de diminuir o tempo de processamento na etapa de classificação sem perder a representatividade dos dados. Entre os mais comuns, tem-
A forma de caminhar pode ser vista como uma atividade cíclica composta por dois passos, e a cada ciclo
são mantidas a média e a variância das silhuetas extraídas. Desta forma, assumindo-se algum método de
caracterização de silhuetas, pode-se considerar que as
variáveis em questão são aleatórias, tendo-se então
um processo estocástico. As informações contidas na
forma de caminhar podem ser pré-processadas através de técnicas de reconhecimento de padrões.
A extração da silhueta é obtida, primeiramente, a
partir da captura do vídeo do caminhar, pela extração
do fundo da cena, fundo convenientemente estimado.
A extração do fundo é obtida efetuando-se a subtração, para cada quadro de vídeo, pelo fundo estimado,
obtendo-se apenas a silhueta do indivíduo. A técnica
utilizada para a obtenção do fundo, conhecida como
LMedS (Least Median Square), realiza um procedimento de estimação robusta para a sua construção,
utilizando as mesmas sequências de imagens que
serão empregadas como dados (Wang e Tan, 2003)
(Stewart, 1999,) .
Seja uma sequência de N imagens representada
por I. O fundo bxy pode ser obtido por:
t
bxy = min medt ( I xy
− p) 2 ,
(1)
p
onde p é a intensidade do brilho do pixel na posição
(x,y), med é a mediana calculada e t representa o índice do quadro do vídeo (Salomão et al., 2005). A
Figura 2 ilustra um quadro de uma sequência de imagens e o seu fundo estimado.
(a)
(b)
Figura 2. (a) Quadro de uma sequência de caminhar. (b) Fundo
estimado a partir de uma sequência de caminhar.
Depois de obtido o fundo é necessário fazer a
subtração pixel a pixel de cada sequência de imagem
com o seu fundo correspondente para a obtenção da
silhueta. Esta subtração pode ser realizada diretamen-
te, através da própria operação matemática, quando
se têm imagens capturadas em locais de iluminação
controlada, por exemplo, locais internos e fechados
ou pode empregar uma função de compensação de
brilho, de acordo com a equação abaixo (Wang e
Tan, 2003):
f (a, b) = 1−
(a)
(b)
(c)
2× (a +1)(b +1) 2 × (256− a)(256− b)
×
, (2)
(a +1)(b +1)
(256− a)(256− b)
para 0 ≤ f ( a, b ) < 1 e 0 ≤ a ( x, y ), b ( x, y ) ≤ 255 ,
onde a(x,y) e b(x,y) são a intensidade do brilho da
imagem e do fundo na posição (x,y), respectivamente.
Esta compensação de brilho visa diminuir os efeitos
de iluminação nas imagens, por exemplo, imagens
capturadas em ambientes externos ou sob forte influência da iluminação local, o que pode causar algum
tipo de distorção ou irregularidade nas silhuetas extraídas.
Durante o procedimento acima, observou-se uma
contaminação por ruídos ao estilo sal e pimenta. Portanto, para amenizar possíveis ruídos nas imagens
obtidas após a subtração do fundo, aplicou-se um
filtro Mediana, dando como resultado imagens mais
suavizadas. Como se quer apenas o contorno da silhueta e não ela cheia, empregou-se uma filtragem de
Canny para detecção de bordas. Um limiar de binarização é também aplicado para retirar algumas minúcias que não puderam ser filtradas. Mesmo após estes
processos de filtragens, as silhuetas podem ainda
apresentar espaços incompletos (buracos), sendo necessário o uso de operadores morfológicos, de dilatação, para completar as silhuetas, e erosão, para afinar
as linhas que foram levemente alargadas (Salomão et
al., 2005). Nas Figuras 3, 4 e 5, pode-se observar um
exemplo de um ciclo de caminhar de uma pessoa,
mostrando a imagem original, as suas silhuetas cheias
e o contorno de suas silhuetas, respectivamente.
Para a formação do vetor de características de
cada um dos indivíduos a serem classificados, foi
utilizada a abordagem holística, visto que esta pode,
ao mesmo tempo, associar as silhuetas de forma estática, mas observando suas variações ao longo de um
ciclo de caminhar. Desta forma, as informações da
dinâmica do caminhar não são perdidas. Portanto, é
calculada a largura da silhueta, ou seja, a distância
entre a borda mais a esquerda e a borda mais a direita
da silhueta, linha por linha ao longo de uma sequência de imagens. Estas medidas de distâncias colocadas sobre a forma de um vetor podem ser vistas na
Figura 6.
(d)
(e)
(f)
Figura 3. Exemplo de imagens originais de um ciclo de caminhar:
do início até o fim de um ciclo de (a) até (f).
(a)
(b)
(c)
(d)
(e)
(f)
Figura 4. Sequência do caminhar de um indivíduo representado
pela silhueta cheia. Início e fim de um ciclo de (a) até (f).
(a)
(b)
(c)
(d)
(e)
(f)
Figura 5. Sequência do caminhar de um indivíduo representado
pela contorno da silhueta. Início e fim de um ciclo de (a) até f).
(a)
(b)
Análise de Componentes Principais
Figura 6. Vetor de distância da silhueta ao longo de vários ciclos
de caminhar de duas pessoas distintas. (a) Pessoa 1. (b) Pessoa 2.
A Análise de Componentes Principais é um dos métodos estatísticos mais utilizados quando se pretende
analisar dados multivariados. Ela permite transformar
um conjunto de variáveis correlacionadas em um
novo conjunto de variáveis não correlacionadas. O
objetivo desta técnica é verificar se existe um número
reduzido de componentes principais que seja responsável por explicar uma proporção elevada da variação total associada ao conjunto de dados original.
2.2
Desta forma, é possível reduzir a dimensão do vetor
de características sem ter que trabalhar em um espaço
de características de dimensão elevada.
Seja um conjunto Ω formado por M vetores (coluna) obtidos no algoritmo de extração de silhuetas
(3)
Ω ={ Γi,, ..., ΓM,},
onde Γi∈ℜb, i=1,..,M. O vetor médio Χ deste conjunto de dados pode ser calculado por:
Χ=
1 M
∑ Γn ,
M n =1
(4)
tendo-se o vetor Vi de média zero segundo
Vi = Γi -X, i=1,..,M.
(5)
Assim, para a redução da dimensionalidade, deseja-se
obter uma matriz de transformação W∈ℜb×a, a<b, tal
que a projeção de uma silhueta Γi seja dada por
Oi = WT Vi ,
i=1,..,M ,
a
onde Oi ∈ℜ é o vetor projetado com dimensão menor que o vetor original. Para isto, define-se uma
matriz de espalhamento (Belhumeur et. ali., 1997).
M
S=
∑ViViT .
k =1
(7)
(3)
Os vetores transformados, após a aplicação de
(6), possuem uma nova matriz de espalhamento dada
por WTSW. Na análise de PCA, encontrar o vetor
ótimo equivale a encontrar uma matriz de projeção
ótima W*, obtida pela maximização do determinante
da matriz de espalhamento projetada, ou seja:
(8)
W * = arg max W T SW .
W
A solução de (8) gera como resultado uma matriz W* composta por ‘a’ vetores coluna, autovetores
de S, associados aos ‘a’ maiores autovalores. Os
dados são então projetados neste novo subespaço,
reduzindo sua dimensão, estando adequados para
serem utilizados como vetores de características na
etapa de classificação dos indivíduos.
2.3
O Modelo HMM
O HMM é um modelo estocástico baseado em equações de estado, sendo os estados a parte oculta do
modelo, estados estes estimados a partir de variáveis
observáveis do sistema o qual se deseja modelar.
Assim, a partir de uma sequência O constituída de T
vetores de observações Ot, O = {O1, O2, ... , Ot, ...,
OT}, t∈{1,...,T}. No presente caso, cada vetor Ot
representa uma medida sobre as silhuetas do caminhar. A cardinalidade do conjunto {1,...,T} determina
o número de quadros do vídeo capturado. Os parâmetros de interesse de um HMM são (Rabiner, 1989):
a) o número N de estados S = {S i } , t∈{1,...,E};
b) o vetor de probabilidade inicial (π ) , dado por
π = {π i } , onde π i representa a probabilidade
de estar no estado S i no início do experimento;
c) a matriz de transição de estados A, formada por
entradas aij que indicam a probabilidade de se
estar num estado S j no tempo t+1, dado que o
estado anterior era o estado S i no tempo t;
d) o conjunto B das distribuições de probabilidade
de se obter na saída a observação no estado.
Observe que, neste caso, optou-se por utilizar o
modelo contínuo do HMM ao invés do modelo
discreto, o que levaria o parâmetro B a ser representado por uma matriz de probabilidades de
emissão de símbolos.
Convenciona-se representar cada modelo λ pela
tripla (π , A, B ) . Têm-se então as seguintes equações:
(9)
a = P(q = S q = S ) ,
ij
t +1
j
(
t
i
)
b j (Ot ) = P Ot qt = S j ,
(10)
(11)
π i = P(q0 = S i ) .
Na etapa de treino, estimam-se os parâmetros do
modelo empregando-se o algoritmo de Baum-Welch,
segundo a seguinte operação:
(12)
arg max P (Oi | ω i , λi ),
λi
onde λi se refere ao modelo associado à i-ésima classe ωi (i-ésimo indivíduo).
Para um sistema de reconhecimento robusto é
razoável que o vetor de características seja formado
por um conjunto de ciclos, e não por apenas um ciclo. Desta forma, o problema em questão é reconhecer um indivíduo que está num banco de dados cujo
modelo de caminhar já se conhece a priori.
Para a etapa de classificação, a partir de uma sequência de caminhar O, calcula-se qual dos modelos
se aproxima mais dos dados a serem testados. Inicialmente, a sequência de imagens O = {O1, O2, ... , Ot,
..., OT} do indivíduo desconhecido passa pelo mesmo
processamento que as imagens utilizadas como treino
no sistema. Assim, basta computar a verossimilhança
que a sequência de observações gerada a partir do
HMM correspondente à i-ésima pessoa. Este procedimento é aplicado a cada pessoa do banco de dados
que vai resultar num valor de probabilidade. A classificação ou identificação do indivíduo desconhecido é
obtida quando este valor de probabilidade resulta no
maior valor entre todas as classes existentes, ou seja,
a classe i* que obtiver o maior valor será a classe
correspondente para a sequência de imagens do indivíduo desconhecido em questão. Ou seja, realiza-se
os seguintes passos:
a) avalia-se, para cada modelo λi, a melhor sequência de estados que explica O, aqui assumida como Q*,
b) para cada Q* (que representa um determinado
modelo) obtém-se a probabilidade de emissão
de O,
c) finalmente, classifica-se O associando-a ao modelo indexado por i* que apresentar a sequência
de estados mais provável.
Estes passos podem ser sintetizados na expressão:
i∗ = arg max P (O | ωi , λi , Qi∗ ), para i ∈ {1,..., M} . (13)
i
3 Procedimento Experimental e Resultados
Neste trabalho, o banco de dados utilizado foi (Gatech), que está no formato AVI com razão de captura
de 33 quadros por segundo. Cada vídeo possui aproximadamente de 65 a 120 quadros cuja dimensão é
de 320×240 pixels. Esta base de dados é composta
por dezesseis indivíduos que caminham de perfil em
relação à uma câmera e cada um possui cinco conjuntos de imagens. As sequências possuem imagens de
indivíduos caminhando próximo e longe da câmera.
Assim, foram utilizados ambos os casos para cada
indivíduo, justamente para verificar quanto robusto
será o sistema.
De posse das sequências de vídeo, faz-se um préprocessamento, como descrito no item 2.1., para a
obtenção do vetor de característica da forma de caminhar de cada pessoa. Como cada indivíduo possui
altura diferente, a dimensão do vetor varia dependendo do indivíduo. Deste modo, entre as M linhas que
formam a medida da silhueta, faz-se uma redução
dimensional, passando o vetor para quarenta linhas.
A sequência de observações do vetor de característica passa a ter dimensão 40×N, onde N é o número de
quadros de cada sequência de imagens. Não é necessário que o número de quadros N seja igual para cada
pessoa, pois cada indivíduo possui uma dinâmica do
caminhar que o identifica, uns caminham mais lentamente, outras mais rapidamente. Esta diferença é
absorvida no HMM através da transição de estados.
Após a etapa de pré-processamento, o vetor de
característica é reduzido em sua dimensão através da
técnica do PCA. Na Figura 7 está ilustrado o gráfico
que relaciona a variância acumulada em função do
número de componentes principais de um indivíduo
da base de dados. Portanto, optou-se por trabalhar
com um número de componentes principais capaz de
explicar pelo menos 90% da variância total observada no conjunto de dados da forma de caminhar. Assim, as componentes principais escolhidas foram as
oito primeiras e o vetor de dados passa a ter dimensão 8×1, o que torna o sistema de reconhecimento
mais rápido na etapa de classificação. Foi testado,
também, o conjunto de vetores com menos e mais
componentes principais (duas, seis, dez, doze, quinze, vinte e quarenta), porém os resultados não foram
melhores que os obtidos com oito componentes principais, sendo este, então, um número adequado de
componentes principais para o conjunto de dados.
O processo de reconhecimento utiliza o HMM
para classificação, num modelo esquerda-direita cujo
número de estados utilizados foram seis, caracterizando o ciclo de caminhar de um indivíduo, como
mostrado nas Figuras 3, 4 e 5, e utilizando apenas
uma Gaussiana. Primeiramente, faz-se o treinamento
do HMM onde são estimados os parâmetros dos mo-
Figura 7. Gráfico da variância acumulada em função do número de
componentes principais do conjunto vetores de características.
delos de cada classe de pessoas com os vetores de
treino, e depois com o vetor de teste do indivíduo
desconhecido é calculada a probabilidade para que o
algoritmo identifique qual a sua classe correspondente.
Os vetores utilizados na fase de treinamento são
formados por três sequências de vídeo e para classificação duas sequencias. Estas sequencias de vídeo
foram permutadas entre si, ou seja, as sequências
utilizadas no treino posteriormente foram também
utilizadas na classificação, com a finalidade de se
obter um resultado mais fiel. O resultado final é uma
média dos resultados individuais de cada permutação
do conjunto de vetores. Desta forma, o algoritmo de
identificação de indivíduos pela forma de caminhar
obteve uma taxa de acerto de 81,25%, sendo um resultado satisfatório.
No trabalho de (Salomão et al., 2006a), cujo acerto percentual foi de 89,91% para a forma de caminhar, 93,52% para a face e 90,74% para a fusão de
ambas as características biométricas, com dimensão
938×1 (superior ao do presente trabalho). Observa-se
que mesmo fazendo esta fusão a taxa de acerto não
necessariamente será maior. Desta forma, deve-se dar
atenção para técnicas que possam aumentar ainda
mais as taxas de acerto das características biométricas isoladas, em especial a da forma de caminhar,
que obteve uma taxa de acerto inferior ao da face.
Fazendo-se uma comparação desses resultados
obtidos com os obtidos no presente trabalho, vê-se
que o reconhecimento realizado através do classificador HMM obteve uma taxa de acerto inferior ao do
trabalho de (Salomão et al., 2006a). Entretanto, o
HMM se mostrou mais robusto e menos exigente
quanto aos aspectos individuais de cada pessoa, já
que não é necessário que os vetores de características
tenham a mesma dimensão, como em (Salomão et al.,
2006a) em que cada pessoa possui uma sequencia de
imagens composta por 108 frames. O HMM oferece
certa liberdade, pois garante que cada indivíduo possa andar mais rapidamente ou mais lentamente, mais
próximo ou mais longe da câmera de captura de imagens, sem que estes aspectos possam alterar os resultados no reconhecimento de indivíduos.
4 Conclusões
Este trabalho aborda o problema da forma de caminhar, avaliando-o dinamicamente. A utilização de
métodos para estimação de fundo e alguns tipos de
filtragens se mostram necessárias para obtenção das
silhuetas e para que não haja perda de informações
relevantes das silhuetas de cada indivíduo da base de
dados.
Como os vetores extraídos das sequências de imagens possuem alta dimensão, utiliza-se o PCA
com o objetivo de fazer esta redução de dimensão,
mas de forma a salientar as informações que mais
representam cada indivíduo. O classificador estocástico (HMM) utilizado obteve uma taxa de acerto satisfatória, mostrando que a dinâmica da forma de
caminhar é uma característica distinta em cada pessoa, e que esta característica pode ser uma boa forma de
representar cada indivíduo ou mesmo de distinguir
indivíduos.
Os resultados obtidos neste trabalho e em (Salomão et al., 2005), (Salomão et al., 2006a) e (Salomão
et al., 2006b) mostram que a forma de caminhar tem
potencial para se tornar um importante fator ou característica nos futuros sistemas de identificação de indivíduos, podendo esta ser utilizada isolada (somente
a forma de caminhar para reconhecimento) ou de
forma combinada com outras características biométricas (através de fusão hierárquica). O objetivo é que
se consiga obter altas taxas de acertos no reconhecimento de indivíduos para a forma de caminhar isoladamente, de forma que quando esta for utilizada com
fusão os resultados sejam ainda mais superiores.
Algumas sugestões para trabalhos futuros seriam
buscar técnicas de pré-processamento que sejam
computacionalmente mais rápidas, principalmente no
que diz respeito ao processo de extração de fundo,
embora a técnica utilizada aqui tenha se mostrado
eficiente na extração do fundo. O uso da técnica de
compensação de brilho mostrou resultados satisfatórios para aplicações com iluminação controlada, elevando em poucos pontos percentuais a taxa de acertos. Para aplicações outdoor (fora de um laboratório)
acredita-se que seu uso seja determinante.
Outra linha a ser avaliada é estudar o uso de características tanto de silhueta cheia como do seu contorno, a fim de melhorar a identificação, mas evitando que a dimensão do vetor de características seja
elevada, de modo a se ter um bom compromisso entre
taxa de acerto e custo computacional. Assim, outras
técnicas de redução dimensional, como a Análise de
Discriminantes Lineares (Linear Discriminant Analysis – LDA) e a técnica da Proporção por Variâncias
(Proportion of Variance – POV) devem ser avaliadas
conjuntamente com o HMM.
Referências Bibliográficas
Belhumeur, P. N., Hespanha, J. P., Kriegman, D. J.
(1997). Eigenfaces vs. Fisherfaces: Recognition
Using Class Specific Linear Projection IEEE Trans.
Pattern Analysis and Machine Intelligence Vol.
19, NO. 7, July, pp. 711-720 1997
Bobick, A. F. e Davis, J. W. (2001). The recognition
of human movement using temporal templates,
IEEE Trans. Pattern Analysis and Machine
Intelligence, Vol. 23, No. 3, pp. 257-267.
Gatech, Gait database of Georgia Tech. Disponível
em ftp://ftp.cc.gatech.edu/pub/gvu/cpl/walkers/
subjects. Acesso em 24 de março de 2008.
Han, J. e Bhanu, B. (2006). Individual recognition
using gait energy image, IEEE Transactions on
Pattern Analysis and Machine Intelligence,
Vol. 28, No. 2, pp. 316-322.
Jain, A. K., Ross, A. e Prabhakar, S. (2004). An
introduction to biometric recognition. IEEE
Transactions on Circuits and Systems for Video
Technology, Vol. 14, No. 1, pp. 1-29.
Kale, A., Sundaresan, A., Rajagopalan, A. N.,
Cuntoor, N. P., Roy-Chowdhury, A. K., Kruger,
V., Chellappa, R. (2004). Identification of
humans using gait, IEEE Transactions on Image
Processong, Vol. 13, No. 9, pp. 1163-1173.
Liu, Z. e Sarkar, S. (2006). Improved gait recognition
by gait dynamics normalization, IEEE
Transactions on Pattern Analysis and Machine
Intelligence, Vol. 28, No. 6, pp. 863-875.
Nikolaos, V. B., Hatzinakos, D. e Plataniotis, K. N.
(2005). Gait Recognition: A challening signal
processing
technology
for
biometric
IEEE
Signal
Processing
identification,
Magazine, pp. 078-090.
Rabiner, L. R. (1989). A tutorial on hidden markov
models and selected applications in speech
recognition, Proceedings of the IEEE, Vol. 27,
No. 2, pp. 257-286.
Salomão, J. M., Almeida, A. R. e Salles, E. O. T.
(2005). Avaliação de desempenho de um
classificador SVM no reconhecimento pessoal
via forma de caminhar com seleção de
características através das transformadas
wavelets. VII Simpósio Brasileiro de Automação
Inteligente, São Luis.
Salomão, J. M., Almeida, A. R. e Salles, E. O. T.
(2006a). Reconhecimento pessoal através da
fusão hierárquica das características da forma de
caminhar e de imagens faciais. XVI Congresso
Brasileiro de Automática, Salvador.
Salomão, J. M., Almeida, A. R. e Salles, E. O. T.
(2006b). Uso das características biomecânicas
do caminhar na identificação pessoal através de
redes RBF. XX Congresso Brasileiro de
Engenharia Biomédica, São Pedro.
Stewart, C. V. (1999), Robust Parameter Esimation
in Computer Vision, SIAM Review, vol. 41, no.
3, pp. 513-537.
Wang L. e Tan T. (2003). Silhouette analysis-based
gait recognition for human identification, IEEE
Transactions on Pattern Analysis and Machine
Intelligence, Vol. 25, No. 12, pp. 1505-1518.
Fly UP