A Importância do Timing no Treino de Cães

O timing no treino de cães

Fotografia original: txvoodoo

O timing é o atributo que, isoladamente, mais contribui para estabelecer uma correcta via de comunicação entre uma pessoa e um animal.

Para que um comportamento possa ser reforçado positivamente e a sua frequência vir a aumentar no futuro, a entrega da recompensa deverá ocorrer no exacto instante em que o comportamento que pretendemos “capturar” ocorre, ou no espaço de um segundo após a ocorrência desse comportamento.

O timing da entrega do reforço contém informação extremamente importante para o indivíduo que está a aprender, uma vez que lhe vai dizer exactamente o que é que nós gostamos.

Para que ocorra aprendizagem, o estimulo condicionado (CS, comando dado ao animal) tem de ocorrer antes do estímulo não condicionado (US, como comida, brinquedo ou afecto).

Se pretendemos que o cão aprenda a urinar com comando, o mesmo deverá ser dado quando o cão começa a cheirar o chão e a fazer círculos rapidamente. Não devemos esperar até que ele já se encontre a urinar ou já tenha terminado. O comando deverá ocorrer antes.

Da mesma forma, um sinal de trânsito que nos avisa da aproximação de um cruzamento perigoso deverá surgir antes do cruzamento, pois se aparecer em cima ou depois do cruzamento não será de grande utilidade.

Outro problema verifica-se quando reforçamos demasiado cedo, antes do comportamento pretendido ser atingido, com a má interpretação de que estamos a encorajar o indivíduo (“linda menina, estás quase lá”).

O que acontece nesta situação é que estamos a reforçar apenas a tentativa e não a execução do comportamento. Dar presentes, promessas ou atenção por comportamento que ainda não ocorreu não irá melhorar o comportamento pretendido. Provavelmente apenas irá incentivar a tentativas pequenas ou a solicitações de reforço.

Ao ensinar com reforço negativo, o timing também deverá ser extremamente preciso, caso contrário não irá conter qualquer informação para o animal.

Ao montar a cavalo, o pequeno kick que se dá para o cavalo começar a andar (confesso que não sei qual o termo técnico) deve cessar assim que o animal começa a andar, e não como uma espécie de combustível que temos de continuar a dar ao animal para que continue a correr.

O mesmo pode ser aplicado ao repreender uma criança, um empregado ou um animal por comportamento inapropriado. Assim que esse comportamento para, a repreensão deverá terminar.

Se o timing não for adequado, poderemos estar a reforçar comportamento que não queríamos.

Imagine que diz ao seu cão para sentar. Ele senta-se e entretanto você distrai–se e olha para outro lado qualquer durante cinco segundos. Durante esses cinco segundos o cão pode-se levantar, olhar para outro lado, cheirar o chão, etc. Quando você se volta para reforçar… o que estará a reforçar? E como é que ele sabe?

Imagine agora que durante a leitura deste artigo, encontra uma nota de 100 € no chão. Esse dinheiro foi deixado no chão por um milionário que pretende reforçar o facto de você ter escolhido a tarte de bolacha em vez da mousse de chocolate, que você comeu no seu restaurante à duas horas atrás.

O milionário pretendia aumentar a probabilidade de você escolher a tarte de bolacha no futuro. Mas é altamente improvável que o milionário tenha sucesso nesta iniciativa. Imensos comportamentos decorreram entre o momento em que você comeu a tarte de bolacha e o momento em que encontrou a nota de 100€ no chão. A probabilidade de associação entre um comportamento e outro, é extremamente reduzida.

Podemos agora fazer uma analogia para uma questão com que a maioria dos donos de cães se deparam.

Imagine que chega a casa e que o seu cão urinou no chão durante a sua ausência. Se você decidir punir o cão agora, o que acha que estará a punir? É difícil de dizer, mas será muito difícil para o animal associar essa punição ao momento em que urinou no chão.

Para que você tenha alguma forma de interferência na frequência futura do comportamento, terá de apanhar o cão em pleno acto. Um segundo após o cão ter urinado no chão, a janela de actuação para esse comportamento já fechou e o melhor é não tentar punir o cão agora.

Você não consegue dizer agora ao cão que não gosta daquilo que ele fez à duas horas atrás. Apenas consegue dizer se gosta ou não gosta daquilo que ele está a fazer agora. Neste preciso instante.

O timing no treino de cães

Fotografia: J42K

Voltando a um assunto abordado no inicio deste artigo, felizmente, existe uma forma de contornar o problema de ter de entregar o reforço no momento ou até um segundo após a execução do comportamento. É muito difícil, a longo prazo, conseguir uma associação consistente entre o comportamento e a entrega do reforço.

A solução passa pela utilização de um reforço condicionado ou secundário (uma palavra, um som como o do clicker).

Um reforço primário é algo que o individuo naturalmente pretende, como comida, brinquedos, água, dar uma volta no parque. O reforço condicionado ganhará força quando for relacionado com reforços primários (ou não condicionados).

Para isso deveremos carregar esse marcador, executando-o sempre antes da entrega do reforço primário (click -> comida; click -> comida; click -> brinquedo; click -> afecto; etc). O carregar do marcador deverá ocorrer periodicamente e não apenas na fase inicial.

Agora podemos dizer ao cão para sentar, clicar assim que se senta e entregar a recompensa alguns segundos depois.

Outra das grandes vantagens deste sistema é que podemos reforçar comportamento que ocorre longe de nós. O golfinho salta para tocar na bola e assim que a toca, o treinador sopra o seu apito. A entrega do reforço primário pode ocorrer apenas quando o animal volta para perto do treinador, sem que haja confusão por parte do animal relativamente a qual o comportamento que mereceu o reforço.

Uma das questões que mais discussões origina é o facto de se poder ou não utilizar um reforço secundário ou condicionado para reforçar um comportamento que está a decorrer, sem que o indivíduo termine o comportamento e volte para o treinador em antecipação da recompensa.

Quem pretender utilizar este tipo de solução, deverá ter em atenção que o animal terá de aprender que para determinadas situações o reforço condicionado não o liberta do comportamento.

Pessoalmente, não gosto muito desta solução e uma das sugestões que surge na literatura sobre o assunto, é utilizar um marcador que realmente liberta o animal e um outro que serve para dar duração ao comportamento e indicar ao indivíduo que um reforço primário estará para breve.

Exemplo: a palavra good pode ser um reforço condicionado que indica ao indivíduo que deve continuar a trabalhar enquanto que a palavra out marca sempre o final de uma sequência de comportamentos e um reforço primário.

Uma nota para salvaguardar o autor de confrontações ideológicas no futuro: não existem verdades absolutas nem métodos infalíveis no treino de cães. É perfeitamente possível que no futuro me chegue às mãos informação mais recente que me faça mudar de opinião em relação ao que penso hoje. Há que estar sempre pronto para ajustar.

Referências:
Pryor, K (2002). Don’t Shoot the Dog; The new art of teaching and dog training. Ringpress Books, Gloucestershire, UK.
Ramirez, K. (1999). Animal training: Successful animal management through positive reinforcement. Chicago: Shedd Aquarium.
Reid PJ. (1996). Excelerated Learning. James and Kenneth Publishers, Oakland, CA.

Este artigo foi originalmente publicado na Edição nº 18 da Revista Mundo dos Animais, em Dezembro de 2010, com o título “Timing”.

Tópicos: Treino e Manutenção de Cães, Cães, Animais de Estimação, Artigos em Destaque