O ENGANO FATAL DA AVALIAÇÃO EDUCACIONAL
Benigna Maria de Freitas Villas Boas
Publicado no blog do GEPA em 05/04/2016
Um artigo da revista on line Education Week, de 23 de março de 2016, de autoria de W. James Popham, trata do engano fatal da avaliação educacional. Popham é professor emérito da Faculdade de Educação da Universidade da California, em Los Angeles, e foi presidente da Associação Americana de Pesquisas Educacionais. É autor de livros e artigos sobre avaliação.
Farei uma tradução livre do artigo.
Os estudantes americanos não estão sendo educados como deveriam ser. Uma razão- chave para essa calamidade é o uso errado de testes a partir dos quais tomamos nossas mais importantes decisões. O trabalho dos professores e das escolas tem sido avaliado largamente pelos resultados do desempenho dos estudantes obtidos nos testes padronizados. Contudo, a maioria desses testes não atende ao seu propósito.
Quando utilizamos testes inadequados para avaliar a qualidade instrucional, muitos bons professores são considerados ineficientes e conduzidos pelos gestores a abandonar procedimentos pedagógicos que funcionavam bem. Por outro lado, testes inadequados frequentemente falham em identificar os verdadeiros professores fracos – aqueles que apresentam sérias necessidades de assistência instrucional e que não recebem ajuda porque se pensa que estão atuando satisfatoriamente. Nesses dois casos, os estudantes são os prejudicados.
O que mais assusta sobre esse amplo mal uso dos testes é que muitos educadores, elaboradores de políticas educacionais e pais não percebem como eles contribuem para reduzir a qualidade do trabalho escolar.
Atualmente os testes educacionais pretendem satisfazer três propósitos principais, acreditando-se que todos eles podem ter papel construtivo na educação dos estudantes: comparar, instruir e avaliar.
Os testes cujo foco é a comparação permitem identificar diferenças baseadas em resultados entre estudantes e entre grupos de estudantes. Essas comparações frequentemente conduzem à classificação dos estudantes, com base em resultados individuais (por meio de percentuais), e entre grupos (distinguindo-os como proficientes e não proficientes).
O segundo propósito é instrucional, por buscar evidências sobre o nível de desempenho dos estudantes para que melhores decisões quanto ao seu processo de aprendizagem possam ser tomadas. Os testes baseados em evidências podem também ajudar os estudantes a decidir sobre o que mudar em seu próprio processo de aprendizagem.
Testes construídos especialmente com vistas à comparação não se adequam aos propósitos de instrução ou de avaliação da qualidade instrucional.
O terceiro propósito é a avaliação, isto é, determinar a qualidade de um completo conjunto de atividades instrucionais promovidas por um ou mais professores. Essas avaliações frequentemente focalizam um longo segmento da instrução, como um ano letivo inteiro.
Estes três propósitos, se implementados por meio de testes apropriados, podem beneficiar os estudantes. O problema é que a comparação tem dominado completamente o sistema de testagem da educação americana por quase um século.
Nossa preocupação com testes para comparação pode recair sobre a Primeira Guerra Mundial, quando, para identificar os melhores candidatos para um programa de treinamento de oficiais, o teste denominado Army Alpha (group-administered intelligence test) foi desenvolvido para mais de um milhão e meio de recrutas americanos. Destinado a identificar os mais fortes candidatos a oficiais, o teste funcionou bem. Como consequência, por aproximadamente 100 anos, quase todos os nossos testes educacionais nacionais têm sido construídos e avaliados com base em testes para medir capacidades comparativas.
Contudo, testes elaborados basicamente para efeitos comparativos não são adequados aos propósitos instrucionais ou de avaliação da qualidade instrucional. Oferecem aos professores poucas contribuições instrucionais e conduzem a avaliações imprecisas da qualidade do trabalho do professor.
Em 2014, as três associações nacionais mais preocupadas com os testes educacionais americanos – The American Educational Research Association, the American Psychological Association and the National Council on Measurement in Education – publicaram nova edição de orientações para construção e avaliação de testes educacionais. De maneira direta, os padrões revisados recomendam que haja testagem educacional intencional, na qual táticas sobre os propósitos específicos dominem o desenvolvimento do teste e as evidências relacionadas aos propósitos específicos governem a avaliação do teste.
Chegou a hora de abandonarmos a crença ingênua de que um teste educacional criado para o propósito X possa ser usado descuidadamente para o propósito Z. Um grande número de crianças em nossas escolas é prejudicado por esses métodos porque os educadores estão baseando suas decisões em informações inapropriadas e fornecidas por testes erroneamente usados. Devemos seguir as recomendações atuais da comunidade de medidas e exigir a aplicação de testes condizentes com as necessidades educacionais.
Importante e oportuna colaboração da Profa. Benigna Villas Boas!
Este artigo de Ponham está sendo muito considerado e sua tradução o faz acessível não apenas aos educadores brasileiros mas a todos que têm comentado e proposto usos impróprios dos resultados das avaliações de desempenho dos estudantes, em larga escala, nacionais e estaduais.
Obrigada, professora Maria Beatriz. Precisamos ampliar a discussão sobre o papel da avaliação em larga escala de modo a articular seus resultados à avaliação para as aprendizagens e à avaliação do trabalho pedagógico da escola.
Obrigada Professora Villas Boas pela tradução do artigo.
Precisamos sim, com urgência, reconstruir nossos conceitos sobre a avaliaçáo. Compreender a mesma como um processo que se constrói a cada dia é vital na aprendizagem…Abraço.