TERCERA PARTE

EVALUACIÓN DE RECURSOS HUMANOS
Y ORGANIZATIVOS

 

RENDIMIENTO DE LOS RECURSOS HUMANOS Y
MEDICIÓN DE LA PRODUCTIVIDAD EN ORGANIZACIONES
PÚBLICAS Y EDUCATIVAS

T. Zane Reeves*

Introducción

Casi todo estudiante o practicante de administración de personal puede recordar rápidamente los nombres de cuatro o cinco técnicas de evaluación del rendimiento. Escalas de clasificación, acontecimientos críticos, narraciones, y elección obligada fluyen de la boca como prosa memorizada. Si nuestra familiaridad con las técnicas más actualizadas es algún indicio de nuestra pericia, la evaluación del rendimiento con seguridad sería la faceta más experimentada (tal vez científica) de la administración de personal. Nada podría estar más lejos de la verdad. La evaluación del rendimiento es el lazo más débil en la subdisciplina de administración de personal. La habilidad para distinguir entre el rendimiento deficiente y el aceptable es crucial para una gran variedad de funciones de administración de personal, pero las técnicas que se usan para cumplir esta tarea están generalmente viciadas, son inapropiadas o están sujetas a error significativo. Las evaluaciones del rendimiento tienen tres funciones básicas: 1. Proporcionar retroalimentación a los empleados en cuanto a su rendimiento; 2. Servir de base para modificar o cambiar conductas para lograr hábitos de trabajo más deseables; y 3. Proporcionar a los gerentes información que puede ser usada en futuras decisiones internas sobre el personal. Estas funciones se pueden desglosar en una larga lista de puntos para la toma de decisiones en la que la información de la evaluación del rendimiento generalmente se usa.

1. La decisión de compensación;

2. La decisión de mejorar el rendimiento del personal y de la organización;

3. La decisión de promoción;

4. La decisión de perfeccionamiento profesional e institucional;

5. La decisión de cambio—reasignación de personal;

6. La decisión de planificación laboral—promoción y democión;

7. La decisión de despidos y terminación de contratos;

8. La decisión de la documentación de acciones pertinentes al personal, como las de disciplina;

9. La decisión de confiablidad—procedimientos de reclutamiento, selección y ubicación que generan una fuerza de trabajo competente y una organización viable y eficaz.

La frecuencia en que las evaluaciones del rendimiento se usan para estos diferentes propósitos varía mucho de una agencia a otra y entre diferentes niveles o tipos de gobierno. En los gobiernos estatales en los Estados Unidos, a pesar de la gran diversidad en los usos de los resultados de la evaluación del rendimiento, la forma de uso más común incluye el aumento de la comunicación entre los supervisores y los empleados, al hacer determinaciones de sueldos anuales, para guiar la planificación de la mano de obra y para justificar las acciones del personal. Con pocas variaciones, la investigación de este autor tiende a confirmar los encuentros de Field y Holley (1975), quienes concluyeron que las evaluaciones se usan para (en orden de importancia descendente): promociones y despidos; planificación de la mano de obra; ajustes de sueldos; comunicaciones; determinación de las necesidades para desarrollo de la organización; actualización de la descripción de puestos; y validación de los procedimientos de selección y promoción. Las evaluaciones del rendimiento juegan un rol significativo en la infraestructura organizacional. Las principales decisiones de la gerencia dependen de la información confiable que se obtenga de la evaluación del rendimiento; sin embargo, la comunidad profesional no ha sido capaz de diseñar una técnica de evaluación que se pueda considerar confiable o aceptable. En verdad, el único acuerdo que realmente existe es que no hay una sola técnica que sea adecuada. Las fuentes de nuestra imposibilidad para resolver el problema de la evaluación provienen de muchas irregularidades inherentes a los sistemas de evaluación del rendimiento. Estas irregularidades tienden a distorsionar los resultados de las evaluaciones del rendimiento y a alejar a supervisores de los empleados. También tienden a divorciar la evaluación del rendimiento de personal de la evaluación programática y organizativa.

Irregularidades en evaluaciones del rendimiento

La mayoría de los sistemas de evaluación del rendimiento consisten en varios pasos rutinarios. Normalmente, a cada supervisor se le pide que clasifique a sus subordinados en intervalos fijos. Estos intervalos varían bastante, y las evaluaciones anuales son las más comunes. El supervisor generalmente llena formularios estandarizados de acuerdo a criterios previamente definidos, emite un juicio en cuanto al rendimiento del subordinado en relación a estos criterios y aconseja al subordinado de acuerdo a los resultados. Los problemas encontrados en este proceso pueden ser categorizados aproximadamente en dos actores: supervisores y trabajadores.

Fallas de la supervisión

El proceso de evaluar a los subordinados es a menudo una experiencia desagradable para los supervisores. Además de ser agotador, las evaluaciones del rendimiento exigen que los supervisores enfrenten a sus empleados en sus éxitos y fracasos. Aún más, la responsabilidad recae en el supervisor al determinar la suerte de los trabajadores dentro de la organización. Mientras el supervisor realiza la evaluación, él o ella está expuesto a una serie de fallas. Estas trampas en la evaluación son producto del carácter psicológico humano, así como del instrumento de evaluación mismo.

Desequilibrio

La ansiedad ocasionada por la evaluación a menudo obliga a los supervisores a ser muy generosos—error positivo de indulgencia. Dado que los supervisores están frecuentemente muy ocupados para dedicarse a una evaluación detallada, es más fácil otorgar puntuaciones altas. Ellos creen que las altas puntuaciones probablemente coincidirán con la opinión de los empleados y así se reducirán las probabilidades de conflicto y se necesitará menos tiempo para explicar o defender dicha evaluación. Esta es una instancia del vínculo entre la evaluación de personal y la conducta administrativa, ya que el manejo del conflicto organizacional es meta esencial de todo gerente; la tendencia es de orientar decisiones y evaluaciones del rendimiento humano hacia las exigencias administrativas. Esta tendencia se agudiza especialmente en organizaciones donde uno o dos informes de rendimiento pueden poner seriamente en peligro la carrera de un empleado. Por ejemplo, se ha dicho que el promedio de clasificación para todos los oficiales del ejército de los Estados Unidos está en el percentil número noventa y dos, lo que numéricamente indica un rendimiento sobresaliente. Dado que la mayoría de las organizaciones nunca critica directamente a sus gerentes por otorgar calificaciones altas, hay pocos incentivos sistémicos para remediar estas prácticas.

Efecto “halo”

El efecto halo ocurre cuando un evaluador permite que un factor positivo o negativo afecte la evaluación completa del empleado. Por ejemplo, si el primer ítem del formato de evaluación es cortesía y el empleado que está siendo evaluado es extremadamente cortés, el evaluador permite que este atributo positivo influya en los restantes ítemes del formato. Todos los factores pueden ser considerados excelentes debido al efecto halo del primer factor.

El efecto “reciente” es una variación del efecto halo. Algunos supervisores tienden a evaluar a los trabajadores en base a la información que ellos tienen inmediatamente antes de la revisión del rendimiento. De esta forma, si un empleado comete un gran error una semana antes de la revisión, él o ella puede sufrir las consecuencias a pesar de demostrar un rendimiento productivo durante el resto del período de revisión.

Tendencia central

Algunos evaluadores tienden a calificar a todos los empleados dentro de un margen estrecho. Tanto los buenos como los malos empleados se agrupan en una o dos categorías, tales como “inferior al promedio” o “promedio”. Se cree que esta tendencia se puede atribuir a una diferenciación social —los diferenciadores bajos tienden a ignorar las diferencias porque ellos perciben el universo como más uniforme de lo que realmente es; por el contrario, los diferenciadores altos tienden a utilizar toda la información al máximo y por lo tanto perciben diferencias escogidas que los diferenciadores bajos ignoran. Estándares de evaluación

Diferentes evaluadores usan diferentes medidas o estándares de evaluación. A menos de que exista una medida fácilmente cuantificable, el evaluador tiene libertad para utilizar su propio juicio en relación al significado de los varios factores (iniciativa, lealtad, rapidez, etc) y los conceptos de evaluación (bueno, promedio, excelente, etc.). Un supervisor puede otorgar el término “excelente” a una conducta que otro juzgue ser solamente aceptable. Los investigadores han descubierto que algunos evaluadores aplican constantemente una medida basada en sus propias auto percepciones (“error de similitud”). Por ejemplo, si el evaluador se percibe a sí mismo como una persona verdaderamente agradable, puede evaluar a otros buscando rasgos similares. El individuo que no logre alcanzar los estándares que correspondan al ser agradable (puede ser un empleado agresivo o reservado) será, por regla general, castigado en su informe de evaluación.

Prejuicio personal

Prejuicios de cualquier clase pueden influir en el proceso de evaluación del rendimiento. El fenómeno en el profesor que se guía inconcientemente por el prejuicio o por el favoritismo personal en la evaluación de estudiantes es análogo a los gerentes públicos que se dejan llevar por motivos similares. De esta forma, algunos evaluadores pueden calificar de acuerdo a su criterio personal, en cuanto a si los empleados son de su agrado o no lo son. Hay también evidencias que los estereotipos raciales y sexuales afectan la aplicación de las evaluaciones de las minorías raciales o étnicas y de las mujeres en ciertos tipos de trabajo, donde pueden esperar recibir evaluaciones más bajas que sus contrapartes varones de raza blanca.

Los empleados: Una falta de confianza

Consideraciones subjetivas en el proceso de evaluación abarcan fallas problemáticas e inexorables para una revisión confiable del rendimiento. La mayoría de los empleados públicos no producen resultados tangibles para los cuales se pueden formular estándares de trabajo. Por lo tanto, las evaluaciones del rendimiento pueden llegar a ser los indicadores más significativos del progreso del empleado y nivel de satisfacción de la gerencia. La falta de estándares para productos reales, hace que la mayoría de los esquemas de evaluación confíen en “los poderes del rendimiento”, criterio que aproxima el rendimiento solamente en forma marginal. Los rasgos y tendencias del empleado se substituyen por estándares válidos de rendimiento del producto organizacional. Hemos visto que las influencias del evaluador pueden distorsionar fuertemente los resultados de las técnicas de evaluación del rendimiento. Los juicios del evaluador son generalmente subjetivos y oscilantes. Las calificaciones de diferentes gerentes son casi totalmente incomparables. Sin una distinción clara, los gerentes están obligados a emitir juicios arbitrarios para distribuir los aumentos, las promociones y otros beneficios. Se puede esperar que los empleados lógicamente desconfíen del proceso de evaluación en tal caso. Los beneficios de una consejería en una evaluación del rendimiento se pierden totalmente si los empleados no tienen confianza en el proceso. Una baja calificación del rendimiento se podría atribuir a los prejuicios del supervisor, sin considerar la veracidad de esa conclusión. Otros empleados podrían simplemente desistir y perder todo interés en mejorar el rendimiento. La sátira, la hipocresía y otras patologías organizacionales pueden aparecer por todos los lados. Hay una tendencia a tratar de parecer competente, aun cuando las metas se olviden durante el proceso. En este contexto, es imposible motivar a los empleados, con o sin programas de incentivos. Para que un sistema de evaluación del rendimiento funcione, los empleados tienen que tener confianza en su integridad, imparcialidad, y precisión. Debe ser percibido como justo y equitativo. Dadas las limitaciones de la evaluación del rendimiento en ausencia de estándares de trabajo objetivos, una técnica completamente imparcial y confiable es un poco más que una aspiración idealizada. A pesar de este pesimismo, existen un número de estrategias para la evaluación del rendimiento que han tenido éxito parcial al evitar varias fallas de prejuicio.

Métodos de evaluación

A continuación se presenta una muestra representativa de técnicas de evaluación en uso. Métodos que no son ampliamente usados se incluyen por su valor educacional —quizás podamos aprender de sus irregularidades. Es irónico, sin embargo, el hecho de que las técnicas más imperfectas de evaluación del rendimiento son aquéllas que se usan más comúnmente en las agencias contemporáneas de gobierno.

Escalas de clasificación

Sin duda la forma de evaluación del rendimiento más popular, las escalas de clasificación incluyen una gran variedad de formatos que tienen diferentes nombres, incluyendo escalas de calificación graficadas, escalas de conductas por rangos y escalas de clasifición. Estas técnicas tienen una cosa en común: se requiere que el evaluador clasifique el rendimiento del empleado llenando un formulario preparado para tal fin. Esto requiere chequear casillas, poner un círculo en una letra o número, o colocar una marca a lo largo de un continuo.

La escala convencional consiste en un conjunto de factores relacionados con el trabajo que el evaluador debe promediar. Aunque tanto la calidad como la cantidad de trabajo se evalúa, gran parte del formato de evaluación generalmente se destina a características personales como entusiasmo, actitud y cooperación. El evaluador emite juicios en cuanto a la forma en que el empleado demuestra poseer estos atributos. Se otorgan unidades de clasificación que varían de superior a deficiente (o siempre a nunca). Normalmente, se asignan puntos a cada factor de tal manera que un solo total numérico se compute para cada empleado. Un rasgo que se clasifique como superior puede tener un valor de 5 puntos, por ejemplo, mientras que deficiente recibe sólo 1 punto. Esto permite a los gerentes hacer diferencias muy precisas (o aparentemente precisas) entre sus empleados. Aquéllos que logren un total de 45 puntos o más pueden recibir aumentos, por ejemplo, mientras que aquéllos que logren menos de 45 puntos se excluyen. Otras escalas le proporcionan al evaluador un rango de elecciones mucho más amplio, como es el caso de las líneas continuas:

Conocimiento del trabajo (Coloque una marca en el punto apropiado):

1 25 50 75 100
INADECUADO BAJO
PROMEDIO
AL
PROMEDIO
SOBRE
PROMEDIO
SUPERIOR

   

Debido a defectos obvios de la escala tradicional, se han inventado docenas de variaciones sobre el tema básico. Espacios para relatos se entregan con frecuencia para permitir a los evaluadores ofrecer explicaciones o para referirse a temas específicos (por ejemplo, “Enumere las tres áreas que necesitan el mayor desarrollo). Escalas más sofisticadas ofrecen definiciones y estándares para los rasgos que se evalúan o usan juicios descriptivos. Para el criterio de “responsabilidad,” los juicios descriptivos podrían incluir frases como: “Nunca falla en el cumplimiento de los plazos”; “rara vez requiere supervisión”; “serias deficiencias para cumplir con los plazos”; “no cumple sus obligaciones”; o “requiere de supervisión estrecha y contínua”. Las escalas de clasificación son universalmente consideradas como medidas inadecuadas del rendimiento del empleado. Aunque parecen ser científicas porque su énfasis está en los números, son extremadamente susceptibles al error e influencia del evaluador. Los juicios subjetivos inevitablemente se inmiscuyen en el proceso porque a los evaluadores se les pide juzgar sobre factores puramente cualitativos. Además, su énfasis en los rasgos del empleado generalmente tienen poca relevancia para la productividad o eficiencia. Por estas razones, son útiles solamente en forma marginal para la consejería o para hacer comparaciones entre los empleados. A pesar de estos evidentes defectos, las escalas de clasificación son la forma predominante en la evaluación del rendimiento tanto en el gobierno como en la industria. Su popularidad se puede atribuir a dos factores principales. Primero, las escalas de clasificación son económicas para construirlas. Se puede elaborar un formato de clasificación (aunque malamente) en pocas horas. Una vez elaboradas, el formato se puede aplicar casi universalmente. En el sistema de personal de Carolina del Sur, por ejemplo, solamente dos escalas —una para supervisores y una para otros— se usan para evaluar a los 45,000 empleados estatales. Segundo, las escalas de clasificación son de fácil administración. La mayoría puede completarse en cuestion de minutos. Si consideramos que a los evaluadores por lo general no les agrada el proceso de evaluación, es lógico que ellos apoyen un formato que les permita terminar la desagradable tarea en forma rápida. De esta forma, las escalas de clasificación les mantendrán su rol preeminente, aunque injustificado, en la evaluación de empleados del sector público.

Relatos

Muchas organizaciones públicas usan formatos con ensayos abiertos o guiados. Estos generalmente se aplican a los empleados de gerencia o a profesionales, a quienes no se les puede aplicar estandares de trabajo. Al evaluador a menudo se le pide que evalue la contribución del empleado, logros, puntos fuertes y débiles. Los informes narrados se usan junto a otras técnicas de evaluación, en especial escalas de clasificación o listas de verificación. (Una lista de verificación consiste en una lista de adjetivos y/o juicios descriptivos que el evaluador marca si son pertinentes.) Si se usan para complementar otros instrumentos de evaluación, el relato se centra en conclusiones resumidas y elaboradas en puntos específicos que requieren mayor explicación.Las evaluaciones con relatos son útiles para aconsejar a los empleados y para proporcionar información básica para futuras designaciones o decisiones de promoción. Los relatos son casi ineficaces para propósitos de comparación y toman mucho tiempo prepararlas. Además, la clasificación del empleado puede depender del deseo del evaluador para poner el suficiente esfuerzo en el proceso y de la habilidad literaria del evaluador. Los empleados que tienen supervisores semianalfabetos pueden recibir menos aumentos dado que sus evaluaciones con relatos no estan hechas con adjetivos de diez sílabas, —y como resultado, se sabe que algunos empleados le han regalado a sus supervisores un diccionario Thesaurus como regalo de Navidad.

Incidencia crítica

Esta técnica de evaluación se centra en el rendimiento real de los empleados a medida que realizan sus rutinas diarias. Como primer paso, se prepara una descripción dinámica del trabajo. Esto incluye una lista de los principales requisitos de rendimiento del trabajo, expresados en términos de rendimientos eficiente e ineficiente. Se prepara luego un formato que usa el evaluador para registrar los incidentes del trabajo que demuestren el rendimiento bueno o deficiente. Se recopila una bitácora de estos formatos y se usa para evaluar al trabajador al final del período de evaluación. La técnica de incidentes críticos es úti1 especialmente para aconsejar a los empleados porque se centra en indicadores del rendimiento real. Además, evita ciertas influencias en el evaluador, como el error reciente y el efecto halo. A pesar de estos atributos, la técnica de incidentes críticos está expuesta a varias distorsiones. Dado que los supervisores tienen que buscar conductas buenas o malas, con frecuenca tienden a superestimar los hábitos de trabajo atípicos. Los empleados pueden percibir la técnica como un hermano mayor de Orwell; pueden sentirse incómodos (o neuróticos) al ser observados con una intención. La técnica también requiere que cada clasificación del trabajo sea descrita de acuerdo a rendimiento bueno o malo, haciéndola en consecuencia, costosa para su diseno e implementación. Finalmente, la técnica de incidentes críticos es la forma de evaluación de mayor consumo de tiempo. Para evaluar en forma apropiada, los supervisores deben estar constantemente observando y registrando el rendimiento del empleado. Estos factores han contribuído a que haya resistencia por parte del trabajador y de la gerencia.

A manera de conclusión

La única conclusión que se puede sacar de esta revisión parcial de técnicas representativas de la evaluación del rendimiento es que no son exactas ni confiables. Ninguna medida de evaluación escapa de tener influencia de errores o defectos que distorsionan los resultados. Por lo tanto, las evaluaciones deberían centrarse, cuando sea posible, en resultados reales en oposición a rasgos de personalidad y de carácter. Se debería dar más crédito a los resultados de estándares laborales y al análisis de resultados grupales que a la evaluación de la lealtad, iniciativas e ingenuidad del empleado. La faceta más subjetiva de cualquier evaluación es aquella que considera rasgos que no guardan relaciónn con la productividad. Aunque detectar tales características en un trabajador pueda ser útil para identificar imperfecciones cualitativas del rendimiento del trabajador, nunca deberían ser usadas como el único indicador del valor del empleado o de su trabajo. Es más, la evaluación del rendimiento de los recursos humanos en las organizaciones, sobre todo aquellas en el sector público, no puede separarse de la aseroría del rendimiento organizacional y programático.


* El Dr. T. Zane Reeves es profesor de Administración Pública en la Escuela de Administración Pública, The University of New Mexico. Es autor o coautor de varios textos en el área de evaluación de sistemas de personal, incluyendo “Personnel Management in the Public Sector.”


 

BIBLIOGRAFÍA

Cellar, Douglas F., Margaret Durr y Susanne Halsell. “The Effect of Field Independence, Job Analysis Format, and Sex of Rater on the Accuracy of Job Evaluation Ratings”. Journal of Applied Social Psychology 19 (1989): 363-76.

Crampton, Suzanne M, John W. Hodge y Jaideep Motwani. “The Relationship Between Managing Diversity and Merit-Based System.” Supervision 54 (1993): 17-19.

Cyr, Robert. “Seven Steps to Better Performance Appraisals.” Training and Development 47 (1993): 18-19.

Daley, Dennis M. “Saving Performance Appraisal from TQM”. PA Times 17.6 (1994): 8.

Dobbins, Gregory H., Stephanie J. Platz, y Jeff Houston. “Relationship Between Trust in Appraisal and Appraisal Effectiveness: A Field Study.” Journal of Business and Psychology 7 (1993): 309-22.

Eyes, Peter R. “Realignment Ties Pay to Performance.” Personnel Journal 72 (1993): 74-77.

Fedor, Donald R., y M. Ronald Buckley. “Issues Surrounding the Need for More Frequent Monitoring of Individual Monitoring in Organizations.” Public Personnel Management 17.4 (1988): 435-442.

Field, Hubert y William Holley. “Performance Appraisal—An Analysis of Statewide Practices”. Public Personnel Management May-June (1975): 145-150.

Hays, Steven, y Charlie Tyer. “Human Resources Management: The Missing Link.” International Journal of Public Administration 2.3 (1980): 297-330.

Huber, Vandra L. “Comparison of Supervisor-Incumbent and Male- Female Multidimensional Job Evaluation Ratings.” Journal of Applied Psychology 76 (1991): 15-21.

Judge, Timothy A. y Gerald R. Ferris. “Social Context of Performance Evaluation Decisions.” Academy of Management Journal 36 (1993): 80-105.

McBriarty, Mark A. “Performance Appraisal: Some Unintended Consequences.” Public Personnel Management 17.4 (1988): 421-434.

Mount, Micheal K., y Rebecca Ellis. “Sources of Bias in Job Evaluation: A Review and Critique of Research.” Journal of Social Issues 45 (1989): 153-167.

Newman, Thomas, “How Do We Know Training Makes a Difference?,” Training and Development 47 (1993): 80-1.

Nigro, Lloyd G., y Felix A. Nigro. The New Public Personnel Administration. 4th ed. Itasa, IL.: Peacock Publishers, 1994.

Plachy, Roger J. y Sandra J. Plachy. “Focus on Results, Not Behavior.” Personnel Journal 72 (1993): 28.

Sabo, Richard R. “Preventing Problems: A Neglected Supervisory Skill.” Supervisory Management 37 (1992): 1-2.

Sandwith, Paul. “A Hierarchy of Management Training Requirements: The Competency Domain Model.” Public Personnel Management 22 (1993): 43-62.

Schneyer, Fred A. “Worker Evaluations: Employers Seek Better System of Measurement.” Business Outlook (1994): 14.

Sims, Ronald R., John G. Veres, y Susan M. Heninger. “Training Appraisers: An Orientation Program for Improving Supervisory Performance Ratings.” Public Personnel Management 16.1 (1987): 37-46.

Smither, James W., Hillarie Collins, y Richard Buda. “When Ratee Satisfaction Influences Performance Evaluations: A Case of Illusory Correlation.” Journal of Applied Psychology 74 (1989): 599-605.

Somers, Mark John, y Dee Birnbaum. “Assuring Self-Appraisal of Job Performance as an Evaluation Device: Are the Poor Results a Function of Method or Methodology?,” Human Relations 44 (1991): 1081-91.

Thayer, Frederick C. “Performance Appraisal: Bad Idea, Bad Timing, Bad Implementation.” P.A. Times 17.8 (1994): 7.