La teoría del condicionamiento operante (19481) fue desarrollada por un tipo llamado B.F. Skinner. Skinner era profesor de psicología en la Universidad de Harvard y fue considerado por la Asociación Americana de Psicología como el psicólogo más eminente del siglo XX.
¿Qué es el condicionamiento operante?
Skinner introdujo dos nuevos términos en la Ley del Efecto: refuerzo y castigo. Los utilizó para identificar tres ideas clave:
- El comportamiento puede incrementarse o mantenerse mediante la adición de estímulos agradables o la eliminación de estímulos aversivos (Refuerzo).
- El comportamiento puede disminuirse mediante la eliminación de estímulos agradables o la adición de estímulos aversivos (castigo).
- El comportamiento que se refuerza tiende a repetirse (es decir, a reforzarse), mientras que el comportamiento que deja de reforzarse tiende a extinguirse (es decir, a debilitarse).
Skinner organizó un sencillo experimento con una caja y una rata para probar la teoría del condicionamiento operante. La caja contenía una palanca que la rata podía accionar para obtener comida o detener una pequeña descarga eléctrica. La caja estaba conectada a un equipo electrónico que registraba las acciones del animal. En la primera iteración del experimento, la rata podía accionar la palanca y recibir una bolita de comida (reforzador positivo); en la segunda, la rata podía accionar la palanca para detener una descarga eléctrica (reforzador negativo)2.
Figura 1: Caja de Skinner. Se utilizaron varios estímulos, como luces, imágenes y sonidos, para medir las respuestas. Adaptado de "The Behaviour of Organisms: An Experimental Analysis" de B.F. Skinner, 1938, Figura 1, p. 49.
Sustituyendo una rata por un consumidor, si la compra de un producto o servicio genera puntos y éstos se canjean por una recompensa deseable, es más probable que el consumidor repita el comportamiento, ya que se ha visto reforzado con una consecuencia positiva. Este efecto puede reforzarse aún más con un diseño de CX de buena calidad y un marketing que informe y recuerde al miembro los beneficios a los que ha accedido, de forma similar a una máquina tragaperras que hace sonar campanas y luces intermitentes cada vez que un jugador gana.
Del mismo modo, amenazar con la retirada de un estímulo gratificante (como retirar el acceso a las ventajas del nivel de estatus por no obtener suficientes créditos de estatus) puede motivar al afiliado a reducir su comportamiento de compromiso estancado.
Por último, al eliminar la recompensa por completo, los operadores del programa pueden esperar un debilitamiento (extinción) del comportamiento de compra.
Estudio de caso: Hilton Honors
Los miembros de Hilton Honors desbloquean ventajas por alcanzar umbrales de "noches de estancia". Por ejemplo, un miembro alcanzará la categoría plata y desbloqueará una serie de ventajas adicionales tras alojarse más de 7 noches. Se trata de un ejemplo de "refuerzo de proporción fija", por el que se ofrece una recompensa cuando se realiza un comportamiento un determinado número de veces.
Se anima a los socios a seguir con este comportamiento para desbloquear un conjunto de recompensas aún más deseable. Esto incluye desayuno gratis, puntos de bonificación y acceso a posibles mejoras de habitación tras más de 28 noches de estancia cuando se desbloquea la categoría Oro.
Hilton también refuerza el comportamiento mediante la aplicación de castigos. Es decir, los socios que no se alojen el número suficiente de noches para mantener su nivel de estatus serán relegados a un nivel inferior. Esta reducción de estatus conlleva la pérdida de privilegios de nivel, lo que indica al socio que debe mantener sus niveles de visitas más elevados para evitar estas consecuencias negativas.
Estudio de caso: Recompensas Uber
Uber Rewards premia a los usuarios con ventajas exclusivas en cada umbral de "puntos". El programa es gratuito y otorga puntos por los viajes en Uber y los pedidos de Uber Eats, que se utilizan para calcular el nivel del usuario. Por ejemplo, un usuario que alcance los 4.000 puntos (nivel Platino) se beneficiará de recogida prioritaria en aeropuertos y confianza en el precio entre sus dos lugares favoritos en horas punta.
El gasto de los usuarios genera ingresos para Uber y es la única actividad de obtención de puntos para Uber Rewards (aunque algunas actividades de gasto tienen distintos niveles de ganancia), lo que refuerza el comportamiento. La asistencia telefónica Premium y los viajes Premium están reservados para el nivel superior. Una vez más, se anima continuamente a los usuarios a realizar compras para desbloquear recompensas más atractivas.
Uber impone un castigo en forma de retirada de prestaciones si no se alcanza el umbral de puntos en el periodo de 6 meses siguiente a la consecución del umbral de nivel. Una vez que un beneficio deseable está disponible, muchos clientes tomarán medidas para evitar perder el beneficio. El castigo por un gasto menor mantiene el programa alineado con los objetivos empresariales y recompensa a los clientes más valiosos de Uber.
Reflexiones finales
La aplicación del condicionamiento operante es muy poderosa en el contexto de la fidelización. Las marcas que pueden identificar y reforzar estratégicamente de forma continua los comportamientos deseados mejorarán el compromiso de los clientes en sus segmentos de clientes de mayor valor. Por otro lado, un comportamiento que no se refuerza continuamente es probable que se debilite. Sea cual sea el comportamiento deseado por el cliente en su empresa, asegúrese de reforzarlo.
Pronto publicaremos más artículos de la serie Psicología de la fidelización.
1 Skinner, B. F, 1948, '"Superstition" in the pigeon, Journal of Experimental Psychology, Vol 38, Iss 2, pp168-172.
2 Skinner, B. F., 1938, 'The Behaviour of Organisms: An Experimental Analysis', Cambridge, Massachusetts, Figura 1, p49, https://www.researchgate.net/publication/313181463_The_behavior_of_organisms_-_Skinner_BF, consultado el 16 de julio de 2022.