Definizione, caratteristiche ed esempi di condizionamento operativo



il condizionamento operante o Il condizionamento strumentale è un tipo di apprendimento in cui il comportamento è controllato con conseguenze.

Si basa sull'idea che i comportamenti di rinforzo tendono a presentarsi in più occasioni, mentre i comportamenti che vengono puniti si estinguono.

Qual è la differenza tra condizionamento operante e condizionamento classico? Nel condizionamento operante, una risposta volontaria è seguita da un rinforzo. In questo modo, la risposta volontaria (ad esempio, studiando per un esame) è più probabile che si verifichi in futuro. Al contrario, nel condizionamento classico uno stimolo attiva automaticamente una risposta involontaria.

Il condizionamento operativo può essere descritto come un processo che tenta di modificare il comportamento attraverso l'uso del rinforzo positivo e negativo. Attraverso il condizionamento operante, un individuo crea un'associazione tra un particolare comportamento e una conseguenza. Esempi:

  • I genitori premiano i buoni voti per un bambino con caramelle o qualche altra ricompensa.
  • Un insegnante premia quegli studenti che sono calmi e istruiti. Gli studenti si rendono conto che comportandosi in questo modo ricevono più punti.
  • Un cibo viene dato ad un animale ogni volta che viene premuta una leva.

B.F. Skinner (1938) coniò il termine condizionamento operante. Skinner ha identificato tre tipi di risposte o operandi che possono seguire il comportamento:

  • Operatori neutrali: risposte dall'ambiente che non aumentano o diminuiscono la probabilità che un comportamento si ripeta.
  • esaltatori: risposte dall'ambiente che aumentano la probabilità di ripetizione di un comportamento. I rinforzi possono essere positivi o negativi.
  • punizioni: risposte dall'ambiente che riducono la probabilità che un comportamento si ripeta. La punizione indebolisce il comportamento.

Antecedenti del condizionamento operante

Thorndike fu il primo a riconoscere che questo condizionamento include più di una semplice risposta e un rinforzo. La risposta è data in presenza di determinati stimoli, considerando tre eventi: lo stimolo, la risposta e la conseguenza della risposta o del rinforzo.

Questa struttura facilita lo sviluppo di diversi collegamenti come l'associazione tra lo stimolo e la risposta, che era per Thorndike la chiave per la formulazione della legge dell'effetto. Attraverso questo ha affermato che le risposte che sono seguite dalle conseguenze rinforzanti saranno più probabili che si verifichino quando lo stimolo riappare.

Al contrario, quelle risposte che sono seguite da conseguenze negative avranno una probabilità minore di accadimento quando lo stimolo riappare. La legge dell'effetto è l'antecedente del condizionamento operativo o del condizionamento strumentale, come è stato chiamato da Thorndike.

Ma per Skinner, psicologo comportamentale, il condizionamento era il rafforzamento dei comportamenti in base alle conseguenze che in precedenza sarebbero state ottenute.

In questa linea, ci sono due forme di condizionamento:

  • Il classico o pavloviano: si basa sull'associazione di stimoli incondizionati e condizionati, essendo le risposte controllate da stimoli antecedenti.
  • Condizionamento operante: gli stimoli conseguenti o rinforzanti provocano un certo comportamento. Skinner spiega che se il comportamento è seguito da un rinforzo positivo, aumenterebbe la probabilità che tale comportamento venga emesso in futuro. Al contrario, se una risposta non è seguita da un rinforzo o quel rinforzo è negativo, la probabilità di emettere detto comportamento in futuro sarà inferiore.

Concetti di base del condizionamento operante

appoggio

È responsabile dell'emissione di risposte, cioè della probabilità del loro verificarsi, se è maggiore o minore in futuro. È uno stimolo rinforzante e coerente, poiché si verifica una volta avvenuta la risposta.

È impossibile sapere se un rinforzatore determinato influenza il comportamento finché non viene presentato in modo contingente con una risposta e si verifica che il comportamento cambi in conseguenza del rinforzo.

Esistono due tipi di rinforzo: positivo e negativo. Entrambi hanno lo stesso scopo di aumentare la probabilità che la risposta venga emessa in situazioni future. Inoltre, per i rinforzi Skinner sono definiti mediante comportamenti osservabili e misurabili.

Rinforzo positivo

Il rinforzo positivo rafforza un comportamento fornendo una conseguenza che un individuo trova gratificante.

Rinforzo negativo

Anche la rimozione di un rinforzo sgradevole può rafforzare un comportamento. Questo è chiamato rinforzo negativo perché è l'eliminazione di uno stimolo avverso che è "gratificante" per l'animale o la persona. Il rinforzo negativo rinforza il comportamento perché arresta o elimina un'esperienza spiacevole.

Rinforzi primari

Sarebbero tutti quei rinforzi di base che non hanno bisogno di una storia di condizionamenti precedenti per funzionare come tali. Alcuni esempi sarebbero acqua, cibo e sesso.

Rinforzi secondari

I rinforzi secondari sarebbero basati su precedenti storie di condizionamento grazie all'associazione con stimoli incondizionati.Alcuni esempi sarebbero soldi e qualifiche.

Contingenza di tre termini

È il modello di base del condizionamento operante e consiste di tre componenti: lo stimolo discriminante, la risposta e lo stimolo rinforzante.

Uno stimolo discriminativo sarebbe quello che indicherà al soggetto che il rinforzo è disponibile, indicando che se esegue un determinato comportamento può ottenere detto rinforzo. Al contrario abbiamo lo stimolo delta o gli stimoli che indicano che il comportamento non porterà ad ottenere alcun tipo di rinforzo.

La risposta sarebbe il comportamento che il soggetto eseguirà, la cui esecuzione richiederà o meno di ottenere lo stimolo rinforzante.

Uno stimolo rinforzante, come detto sopra, è responsabile dell'emissione del comportamento poiché, grazie alla sua apparenza, la probabilità di emettere una risposta aumenterà o diminuirà in futuro.

Concetti per sapere sul condizionamento operante

punizione

La punizione è anche misurata dai suoi effetti sul comportamento del soggetto. D'altra parte, a differenza del rinforzo, ciò che si intende è la riduzione o la soppressione di un determinato comportamento.

Una punizione riduce la probabilità di emettere un comportamento in situazioni successive. Tuttavia, non elimina la risposta perché se la minaccia della punizione diminuisce, il comportamento potrebbe riapparire.

Nella punizione ci sono anche due diversi tipi o procedure, punizioni positive e punizioni negative.

Punizione positiva

Ciò comporta la presentazione di uno stimolo avversivo dopo l'esecuzione di un determinato comportamento. Viene dato in modo contingente alla risposta data dal soggetto.

Punizione negativa

Consiste nell'eliminazione di uno stimolo come conseguenza di un determinato comportamento, cioè consiste nel ritiro di uno stimolo positivo dopo l'esecuzione di un determinato comportamento.

estinzione

Nell'estinzione, una risposta viene interrotta perché il rinforzo non appare più. Questo processo si basa sul non riuscire a fornire il rinforzo corrispondente che si prevede di raggiungere e che ha causato il mantenimento di tale comportamento nel tempo.

Quando una risposta viene estinta, lo stimolo discriminante diventa uno stimolo dell'estinzione. Questo processo non deve essere confuso con l'oblio, che viene dato quando la forza di un comportamento diminuisce quando non è stata emessa in un periodo di tempo.

generalizzazione

Di fronte a una situazione specifica o uno stimolo, una risposta è condizionata, che può comparire prima di altri stimoli o situazioni simili.

discriminazione

Questo processo è l'opposto di quello della generalizzazione, risponde in modo diverso a seconda dello stimolo e del contesto.

Programmi di rinforzo

Skinner ha anche stabilito diversi programmi di rinforzo, tra cui programmi di rinforzo continuo e programmi di rinforzo intermittenti.

Programmi di rinforzo continuo

Si basano sul costante rafforzamento della risposta ogni volta che viene presentata, cioè, ogni volta che il soggetto esegue il comportamento desiderato, otterrà un rinforzo o uno stimolo positivo.

Programmi di rinforzo intermittenti

Al contrario, qui il soggetto non ottiene sempre il rinforzo quando esegue il comportamento desiderato. Questi sono definiti in base al numero di risposte date o all'intervallo di tempo tra le risposte, dando origine a diverse procedure.

Programmi a tasso fisso

In questi programmi, il rinforzo è fornito quando il soggetto genera risposte fisse e costanti. Ad esempio, in un programma di rapporto 10 la persona ottiene il rinforzo dopo aver fatto dieci risposte quando lo stimolo viene presentato.

Programmi a rapporto variabile

Questo è costruito come il precedente, ma in questo caso il numero di risposte che il soggetto deve dare per ottenere il rinforzo è variabile.

Il rinforzo continuerà a dipendere dal numero di risposte emesse dal soggetto ma con un motivo variabile, grazie al quale al soggetto viene impedito di prevedere quando il rinforzo sarà ottenuto.

Programmi a intervalli fissi

Nei programmi a intervalli, ottenere il rinforzo non dipende dal numero di risposte date dal soggetto, ma è determinato dal tempo trascorso. Di conseguenza, la prima risposta prodotta dopo aver superato un certo periodo di tempo viene rafforzata.

Nei programmi a intervalli fissi, il tempo tra il rinforzo e il rinforzo è sempre lo stesso.

Programmi a intervallo variabile

In questi programmi il rinforzo viene ottenuto dopo un po ', sebbene il tempo sia diverso per ogni rinforzo ricevuto.

Cambiamento comportamentale

Successive approssimazioni o forme

Lo stampaggio consiste nel cambiamento comportamentale attraverso lo stampaggio di comportamenti o il rinforzo differenziale di approcci successivi.

Seguono una serie di passaggi per definire un comportamento concreto. Innanzitutto, viene identificato il comportamento iniziale che si intende modellare per sapere quale si desidera raggiungere.

Quindi, i possibili rinforzi che verranno utilizzati sono delimitati e il processo è separato in fasi o fasi per arrivare al comportamento finale, rinforzando ogni passo o approccio successivo fino a raggiungere l'ultimo.

Con questa procedura dinamica, entrambi i comportamenti e le loro conseguenze vengono trasformati. In questo senso, gli approcci successivi verso un comportamento oggettivo sono rinforzati.

Tuttavia, ciò può essere effettuato, è necessario da un comportamento anteriore ed eseguire il soggetto, in modo da andare lentamente rafforzando il loro comportamento per raggiungere l'obiettivo.

concatenazione

Con lui un nuovo comportamento si forma dalla decomposizione in passi più semplici o sequenze, rafforzando ogni risposta data in ciascuna delle fasi, al fine di portare alla creazione di una risposta più complessa nel repertorio comportamentale del soggetto.

Essi possono formare lunghe catene di risposte utilizzando rinforzi condizionate, adottando un'unità funzionale e la cui struttura porta alla acquisizione e definizione di una particolare abilità.

riferimenti

  1. Condizionamento operativo Estratto da wikipedia.org
  2. Condizionamento operativo Estratto da e-torredebabel.com.
  3. Estratto da biblio3.url.
  4. Legge di effetto. Estratto da wikipedia.org.
  5. Estinzione. Estratto da wikipedio.org.
  6. Domjan, M. Principi di apprendimento e comportamento. Paraninfo. 5a edizione.