Nell’ambito dell’AI, abbiamo quella che possiamo definire come una sottodisciplina che chiamiamo Machine Learning (ML), e che rappresenta una delle principali metodologie utilizzate per realizzare sistemi intelligenti.

L’ intelligenza Artificiale è una disciplina, come, ad esempio, la fisica o la storia, ed è un ramo dell’informatica. L’AI si occupa della creazione di agenti intelligenti, ovvero sistemi capaci di ragionare, imparare e agire autonomamente

Fondamentalmente, l’intelligenza artificiale riguarda la teoria e i metodi per costruire macchine che pensano e agiscono come gli esseri umani.

Il Machine Learning è un approccio specifico all’Intelligenza Artificiale che riguarda la creazione di modelli e algoritmi che consentono a una macchina di apprendere da dati senza essere esplicitamente programmata per eseguire una determinata attività.

Invece di istruzioni codificate manualmente, il modello di Machine Learning impara da esempi ed esperienze fornite attraverso un processo iterativo. In altri termini consiste in un programma o sistema che addestra un modello a partire dai dati in ingresso. Il modello così addestrato può effettuare previsioni utili a partire da dati nuovi, che tuttavia sono tratti dallo stesso insieme di dati utilizzato per addestrare il modello. Le Classi più comuni di modelli di machine learning sono i modelli di machine learning NON Supervisionato e Supervisionato.

La differenza chiave tra i due è che nei modelli supervisionati abbiamo l’uso delle etichette. I dati etichettati sono dati che vengono forniti con un tag come ad esempio un nome, un tipo o un numero. I dati non etichettati sono dati che non hanno alcun riferimento. Nell’apprendimento supervisionato, il modello impara da esempi passati per predire valori futuri.

Nell’apprendimento supervisionato, i valori dei dati di INGRESSO vengono inseriti nel modello. Il modello restituisce una previsione e confronta quella previsione con i dati di ADDESTRAMENTO utilizzati per addestrare il modello. Se i valori previsti dei dati ELABORATI e i valori effettivi dei dati di addestramento sono molto distanti, ciò si chiama ERRORE. Il modello cerca di ridurre questo errore fino a quando i valori ELABORATI e quelli effettivi (ADDESTRAMENTO) non sono più vicini.

Nell’ apprendimento non supervisionato il modello svolge una attività di analisi e verifica dei dati grezzi raggruppandoli in base a caratteristiche intrinseche al modello stesso senza operare alcun confronto.

Oltre ai due modelli descritti ne esiste un terzo detto apprendimento per rinforzo, in questo caso il modello impara interagendo con un ambiente dinamico e ricevendo riscontri sotto forma di ricompense o punizioni. L’obiettivo è far sì che il modello prenda decisioni ottimali per massimizzare le ricompense a lungo termine. Per meglio comprendere questo tipo di machine learning vediamo il seguente esempio:

Ecco un esempio semplice di apprendimento per rinforzo utilizzando un agente virtuale che deve imparare a spostarsi in un labirinto per raggiungere un punto di uscita:

  1. Ambiente: Immagina un labirinto bidimensionale con pareti e un punto di uscita.
  2. Agente: L’agente è rappresentato da un personaggio virtuale che si trova inizialmente in una posizione specifica all’interno del labirinto.
  3. Azioni: L’agente può compiere diverse azioni per spostarsi nel labirinto, ad esempio “andare avanti,” “andare a destra,” “andare a sinistra” e “tornare indietro.”
  4. Ricompense: Ad ogni passo dell’agente, l’ambiente assegna una ricompensa all’agente in base all’azione compiuta e alla sua posizione risultante. Ad esempio, se l’agente raggiunge il punto di uscita, può ricevere una ricompensa positiva, ma se urta contro un muro, può ricevere una ricompensa negativa.
  5. Obiettivo: L’obiettivo dell’agente è imparare una strategia o politica di azione che gli consenta di massimizzare le ricompense cumulative nel lungo termine.
  6. Apprendimento: L’agente inizia con una politica casuale di azione e inizia ad esplorare il labirinto. Durante l’esplorazione, raccoglie dati sull’ambiente e le ricompense associate a diverse azioni. Utilizzando questi dati, l’agente adatta gradualmente la sua politica di azione per selezionare azioni migliori che portano a ricompense maggiori.
  7. Iterazioni: L’agente continua a iterare, esplorando e aggiornando la sua politica di azione fino a quando non sviluppa una strategia efficace per navigare nel labirinto e raggiungere il punto di uscita con la massima ricompensa possibile.

Questo processo di apprendimento per rinforzo simula l’apprendimento umano attraverso il feedback di ricompensa. L’agente impara a prendere decisioni migliori sulla base delle ricompense ricevute nell’ambiente, cercando di massimizzare la ricompensa cumulativa nel corso del tempo.

Concludendo, rispetto alle specifiche funzioni dei vari tipi di Machine Learning che abbiamo analizzato, vediamo la immagine seguente che mostra le principali attività che una ML può svolgere rispetto alla sua natura.