[go: up one dir, main page]

IA e informatica

ia 2026, IA e informatica

Bolla o non bolla?

Questa settimana ci sono stati alcuni segnali che potrebbero essere considerati preoccupanti da chi si occupa di finanza, almeno per quanto riguarda l’IA. (Io non ne capisco nulla, riferisco solo). Per prima cosa, pare che l’offerta pubblica per le azioni di OpenAI slitterà al 2027: secondo Gary Marcus è possibile che Altman si sia accorto che la sua speranza di valutare l’azienda mille miliardi di dollari è stata presa come uno scherzo, o più banalmente che stia aspettando di capire cosa succederà con SpaceX, che dopo il boom dell’IPO sta pian piano calando di valore. Anthropic al momento non è pervenuta. Sempre Marcus nota come i modelli cinesi stiano riducendo la distanza, e l’uscita di GLM 5.2 da parte di z.ai sia stata un duro colpo, soprattutto perché usare questi modelli costa di meno. (Ho provato la versione gratuita di GLM: l’output in italiano è molto da migliorare, leggi fa schifo, ma se gli si dice che si scrive in italiano ma si vuole la risposta in inglese i risultati sono indubbiamente buoni)

Ma mi sa che il problema vero sia un altro. Come scrive Alberto Romero, il fatto stesso che ChatGPT 5.6 sia al momento concesso solo a selezionate aziende – selezionate dal governo USA, ovvio – è un cambio di rotta a 180 gradi. Qualcuno è convinto, o è stato convinto, che i modelli di frontiera dei due grandi player americani sono così buoni da essere considerati un patrimonio nazionale da custodire gelosamente. Ma siamo poi così sicuri che sia davvero così? O forse è una mossa estrema per far durare ancora un po’ di più la bolla? Credo che entro l’inizio del 2027 avremo in un modo o nell’altro la risposta: per il momento non possiamo fare altro che aspettare.

ia 2026, IA e informatica

Quante ne sa Claude!

Martedì sera tardi, mentre ero già a letto, ho chiesto a Claude se sapeva come mai il mio smartwatch da poco funzionava bene per l’ECG – quando mi sono capitati casi di fibrillazione atriale li riconoscevo anch’io dal grafico – ma faceva schio per la pressione. Tra l’altro avevo anche scritto “smartphone” e non “smartwatch”. La risposta è stata chiarissima:

L’ECG legge un segnale elettrico diretto (la differenza di potenziale tra due elettrodi): è una misura oggettiva, poco interpretativa, per questo anche un sensore economico riesce a beccare la fibrillazione.

La pressione, invece, quasi nessun telefono/smartwatch la misura davvero. Quello che fanno è stimarla da un sensore ottico (PPG, lo stesso della frequenza cardiaca), guardando la forma e i tempi dell’onda di pulsazione, e da lì inferiscono sistolica/diastolica con un modello statistico. Per funzionare, questo modello va calibrato: di solito ti chiede una misura vera con bracciale all’inizio, e da quella estrapola tutto il resto.

Il problema è che:

    • l’algoritmo è ancorato a quella calibrazione, e tende a “tirare” le stime verso quel valore iniziale anche quando la pressione reale cambia, perché il segnale ottico ha poca sensibilità reale alle variazioni assolute di pressione (è più bravo a cogliere trend che valori assoluti)
  • piccoli fattori come posizione del dito, pressione di contatto, microvasocostrizione vengono spesso smussati dal firmware per evitare letture “ballerine” che farebbero sembrare il dispositivo poco affidabile — col risultato paradossale che sembra più stabile di quanto sia davvero la tua pressione.

Mercoledì mattina ho provato a fare una ricerca Google «perché uno smartwatch sbaglia i valori della pressione»: la maggior parte dei risultati non c’entrava molto, solo questo articolo parlava di PPG, ma probabilmente non l’avrei considerato perché parlava di Apple Watch e ipertensione che non sono il mio caso. Sempre martedì sera ho provato a chiedere perché sul mio tablet Doogee T20 usando Gboard avevo degli errori sul touch. Lì la risposta è stata più generica, ma comunque il primo suggerimento che ha dato – fare attenzione che Gboard ha un controllo separato del tocco rispetto a quello Android – mi è bastato per risolvere il problema. In questo caso la ricerca Google di controllo non mi ha dato nessun risultato.

Che morale trovo in tutto questo?  Che il modo di fare una ricerca è completamente cambiato. Io sono sempre stato della scuola “non sbrodolo: metto il minimo numero di parole chiave senza pensare a fare un discorso sensato”, ma con un chatbot devo fare un lavoro diverso e dargli tutto il contesto possibile. Poi dovrò comunque controllare le risposte, però è probabile che sia riuscito a trovare e assemblare informazioni che mi erano sfuggite, nonostante la mia abilità nel campo. Insomma, il mondo sta cambiando, e oggi dobbiamo imparare a spiegare al chatbot tutto, per permettergli di trovare le connessioni che potrebbero essere utili per avere una risposta.

ia 2026, IA e informatica

Perché Claude Fable 5 è stato bloccato?

Sono passati dieci giorni dal blocco di Claude Fable 5 per chi non si trova negli USA oppure non è cittadino americano, e tutto tace, almeno a livello ufficiale. Poi ci sono ovviamente tutte le voci di chi lavora nel campo: Gary Marcus dice che l’aveva previsto già due anni e mezzo fa, e che nessuno è ancora stato in grado di definire dei “guardrail”, dei limiti insomma, che funzionino davvero; i blocchi aggiunti a Mythos prima di lanciare Fable sono stati infatti aggirati, secondo un documento di Amazon. Ma soprattutto fa il complottista, ricordando che il presidente di OpenAI, Greg Brockman, è un grande finanziatore di Trump, e il fratello di Jared Kushner è un grande investitore in OpenAI, così come Amazon che ha dato il la alla procedura. Non sappiamo quali siano questi blocchi, ma immagino che ci siano davvero riusciti, anche perché il governo USA avrà provato a replicare l’attacco. Sullo Scientific American (qui la versione italiana su Le Scienze) si nota che pare che il problema sia legato alle falle di sicurezza che i grandi player come Mozilla o Cloudflare hanno trovato usando le  versioni di preview di Mythos, e quindi ci si trova in una situazione simile a quella degli anni ’90 con la crittografia… con due differenze: non è possibile stampare una maglietta con l’equivalente del codice RSA, e non è detto che fuori dagli USA non si riesca a ottenere gli stessi risultati. Alberto Romero sostiene che in realtà ad Anthropic va bene così, perché possono evitare di diventare anche pubblicamente il sistema più performante e soprattutto perché non avrebbero comunque avuto sufficiente capacità computazionale. Infine SE Gyges crede che Anthropic se la sia cercata, con tutti gli alti lai di Amodei sul proteggerci dalle IA… almeno finché erano le altre.

Che posso aggiungere io? Non molto, a dire il vero. È possibile che in realtà la vera parte di Mythos/Fable che preoccupa così tanto il governo USA sia appunto quella sulle vulnerabilità del codice, anche perché ho dei dubbi che la parte per così dire conversazionale sia così migliorata rispetto al passato. È però certo che non ci sono modi sicuri per evitare risultati di questo tipo, e quindi sarà solo questione di mesi, non di anni. Ho provato a chiedere a Claude di tirare fuori le stime al riguardo, e mi ha risposto «Lo Stanford AI Index 2026 parla di un gap sceso a circa 2,7 punti percentuali a marzo 2026 (da 17,5-31,6 punti nel 2023), e Demis Hassabis (DeepMind) a gennaio ha detto che i modelli cinesi di punta sono ormai “a pochi mesi” da quelli occidentali. Epoch AI è più conservativo (gap medio di 7 mesi, nessun modello cinese ha ancora superato il livello di o3 di OpenAI), e il CFR ha pubblicato un pezzo che ridimensiona l’allarme dopo DeepSeek V4, sostenendo che non è competitivo con la frontiera USA. » Inoltre un modello cinese «(GLM-5.1, 754 miliardi di parametri) è stato addestrato interamente su silicio Huawei Ascend — cioè aggirando anche i controlli sull’export dei chip NVIDIA, che sono un vincolo molto più “fisico” e difficile da eludere di un blocco su un login a una chat. » Siamo insomma davanti a un disperato tentativo di chiudere la stalla quando ci sono buoi, o almeno vitelli, ovunque? Aspettiamo qualche mese e vediamo.

 

ia 2026, IA e informatica

C’è un giudice a Monaco

Lo so, dovrei parlare del divieto di esportazione di Claude Fable (e non pensiamo nemmeno a Mythos…) per quelli che ufficialmente sono “motivi di sicurezza”, e magari tra qualche giorno lo farò. Ma credo che la notizia che un tribunale regionale di Monaco di Baviera abbia ritenuto Google responsabile per quanto scritto nei suoi famigerati AI Overview meriti un approfondimento.

Uno dei motivi per cui Internet è diventata così pervasiva è che sia gli USA che l’UE hanno legiferato affermando che gli Internet provider non erano responsabili dei contenuti che veicolavano su Internet (nemmeno per quanto riguarda il copyright…), essendo dei semplici trasportatori di dati. In pratica la Rete è stata equiparata a una rete telefonica: è vero che se qualcuno segnala un contenuto non ammesso il provider deve toglierlo, ma questa è appunto un’operazione che viene fatta a posteriori e non a priori. Google si è sempre appoggiato a un’estensione di questa legislazione per i risultati delle ricerche: la loro linea difensiva è qualcosa del tipo ”noi non guardiamo i risultati delle ricerche che facciamo: prendiamo e pubblichiamo un ritaglio delle pagine trovate, e se qualcuno si lamenta di uno specifico risultato lo togliamo illico et immediate”. Penso che sia chiaro a tutti che questa è una finzione: Google sceglie l’ordine dei risultati della ricerca, e può promuovere o nascondere quello che vuole. Ma quel che è troppo è troppo. Il testo generato da AI Overview è appunto generato, non copiato; e il prodotto è di Google, che quindi deve essere responsabile di quello che fornisce. Come scrive Andrea Monti,

questa sentenza fa giustizia — sperabilmente — di tutti i tentativi di romanticizzare l’intelligenza artificiale attribuendole “coscienza”, “sentimenti” e “vitalità”. Riecheggiando l’approccio statunitense, la corte afferma un principio pragmatico: l’IA è opera di qualcuno, e questo qualcuno paga i danni se l’opera non funziona come dovrebbe.

Notate che il punto non è “l’IA può sbagliare”: quello è sempre stato chiaro. Il punto è che non si può dire “l’errore è colpa dell’IA”, o meglio lo si può dire ma comunque ti devi assumere la responsabilità degli errori della “tua” IA. Nel caso di Google, che stava cercando in modo nemmeno tanto surrettizio di spostare il suo motore di ricerca verso la fornitura di risultati generati dall’IA, la sentenza è un colpo durissimo e posso immaginare la battaglia legale che ne seguirà; ma non è che Anthropic, OpenAI e compagnia bella siano messi così meglio. E non è nemmeno detto che la definizione della responsabilità del fornitore di contenuti IA rimanga limitata all’Unione Europea: questo potrebbe essere un campo in cui anche gli americani potrebbero accodarsi. Il blocco di Claude Fable per i non americani non è direttamente collegato a tutto questo, ma è comunque in un certo senso correlato: è l’azienda che deve verificare cosa offre.

ia 2026, IA e informatica

Ciò che conta è il loop

Alejandro Piad Morffis ha messo nero su bianco quello che stavo cercando di far quagliare da un pezzo nella mia mente: qual è il vero vantaggio che si può avere nell’uso dell’IA. Il punto è che al momento ci sono due narrazioni contrastanti: quella che afferma che ormai è l’IA a fare lo scienziato, e noi ci limitiamo a rimettere a posto quanto è stato da essa trovato, e quella che continua a parlare di pappagalli stocastici, che buttano fuori stringhe senza necessariamente senso lasciando all’autore l’ingrato compito di separare il grano del loglio. Piad Morffis, in modo quasi zen, afferma che entrambe le narrazioni sono sbagliate, perché rispondono alla domanda sbagliata, e cioè “l’IA fa scienza?”. Ciò che al momento sta facendo scienza è il loop: se volete dirlo in italiano, il processo iterativo (ma capite che se devo usare otto sillabe al posto di una lascio perdere). Insomma è l’interazione che produce scienza. Procedo con alcuni esempi.

Il primo esempio è quello dei cicli di Claude, con protagonisti Claude (appunto), Donald Knuth e Filip Stappers. Quest’ultimo ha usato Claude per esplorare una classe di oggetti combinatorici che Knuth stava studiando: uno dei risultati dei lanci gli è parso interessante e l’ha così passato a Knuth, che l’ha validato a mano. Quindi Stappers ha avuto l’idea e scremato l’output, Knuth è stato il verificatore, e Claude il proponente. La scelta del termine da parte di Piad Morffis è deliberata: Claude ha solo sfornato strutture (trentuno, per la cronaca). Il secondo esempio vede come protagonista Terence Tao, forse il più grande matematico vivente. Nel suo caso, gli LLM sono creativi ma inaffidabili e generano passi per le dimostrazioni; c’è poi un passo con Lean (un verificatore automatico) che è affidabile ma non creativo e butta via tutto quello che non funziona; infine Tao guarda i risultati sopravvissuti e decide quali può valer la pena di portare avanti. In questo caso cambiano le etichette, ma continuiamo ad avere un loop. Abbiamo poi AlphaFold, che genera possibili strutture 3-d di proteine. In questo caso l’IA è la proponente, il verificatore è la natura stessa, nel senso che si verifica sperimentalmente se la molecola generata si piega proprio in quel modo, e gli umani decidono se la struttura potrebbe avere un’utilità pratica. Infine c’è GNoME, che non è il desktop grafico Linux ma l’acronimo di Google DeepMind’s Graph Networks for Materials Exploration. Anche in questo caso GNoME ha proposto un enorme numero (380000) di possibili strutture cristalline. I ricercatori ne hanno selezionate 58 che hanno ritenuto essere interessanti e hanno provato ad assemblarle. Sono riusciti a ottenere 41 nuovi materiali.

La cosa più interessante è che anche in passato ci sono stati esempi simili di loop. Il più famoso è probabilmente la dimostrazione del teorema dei quattro colori da parte di Appel e Haken, che sono riusciti a dimostrare che bastava verificare la possibile colorazione per un numero finito anche se dell’ordine delle migliaia di configurazioni base e poi hanno lasciato al computer il compito di trovare la colorazione. Ma anche la dimostrazione della congettura di Keplero sull’impacchettamento ottimale per le sfere ha una storia simile: Thomas Hales ha trovato la dimostrazione nel 1998, ma ci sono voluti 16 anni perché un verificatore formale (Flyspeck) confermasse la sua correttezza. Con gli LLM sono cambiate due cose. La prima è l’equivalente del passaggio dai calcolatori analogici, che erano bravissimi a risolvere un problema specifico, a quelli digitali, che possono essere programmati per risolvere un problema generico – magari in modo meno ottimale, ma comunque con un risparmio netto rispetto al dover trovare la struttura analogica corretta. La seconda è che gli LLM non solo sono più generali ma sono anche in grado di ricevere istruzioni da sé stessi, aumentando quindi ancora di più la generalità. Ma ci sono cose che restano le stesse! Il verificatore (umano o macchina che sia) deve essere “stupido ma affidabile al 100%”, e quindi gli LLM lì sono fuorigioco; il curatore, colui che cioè decide se i risultati sono non solo corretti ma anche interessanti, continua a essere appannaggio degli umani; e così il problema di partenza è dato dagli umani. Il loop si è accelerato tantissimo, pensate solo ai sedici anni di Flyspeck contro i secondi impiegati da Lean, ma sempre loop è. Guardando la scienza da questo punto di vista possiamo insomma essere ottimisti: quello che facciamo è migliorato, ma non è davvero cambiato.

ia 2026, IA e informatica

Le IA riescono ad accorgersi dei testi scritti dalle IA?

Riprendendo il mio post di sabato, ho scoperto che non sono ovviamente l’unico a usare direttamente le IA (e non gli strumenti appositi) per verificare se un testo potrebbe essere stato scritto da un’IA. Adam Kucharski sul suo substack ha fatto un test, senza pretese di completezza. Ha fatto generare a ChatGPT dieci brevi testi e chiesto a Claude la probabilità che fossero appunto generati da un’IA. Per sicurezza ed evitare un problema statistico con una sessione particolare, l’ha chiesto cinque volte e poi ha preso il valore mediano. In tutti i casi la percentuale indicata era dell’85% o del 92%. (Interessante questa segmentazione, ma visti i miei esperimenti posso immaginare che i risultati effettivi fossero “80%-90%” e “90%-95%”.) Con dieci racconti suoi la probabilità variava tra il 12% e il 22%; infine, con i testi suoi dati in pasto a ChatGPT per “migliorarli” c’è stato un risultato diviso. In cinque casi la probabilità indicata da Claude non era cambiata, negli altri cinque era passata tra l’82% e il 92%.

Fin qui il suo esperimento. Casualmente io in una delle mie conversazioni maieutiche con Claude venerdì avevo chiesto qualcosa di simile:

Io non ho mai fatto corsi di scrittura, ma ho letto tanti libri e quindi assorbito le tecniche. Tu e gli altri LLM avete letto centinaia di migliaia di libri: come mai non date risposte con uno stile “umano”? L’attention non può gestire testi troppo lunghi e quindi non imparate quelle strutture? Ci sono scelte a priori per strutturare il vostro output?

La risposta di Claude è stata, come spesso capita, su più punti. Nega il problema sull’attention, avendo ormai un contesto molto lungo; scrive che il fatto che un LLM sia comunque costruito per predire il token successivo non permette di vedere la struttura complessiva di un testo, ma soprattutto il reinforcement learning da feedback umano premia la risposta alla domanda isolata, quindi le strutture che tutti noi abbiamo imparato ad associare a un chatbot come gli elenchi, i paragrafi brevi e le transizioni esplicite. Insomma, il mio stile personale me lo sono creato leggendo tanto e non dovendo dire a nessuno “questo capoverso è scritto bene, quest’altro no”. Il risultato potrebbe cambiare con un addestramento di tipo diverso? Claude non lo sa. (Sì, le mie preferenze rafforzano la possibilità che possa dire “non lo so”, altrimenti che maieutica sarebbe?)

Più che altro quello che sta succedendo è che la scrittura umana si sta standardizzando sempre di più, e questo non è affatto bello.

ia 2026, IA e informatica

Un effetto imprevisto dell’IA

Tabella sul progresso umano a goCome penso sappiate, l’intelligenza artificiale ha superato da molto tempo gli umani nel gioco del go. AlphaGo Zero (o se preferite il successore più generale AlphaZero) sono dal 2018 i campioni del mondo virtuali. Pare però che sia successo qualcosa di inaspettato. Come Mickey Friedman riporta in questo tweet, il livello di gioco umano era rimasto stagnante negli ultimi decenni ed è improvvisamente cresciuto da quando i programmi per giocare a go si sono evoluti. Il tutto è stato raccontato in questo preprint: le nuove strategie non seguono né le vecchie tecniche umane né le nuove algoritmiche ma sono sostanzialmente diverse. Questo significa che l’IA in questo caso ha spinto gli umani a cercare nuove vie, anziché ad omologarsi come si poteva pensare.
Diciamo le cose come stanno: immagino che il 99% della gente andrà verso l’omologazione, perché è la cosa più semplice. Però il risultato non è scontato a priori. Sta a noi capire se vogliamo avere un’élite di più-che-umani oppure trovare un modo per abbassare quel 99%; non arriveremo mai a zero, anche perché la percentuale era già molto alta prima dell’arrivo dell’IA, ma potremmo comunque limitare in parte i danni.

Aggiornamento: (13:00) aggiungo che comunque le IA migliori hanno tipo 1500 punti ELO in più del migliore umano.

ia 2026, IA e informatica, religione

Magnifica Humanitas e IA

vignetta di Natangelo
Natangelo sull’enciclica (ma avrebbe dovuto usare Claude)
Mi ci vorrà ancora un po’ di tempo per leggere e digerire la prima enciclica di Leone XIV. Sono ancora al capitolo uno; posso dire che il paragone introduttivo tra Babele e Neemia mi è piaciuto (e curiosamente nel culto luterano il giorno prima della pubblicazione era Pentecoste e hanno appunto usato Babele come lettura). È anche interessante notare che nella Dottrina sociale (tema dell’enciclica) la Chiesa non pretende di avere la verità. Se volete, è implicito nel fatto che non si sta parlando di un dogma, ma esplicitarlo fa sempre bene.

Quello di cui voglio parlare oggi riguarda come è stata scritta l’enciclica. La prima cosa è che non esiste (almeno per ora) una versione latina. La cosa è più importante di quanto sembri: non è chiaro quale sia la versione ufficiale da considerare (italiano? inglese?) in caso di differenza nella definizione di un concetto. Chissà quale è stata la versione di lavoro… Ma la seconda cosa è che c’è chi dice che l’enciclica contro l’abuso dell’intelligenza artificiale… è stata scritta usando l’IA. Potete vedere per esempio questo articolo del manifesto, che ovviamente ci sguazza: se preferite un’analisi più tecnica, c’è questo articolo di LessWrong. Ho letto quest’ultimo articolo e ho molti dubbi sull’approccio seguito. Già la logica “la versione italiana è quella di partenza perché il Vaticano sta in Italia” non ha nessun senso. Ormai la Curia è multinazionale: è probabile che sappiano tutti un po’ di italiano, ma non è affatto detto che l’italiano sia stata la lingua veicolare usata per la bozza. Ma poi diciamocelo: in Vaticano non sono degli imbecilli. Non mi stupirei che abbiano usato l’IA per scrivere una bozza, ma poi se la sono riguardata da cima a fondo per verificare che non fosse stato scritto qualcosa che non va. Né si capisce perché avrebbero dovuto usare l’IA per il documento ma non per tradurlo, cosa che avrei trovato più logica… Anche il punto sullo stile di scrittura diverso rispetto alle encicliche precedenti non ha un grande senso. È chiaro che Leone non ha scritto tutto lui, ma non ci credo nemmeno per un istante che non abbia riletto e corretto tutto, e chiaramente lo stile di scrittura di una persona per cui l’inglese è la lingua nativa è diverso da quella di un sudamericano, di un tedesco, di un polacco e più vicimno a quello di un LLM che è stato addestrato con materiale per la maggior parte in inglese.

Non mi stupirei né mi preoccuperei, invece, se le bellissime infografiche che sono state preparate dal Dicastero per il Servizio dello Sviluppo Umano Integrale fossero state generate con l’aiuto di uno strumento IA. Più che altro mi chiedo perché l’URL del dicastero (creato da Francesco dieci anni fa, ci credo che non l’avessi mai sentito nominare) ha il nome in inglese; ma questo con l’IA non c’entra nulla.

Aggiornamento: (16:20) se vi interessa un lungo soliloquio di un cattolico conservatore statunitense professore di computer science, potete leggerlo qui.

Torna in alto