May 2, 2009

Probabilità negative?

Filed under: fisica fiscale

Riprendo una tematica affrontata qui prendendo spunto dallo stesso input:

La Meccanica Quantistica è quello a cui si arriva inevitabilmente se si parte dalla teoria della probabilità e si prova poi a generalizzarla in maniera che i numeri che usualmente chiamiamo "probabilità" possano essere negativi. In questi termini, la teoria avrebbe potuto essere inventata dai matematici nel XIX secolo senza alcun input sperimentale. Non è stato così, ma avrebbe potuto essere.

[Scott Aaronson]

Aaronson nella sua Lecture 9 parla di probabilità negative riferendosi alla funzione d’onda, che assume valori complessi sulla circonferenza unitaria (e non solo reali negativi), interpretandola alla stregua di distribuzione di probabilità, con la sola differenza che si applica la norma quadra e non la somma.

E’ opinabile, e opinerò, il fatto che le funzioni d’onda possano essere interpretate come distribuzioni di probabilità. Ma le probabilità negative entrano in quantistica anche da un’altra porta, e questa volta l’analogia con la teoria della probabilità classica è molto più forte.

La funzione di Wigner

Uno stato quantistico è rappresentato in maniera astratta da un ket e la sua proiezione sulle autofunzioni di un operatore (per esempio la posizione X o il momento P) fornisce la funzione d’onda in rappresentazione x o p:

 

 

Le due rappresentazioni sono legate dalla trasformata di Fourier

 

I moduli quadro delle funzioni d’onda forniscono le distribuzioni di probabilità della variabile aleatoria. Wigner si pose la domanda se esistesse una funzione delle due variabili, definita quindi nello spazio delle fasi (x,p), le cui distribuzioni marginali ottenute integrando rispetto a x o a p fossero proprio le densità di probabilità. Questo avrebbe fornito un parallelo con la teoria classica nello spazio delle fasi, in cui data la distribuzione iniziale f(q,p) di posizioni e impulsi l’evoluzione è ottenuta tramite applicazione del flusso hamiltoniano (unitario). Notare che date due variabili aleatorie correlate non è garantito che esista una distribuzione di probabilità congiunta.

Si dimostra facilmente che la funzione

 

è tale che le sue proiezioni nei sottospazi x e p sono proprio le densità marginali:

 

 

Succede anche un’altra cosa meravigliosa. Con un po’ di lavoro potete ottenere un’equazione di evoluzione per f^W del tutto analoga all’equazione di Liouville, a meno di termini di ordine accatagliato^2:

C’è solo un problema: la funzione di Wigner può diventare negativa e quindi non può essere interpretata propriamente come distribuzione di probabilità congiunta. Le aree dello spazio delle fasi in cui effettivamente questa diventa negativa sono grandi solo pochi accatagliati, e corrispondono alle zone dello spazio delle fasi dove p e x interferiscono. D’altra parte, mentre la correlazione è un fenomeno trasversale, che esiste sia in fisica classica che quantistica, l’inferferenza (contenuta nei termini non-diagonali della matrice di densità) è intrinsecamente quantistica. Facendo un coarse graining si può ottenere una distribuzione di probabilità semiclassica.

Note

i) Non sono d’accordo con Aaronson col chiamare densità di probabilità la funzione d’onda, perchè per sistemi finiti una densità di probabilità dovrebbe avere significato intuitivo di probabilità di singolo evento.

ii) Non mi sembra che il passaggio dalla teoria delle probabilità alla meccanica quantistica sia quello più intuitivo, stando all’articolo di Hardy che Aaronson cita. Hardy mostra che la MQ discende dagli assiomi classici di teoria delle probabilità più un altro assioma che la differenzia. Non parla affatto di probabilità negative con norma quadrata.

iii) Se c’era un modo per arrivare alla quantistica per mera intuizione matematica, ce l’aveva in mano Hamilton che secondo leggenda in alcuni suoi appunti avrebbe annotato tabelle del tipo

ottica geometrica             |   ottica ondulatoria

meccanica hamiltoniana   |       ???

(i punti di domanda sono miei). L’analogia tra le tre branche indicate è evidente quando si va a scrivere l’equazione di Hamilton-Jacobi della meccanica classica e ci si rende conto che essa descrive la propagazione di onde di informazione nello spazio delle fasi.

iv)  In ogni caso, sarebbe stato impossibile scoprire la quantistica se non ci fosse stata una motivazione fisica, come era stato incapace Minkowsky di interpretare la propria geometria in senso fisico e di scoprire il principio di relatività. Nel XX secolo vedo la teoria delle stringhe come un tentativo estremo di capire cose che ancora non esistono, nè sperimentalmente nè da un punto di vista di pulizia intellettuale. Con i risultati che ne conseguono.

v) La funzione di Wigner non è una distribuzione di probabilità, e quindi non c’è da scandalizzarsi se risulta negativa. Non è affatto detto che due variabili aleatorie correlate abbiano una densità di probabilità analitica.

vi) Il fatto che la funzione di Wigner obbedisca all’equazione classica di Liouville a meno di termini di ordine 2 in accatagliato mi ricorda dell’equazione di Hamilton-Jacobi quantistica, che contiene un potenziale quantistico di ordine accatagliate, e l’equazione di Schwinger in teoria dei campi. In tutti questi casi si tent di ricongiursi alla teoria classica e ci si arriva quasi, a meno di termini correttivi quantistici. Nel caso della funzione di Hamilton-Jacobi esiste una trattazione soddisfacente della procedura di quantizzazione a partire dall’analogo classico. Chissà che procedure simili non esistano anche negli altri due casi.

vii) Leggendo l’articolo di Hardy mi sono accorto che l’assioma in più, che rende quantistica le cose, è un assioma che richiede l’esistenza di trasformazioni tra stati quantistici. D’altra parte l’approccio tramite equazione di HJ presume l’esistenza di una trasformazione tra stati quantistici, intesi come traiettorie in uno spazio delle fasi. Le analogie però finiscono qua. Il primo approccio è probabilistico, il secondo analitico. Nel primo si considerano solo sistemi discreti (di spin), nel secondo la trattazione è continua. per cui non ci sono ovvie connessioni. Forse la trasformata di Wigner potrebbe fornire l’anello mancante.

13 Comments »

  1. Non mi e’ chiaro come, date due variabili aleatorie correlate, possa succedere che non esista una distribuzione di probabilità congiunta.

    Se posso assegnare un valore alla probabilita’ che accada X e anche P, ho con cio’ stesso definito la probabilita’ di X e P, che e’ la definizione di probabilita’ congiunta. In QM la probabilita’ congiunta di (x,p) non esiste perche’ se misuro X cambio stato (collasso della psi) e non posso piu’ misurare P (e viceversa).

    Insomma: la tua affermazione sulla non garanzia di esistenza della probabilita’ congiunta e’ solo dovuta all’esempio della funzione di Wigner o c’e’ un caso piu’ semplice che mi sfugge e che non coinvolge le “stranezze” della MQ?

    Comment by hronir — May 3, 2009 @ 8:45 pm

  2. La domanda è interessante, e non mi è chiara la risposta. Sicuramente l’esempio della MQ è sufficente per fare una simile affermazione. In sostanza quello che ci dice è che due variabili aleatorie possono interferire in maniera tale che la loro congiunzione NON sia una variabile aleatoria.

    Il problema della Meccanica Quantistica è che mischia due livelli semantici: quello della misura e quello dello stato del sistema.

    Mi viene in mente questo esempio allora (non so se è correttoal 100%). Considera una variabile aleatoria X che assume valore 0 o 1 concordemente con il valore di un’altra variabile aleatoria A in un certo universo che viene posta alla sua destra, ed una variabile aleatoria Y che assume valore 0 o 1 discordemente dalla variabile A che viene piazzata alla sua sinistra. Entrambe hanno una probabilità condizionata ad altre variabili aleatorie. Le probabilità condizionali sono:

    P(X=0|A=0) = 1 = P(X=1|A=1)

    P(X=0|A=1) = 0 = P(X=1|A=0)

    e le probabilità congiunte:

    P(X,A) = 0, X non = A

    P(X,A) = P(A), X = A

    Quindi si ottiene la legge marginale:

    P(X) = P(A)

    Per esempio puoi porre P(A) = 50%. Poniamo che X faccia parte dell’universo di Y e viceversa.

    Domanda: qual è la probabilità che

    (X,Y) = (0,0),(1,0),(0,1),(1,1)

    Ognuna di queste ha probabilità nulla, per cui non esiste una probabilità congiunta.

    L’esempio che ho provato a fare non si discosta molto dalla situazione fisica che avviene in quantistica. Quindi non sono molto d’accordo con questa tua affermazione:


    Se posso assegnare un valore alla probabilita’ che accada X e anche P, ho con cio’ stesso definito la probabilita’ di X e P, che e’ la definizione di probabilita’ congiunta.

    Il problema è che le nostre variabili aleatorie in verità non sono (q;p), ma sono (q,t+;p,t-;q,t-;p,t+), posizione e impulso appena prima e appena dopo un processo di misura. Le funzioni d’onda non contengono questa informazione e neanche la funzione di Wigner. Nota che la funzione di Wigner non si presta a fornire la probabilità di X data una certa misura di P, ma soltanto la probabilità di X, senza P.

    Comment by Administrator — May 3, 2009 @ 10:37 pm

  3. Non ho capito l’esempio.
    Credo ci sia un typo nelle probabilita’ condizionali: se ho capito cosa intendi, la seconda riga dovrebbe essere:

    P(X=0|A=1) = 0 = P(X=1|A=0)

    Ma il punto in cui mi perdo (e che mi fa dubitare della mia comprensione di quel che lo precede) e’ quando dici: Poniamo che X faccia parte dell’universo di Y e viceversa e in particolare non capisco (quindi) perche’ le quattro probabilita’ per (X,Y) sarebbero tutte nulle. A parte il fatto che se fossero nulle sarebbero comunque una probabilita’ (zero ed uno sono inclusi, nello spettro di possibili valori di probabilita’), direi cmq che (X,Y) puo’ benissimo assumere valori (0,1) e (1,0) se, ad esempio, A vale rispettivamente 0 o 1 (A ed X sono correlati positivamente, no?).

    Quanto a Il problema della Meccanica Quantistica è che mischia due livelli semantici: quello della misura e quello dello stato del sistema., non posso che essere d’accordo.

    Comment by hronir — May 4, 2009 @ 12:04 am

  4. Guarda bene la def. di X e Y: la prima assume con certezza il valore della v.a. con cui viene congiunta, e la seconda invece il valore opposto. Finché le congiungo con delle variabili A indipendenti innocenti, che hanno legge marginale 50%, (X,A) e (A,Y) sono ben definite. Ma se le congiungo tra loro ottengo tutte probabilità nulle, perché una vuole essere concorde e l’altra discorde. Zero è un valore possibile di probabilità, il problema è che non è che P non è normalizzata! Cioè non vale

    P[X=(0,1),Y=(0,1)] = 1

    che è un fatto necessario per una probabilità.
    Credo che l’esempio sia buono, anche se probabilmente queste patologie si possono evitare a livello assiomatico. Il problema qui è che la definizione “esistenziale” di X e di Y coinvolge il “discorso intorno a X e Y”.

    Comment by Administrator — May 4, 2009 @ 6:04 am

  5. Ah, forse ho capito: stai prendendo per variabile A su cui si basano le definizioni di X ed Y la X stessa (o la Y stessa)!
    Ma “non vale”!

    Comment by hronir — May 4, 2009 @ 9:10 am

  6. Chi me lo proibisce? In verità si, sto barando, ma è anche quello che fa la quantistica. Francamente brancolo un po’ nel buio, ma la cosa si fà interessante. In teoria della probabilità si postula una misura di probabilità semipositiva definita su tutti i misurabili in un certo spazio di eventi e si misura quelli. Per cui patologie come queste non possono succedere per definizione.

    Il problema qui è che la definizione della probabilità dipende dalla probabilità stessa… quindi ci si mangia la coda. In pratica il mio esempio cerca di costruire un evento misurabile che non sia misurabile.

    Quasi quasi la prenderei come definizione di “interferenza” invece che di “dipendenza”. Due v.a. sono dipedenti se l’eventualità dell’una perturba l’eventualità dell’altra: la misura di probabilità è la stessa, cambia l’insieme target misurabile. Due v.a. fanno interferenza se l’eventualità dell’una modifica la misura di probabilità dell’altra. Che ne dici?

    Comment by Administrator — May 4, 2009 @ 9:35 am

  7. Mi sono fatto un po’ di conti per tentare di capire di cosa state parlando; vedete un po’ qua questo esempio:

    - supponiamo di avere due variabili casuali binarie X e Y, dipendenti o meno; quanti gradi di libertà hanno?

    - ci sono quattro variabili da sistemare, le probabilità a,b,c,d di (0,0),(0,1),(1,0) e (1,1); adesso, la condizione che abbiamo una distribuzione congunta ci da’ a+b+c+d=1;

    - se diamo le probabilità marginali, allora avremo altre due condizioni, e quindi avremo un grado di libertà avanzato

    - possiamo uilizzare questo grado di libertà per prescrivere il valore EXY, in maniera da controllare le correlazioni

    - il problema è che per certi valori di EXY, le soluzioni ricercate potrebbero dare probabilità negative, e quindi non tutte le correlazioni sono realizzabili

    È questo il problema di cui parlate quando dite che tutte le probabilità marginali sono realizzabili?

    Comment by Stefano — May 4, 2009 @ 10:30 am

  8. Il fatto e’ che queste due variabili non sono solo “correlate”, nel senso che dici tu per cui si impone un certo valore di E(XY) - E(X)E(Y) diverso da 0. Questa e’ una cosa che rientra pienamente nella teoria della probabilita’ ordinaria e mi stupirei molto di vedere un caso in cui saltano fuori cose strane come probabilita’ negative (a meno che uno non ponga fin da principio cose turche del tipo E(XY) > 1). Avresti qualche esempio?

    Qui il problema e’ che queste due variabili non sono solo correlate, ma la definizione dell’una e la sua misura di probabilita’ dipende dall’altra. Fuori dai limiti della teoria delle probabilita’.

    Il problema delle probabilita’ negative e’ che si cerca di scrivere una distribuzione per una variabile aleatoria che non esiste, cioe’ la variabile aleatoria “X e P”. Ci si arriva vicino nel senso che si ottiene una cosa le cui marginali sono corrette, ma ha alcune pecche in quanto puo’ andare negativa; ed in ogni caso non puo’ essere utilizzata per stimare probabilita’ congiunte (infatti si usa esclusivamente per caratterizzare l’evoluzione unitaria della funzione d’onda, non il processo di misura).

    Non credo che sia lo stesso problema. Qui non stiamo “correlando'’ le variabili nel senso di imporre una certa

    Comment by Administrator — May 4, 2009 @ 1:40 pm

  9. In realtà ci sono un sacco di esempi (simili a quello di cui sopra) in cui il fatto di voler avere probabilità positive impone delle restrizioni piuttosto forti alle correlazioni che puoi avere in una famiglia di variabili casuali.

    Uno (scelto a caso, solo perchè lo cito a lezione domani e qunidi ce l’ho in mente adesso) è “Generation of synthetic spike trains with defined pairwise
    correlations”, Niebur, Neur. Comp. 1996

    Ripeto, non so se è quello di cui state parlando. Stavo solo tentando di tradurre il tutto in una lingua a me più familiare. Poi magari la traduzione è sbagliata :-)

    Comment by Stefano — May 4, 2009 @ 2:33 pm

  10. Che ne dici?

    Che mi sembra si stia giocando un po’ troppo con le parole.

    Non vedo differenza apprezzabile fra le tue definizioni di dipendenza e inetrferenza: dov’è la “misura di probabilità” che verrebbe modificata? E come potrebbe essere, una modifica nella “misura di probabilità” diversa da una modifica nella probabilità?

    Secondo me vale la cosa delle misure di p e q “un istante e immediatamente dopo”, ovvero che non è definibile la probabilità congiunta semplicemente perchè non ci sarebbe modo di verificarla sperimentalmente (non puoi fare una misura simultanea) e le correlazioni “q un istante prima e p un istante dopo” non sollevano alcun problema nemmeno in QM.

    Del resto, lo dici tu stesso quando affermi: Il problema delle probabilita’ negative e’ che si cerca di scrivere una distribuzione per una variabile aleatoria che non esiste, cioe’ la variabile aleatoria “X e P”.

    Quanto alla tua definizione di (X,Y) passando da (X,A) e (A,Y) e cortocircuitando su A, mi sembra semplicemente un modo di far entrare in scena una contraddizione e spacciarla per spiegazione.
    :)
    Senza offesa, eh, è una cosa che hanno fatto in tanti: non solo gentaglia come Hegel, ma anche gente apparentemente rispettabile come Bohr.

    Comment by hronir — May 4, 2009 @ 3:37 pm

  11. stefano,

    questa è una cosa che ignoravo, molto interessante (anche se non credo che guarderò l’articolo; ce l’hai un esempio esplicito?). Però credo che non sia lì l’origine dei problemi in quantistica.

    hronir,

    la cosa strana è che la funzione d’onda in visuale x e p fornisce una misura di probabilità che non ha nozione del tempo in cui viene effettuata la misura (se si è in un autostato dell’hamiltoniana). Per cui è veramente curioso che queste due variabili siano correlate in maniera tale che non abbia senso parlare di “X e P” se non inserendo una nozione di prima e dopo. L’esempio che facevo è ricalcato dal caso quantistico ed in effetti è furbetto. Te ne propongo un altro meno ad hoc in un nuovo post.

    Comment by Administrator — May 4, 2009 @ 9:11 pm

  12. Stefano, forse dico una cavolata, ma i vincoli sulle correlazioni di cui parli non sono analoghi ai vincoli di Bell (le sue famose disuguaglianze) che vengono violati in meccanica quantistica?

    Comment by hronir — May 5, 2009 @ 5:43 am

  13. Administrator, questo tuo commento sembra troncato… magari c’era qualcosa di interessante :)

    Comment by hronir — May 5, 2009 @ 5:45 am



Lascia un commento



Anti-spam measure: please retype the above text into the box provided.



Get free blog up and running in minutes with Blogsome
Theme designed by Helga Cleve and widely (wildly)
rearranged by matteoeo (sorry helga!)