October 6, 2009

Newton e il principio di equivalenza

Filed under: fisica fiscale

Domani dovrò dare una lezione elementare di Meccanica Razionale (un nome che mi fà tremare al solo pensiero…). I ricordi ritornano alle lezioni ricevute da ottimi ma inflessibili matematici. Devo introdurre il ritratto in fase, e parlare del pendolo. Mi viene in mente un semplice fatto: quando si traccia il grafico di un’energia potenziale V(q), il primo pensiero corre ad una palla senza attrito che rotola giù per pendii

 

A priori non è affatto ovvio che la dinamica del punto materiale dettata dal potenziale sia la stessa di una pallina posta sullo stesso profilo e soggetta senza attriti a gravitazione uniforme. Ispezioniamo le espressioni per le energie. L’energia totale del punto materiale in un potenziale è

 

mentre quella gravitazionale

 

Notate che ho distinto tra massa inerziale e massa gravitazionale.  Ora l’equazione di Newton fornisce

 

I due scenari sono equivalenti SSE massa inerziale e massa gravitazionale coincidono (a meno di una costante di proporzionalità universale g). Quindi la visualizzazione di un potenziale qualsiasi come di una collina altro non è che il principio di equivalenza di Einstein, che permette di confondere un’accelerazione con l’effetto gravitazionale di un potenziale uniforme. D’altra parte, l’equazione di Newton

 

non è una legge, ma una definizione. Guardatela bene. Sappiamo cos’è un’accelerazione, perché la misuriamo in termini di spazio e tempo (e, se vogliamo spingerci all’estremo, il tempo lo misuriamo in termini di posizioni relative di sistemi fisici). Ma possiamo sapere cos’è una forza se non l’effetto che procura su un oggetto? Si, possiamo! Basta confrontare le forze meccaniche che esercitiamo con una forza data, universale: la forza peso. Capite dove voglio arrivare: la definizione di Newton stabilisce che massa inerziale e gravitazionale si equivalgono, mentre la legge di Newton stabilisce la linearità tra forza peso e accelerazione. Portata alle sue estreme conseguenze, l’equazione di Newton già contiene il principio di equivalenza einsteniano. Mancava solo un po’ di geometria.

October 4, 2009

directed spin networks and spin

Filed under: fisica fiscale

Before plunging into the group representation mess, I wanted to make up my mind about why "spin networks" are called "spin" networks. The conclusion I came to is quite different from those I’ve (rather superficially) taken a look at, but it is well suited for NESM (Non-Equilibrium Statistical Mechanics) since it deals with oriented graphs and with bits of information spreading through a thermodynamical system (i.e., a system where information diffuses).

Oriented spin networks

Spin networks (SN) are in the first place graphs (lines connecing dots in space) with an integral weight attached to each edge, which bears a microscopic interpretation in terms of collections of strands (think of a rope made up of several filaments):

 

 The black transversal box is the permutator, meaning that each straight edge is actually identified with the ensemble of strands in all their possible permutations, e.g.

 

SNs, when closed (no strands ending up in the middle of nowhere), can be algebraically manipulated so to yeald a number. Open SNs can be identified with tensors, permutators with determinants etc. At the moment I have no idea what the physical meaning of that number is and how it relates to other numbers in graph theory, such as cofactors of the laplacian matrix and so on (I have a vague hypothesis that such evaluations could find a place in NESM when restricting variational principles to given domains in the space of systems which share similar response properties (= which have similar inertias to external stimuli). Sort of "universality class index"… could be, but could very well not…). Let’s skip that.

I would rather deal with oriented graphs. So let’s put an arrow on each strand:

Now the permutator can only be taken among strands with the same orientation. We have also assigned an arbitrary orientation to the edges of the graph. We now have two quantum numbers for each edge: the total number of strands 2j (factor 2 not casual) and the difference 2m between forward and backward strands in the direction of the orientation of the corresponding edge; each time the direction of a strand is reversed there is an even jump in 2m: m ranges in -j/2,-j/2+1…j/2. So it is not hard to see that j and m behave respectively as the label of the SU(2) representation and as the eigenvalue of the third component of the angular momentum (that along which measurement is carried on).

So we can define angular momentum eigenvectors |j,m> this way:

Directed or signed SNs?

Before moving on, a note on directedness. Surfing the SN literature I can find mention of directed spin networks, but in a very different taste (and in fact, I can’t find oriented strands anywhere). Since when evaluating a SN one antisymmetrizes permutations according to their parity, as Rovelli and Smolin put it in Spin Networks and Quantum Gravity (here)

It follows that the (trivalent) states that we have obtained by antisymmetrizing the ropes are fully determined solely by their support, the order of each rope and an overall sign. Equivalently, they are determined by a trivalent graph (the support), with integers assigned to each link (the order of the rope), plus an orientation of the graph.

So, I gather that SNs are signed graphs (graphs with a + or - sign on each edge) and not oriented ones. The difference is subtle: while signedness is absolute, orientation is relative to a given one; and for a trivalent graph there is no such preferred orientation. Note that signed graphs have properties which oriented graphs do not. For example, they have a Tutte polynomial and planar graphs have a dual knot (medial construction, see here).
(more…)

September 26, 2009

(s)trands in spin networks

Filed under: fisica fiscale

[I’m switching to english for scientific posting]

So, I am trying to make my way through spin network theory. Spin networks were presumably discovered by Roger Penrose and more recently implemented by Rovelli and Smolin to describe the discretized nature of space-time in Loop Quantum Gravity. How they actually arise from a quantum theory of General Relativity remains utterly mysterious to me, but still one can learn the rules and play the game, since it is widely advertized that spin networks arise in many areas of physics, and I soon hope to take a glance into such fascinating areas such as… such as… Well, in particular I am interested in looking at relationships with diffusion theory on graphs.

A good point to start is Seth A. Major’s A Spin Network Primer (here). Unfortunately, this is far from being a self-contained introduction to the topic and more depressingly it is not "background independent" of the background training of the reader, which had better be from the area. To a poor simple Markov guy like me, it leaves many open questions, most prominently: Why?

I am looking for a physical intuition of what’s going on. I know I can’t argue axioms, as John Baez would say. But still, there is something disturbing in all that. It is like being a classical piano player at a jazz jam-session: everybody is improvising tetrahedra with virtuosistic Redemeister moves while you are staring at those 3j- and 15j-symbols on a sheet someone handled to you, calling it a "standard", but yet there is nothing standard for you in there: too much information and history and practice into a too compressed alphabet.

Here a first physical shot: one is working with undirected weighted graphs, with positive integer weights. Such a weight can be thought to be a collection of strands which make up the rope, and some minor god decided that solitary strands cannot end in the middle of nowhere. So at each crossing one must have an even number of strands going in, and will get a continuity equation. This is pretty much what happens in diffusion theory on graphs, where one has one conservation law at each node (with real weights, though!), and I guess that one could implement orientation so to give this analogy more appeal. Microscopically speaking, this is a theory of knots. Macroscopically, it is a theory of graphs. Now, here come the bad news: those weights are interpreted as labelling representation of the SU(2) Lie group. My main concern is to try to give this fact a physical interpretation purely in terms of diffusion of some form of "structured" information.

September 18, 2009

loops all around

Filed under: fisica fiscale

Sono sostanzialmente abusivo ad una conferenza di Quantum Gravity a Corfu’. Mi muovo in motorino, dormo in tenda, ma una notte che pioveva un professore ha avuto la gentilezza di ospitarmi in camera in un lussuoso hotel dove vado a scroccare colazioni, cene, e anche i bagni in piscina. L’episodio mi ha fatto un certo effetto perche’ fino ad oggi il signore in questione per me era solo il nome di un parametro.

La conferenza e’ totalmente al di sopra delle mie capacita’, e’ estremamente interessante e anche un po’ avvilente, soprattutto pensare di dover tornare ai propri discreti conticini discreti. Il motivo per cui sono qui e’ piu’ o meno lo stesso per cui potete trovare un elefante in Groenlandia o una bibicletta sulla luna. A tutti vado raccontando che mi occupo dell’altisonante Meccanica Statistica di Non-Equilibrio, e che ci sono interessanti connessioni con la Loop Quantum Gravity. Sgranano gli occhi ed esigono spiegazioni. In effetti qualcosa c’e', ma e’ ancora tutto nella mia testa; cerco di raccontare nella maniera piu’ dimessa possibile, romanzando. Quando loro mi parlano di propagatori gravitonici, constraint hamiltoniani e geometrie non-commutative annuisco laconicamente.

La cosa piu’ affascinante e’ l’estrema liberta’ di pensiero di questa comunita’, che e’ giovane e molto poco gerarchica: i dottorandi hanno sempre voce in capitolo, anche autorevole a volte. Certe pedanterie e pesantezze di comunita’ scientifiche piu’ tradizionali qui completamente scompaiono. C’e’ un interesse continuo in quello che tutti dicono, perfino un estraneo come me.

Da segnalare alcune battute di John Baez, il migliore didatta che io abbia mai visto:

[…] technique used by physicists. And note that I didn’t say "in physics", but "by physicists"

A form is integral if its integral is integral

[…] this useful sign [the "proportional" sign] that we use when we don’t want to do the calculations 

Ho scoperto che la misura di Eratostene del raggio della terra, basata sull’osservazione delle ombre etc. era stata fatta anche in Cina approssimativamente nello stesso tempo. La loro conclusione pero’ era stata che, essendo la terra piatta, il sole si trovava ad una certa distanza dal sole, ed hanno calcolato l’altezza del sole. Si e’ scatenata una discussione sul fatto che si possa dire che avessero torto, e secondo quali criteri.

Torno a casa dalla conferenza con due blocchi di appunti e referenze da riordinare, capire, approfondire. Spero presto di poterne fare un sunto. Tra le cose che potrebbero avere una qualche parentela con quello di cui mi occupo c’e':

- un’affascinante metodologia di rinormalizzazione di teorie di campo basata sugli spanning trees dei grafici di Feynman. In particolare la funzione generatrice dei grafici connessi si scrive come somma sugli alberi ricoprenti, proprio come lo stato stazionario di una diffusione su grafo.

- un uso maniacale dei grafi duali, quelli che invertono circuiti con vertici per intendersi, in particolare per passare dai complessi simpliciali (triangolazioni di varieta’ multidimensionali) agli spin-foam e spin-networks.

- l’uso di funzionali generatori (e.g. il modello Ponzano-Regge) sugli spin-networks e le forti analogie con le proprieta’ di cancellazione/contrazione dei grafi; la mia speranza e’ che da queste analogie e con un po’ di teoria di nodi possa venir fuori una nozione di SU(2)-diffusione, cioe’ di diffusione su un network di un’informazione che per qualche assurdo motivo si porta appresso una qualche rappresentazione del gruppo SU(2).

- un’analisi categorica (nel senso di category theory) dell’estensione del trasporto parallelo di punti al trasporto parallelo di oggetti estesi.

E questo e’ quantum.

September 1, 2009

nota a margine

Filed under: fisica fiscale

J.R. Goldman L.H. Kaufmann: Knots, Tangles, and Electrical Networks

[…] Series, parallel, and star triangle methods from electrical networks yield techniques for computing conductance, as well as giving the first natural interpretation of the graphical (i.e, graph theoretical, NdR) Reidemeister moves.

August 29, 2009

Nodi e circuiti elettrici

Filed under: fisica fiscale

[mi sono impegnato per renderlo digeribile a tutti, per cui non accetto scuse]

Nodi e numeretti magici

Prendete una corda, attorcigliatela e annodatela a piacere, saldate le due estremità. Appoggiandola su un piano otterrete una figura del tipo

fig.1: l’immagine di un nodo (dove il tratto si interrompe, la corda passa sotto) 

Ora riprendete la corda in mano e senza aprirne le estremità attorcigliatela ancora un po’. Rimettendola sul piano l’immagine ottenuta sarà molto diversa, magari più complicata, con più incroci e annodamenti; o magari può essersi "sciolto". Però il nodo è sostanzialmente quello di prima, visto che non avete aperto la corda. Come fare a decidere se diverse immagini sul piano corrispondono allo stesso nodo?

Non tutti i nodi sono uguali. Per esempio considerate il nodo semplice, il primo che fate quando volete allacciarvi le scarpe, o meglio, considerate la cordina allacciata dei pantaloncini, ma senza pantaloncini. Saldate nuovamente le due estremità: ottenete un nodo che per quanto lo rigiriate non diventerà mai un semplice "anello": da qualche parte qualche incrocio riaffiorerà sempre. Adesso immaginate di completare l’allacciatura, ottenendo il nodo con i due "fiocchetti", e saldate la corda. Esperienza insenga che tirando uno dei lembi di corda entranti nel nodo, questo si scioglie restituendovi il caro vecchio nodo semplice. Cioè, considerando come il nodo "spezzetta" lo spazio, cioè in senso "topologico", il nodo con i fiocchetti è lo stesso del nodo semplice, e i due sono riconducibili l’uno nell’altro con un semplice movimento che non richiede di aprire la corda.

La mossa che avete fatto si chiama la II mossa di Redemeister. Le mosse di Redemeister sono tre movimenti estremamente semplici che consentono di modificare l’immagine sul piano di un nodo senza spezzare la corda. Due immagini corrispondono allo stesso nodo se si possono trasformare l’una nell’altro solo tramite mosse di Redemeister. Un nodo è irriducibile se non è possibile fare mosse di Redemeister. Per esempio, il nodo semplice è irriducibile.

Ecco le mosse di Redemeister. Piuttosto ovvie.

 

fig.2: le tre mosse di Redemeister (da completare con le simmetriche)

Una domanda che sorge spontanea ad un matematico che studia nodi e links (= nodi tra più corde chiuse, concatenate) è: posso associare all’immagine sul piano di un link dei numeretti (detti invarianti) che non cambiano quando faccio le mosse di Redemeister? Questo sarebbe importantissimo, perché allora sapremmo che due immagini con diversi invarianti non possono essere ricondotte l’una nell’altra. Non avremmo bisogno di perdere la testa con le mosse di Redemeister: basta calcolare i numeretti, e se non sono uguali possiamo mettercela in tasca.

La risposta a questa domanda è si! Un famoso invariante è il polinomio di Jones, che si ottiene come caso particolare da un altro importante polinomio, detto le parentesi di Kaufmann. Anche se a diversi invarianti corrispondono diversi nodi, non è detto però che diversi nodi abbiano diversi invarianti. Per questo bisogna inventarsi altri invarianti dei nodi, sempre più "personalizzati". Tutta una classe di invarianti è stata individuata da Witten tramite applicazione della teoria di Chern-Simons quantistica… ma questa è un’altra storia. Qui (per ora) non siamo molto interessati a questi numeretti magici.

Grafi e nodi

Un grafo (planare) è una cosa sostanzialmente diversa da un link (leggete pure nodo se "link" non vi piace). In pratica un grafo planare è una collezioni di punti su un piano  (meglio detti vertici) e linee tra punti (meglio dette rami), che non si intersecano se non in un punto. I grafi trovano applicazioni in molte branche della fisica; per esempio, se ad ogni ramo viene associata una resistenza, applicando voltaggi ai nodi si ottengono correnti elettriche stazionarie che si bilanciano ad ogni vertice (legge di Kirkhoff). La teoria dei grafi permette di risolvere il sistema elettrico. Un’altra applicazione è lo studio delle diffusioni su network: immaginate un ubriaco che cammina per una città piuttosto intricata, prendendo vie a caso. Poniamoci la domanda: "che probabilità c’è che arrivi in un certo punto della città, partendo da un certo altro punto? ". Questo è l’oggetto della teoria delle diffusioni. Più interessante ancora diventa il problema se ad ogni via, e ad ogni direzione di una via, corrisponde una probabilità diversa di percorrenza (mettete che una sia in discesa, che una sia stretta e angusta, che in una le auto siano parcheggiate sul marciapiede… tutto questo influisce sulle scelte dell’ubriaco).

 

fig.3: un grafo (ATTENZIONE: non è planare, anche se non sembra) e un grafo orientato.

Per modellizzare tutto ciò, quindi, nei casi più semplici ci può bastare la struttura del grafo, mentre a volte dovremo considerare grafi pesati, con numeri associati ad ogni ramo, grafi orientati, con orientazioni assegnate per ogni ramo, grafi con pesi diversi nelle diverse orientazioni. In questo post però parlerò solo di grafi segnati, ossia i cui rami possono portare un valore +1 o -1. In futuro parlerò anche degli altri (ah, queste promesse…).

Anche se grafi planari e immagini dei nodi vivono nel piano, non è affatto ovvio che ci sia una relazione tra i due. Per esempio: gli incroci di un nodo coinvolgono sempre quattro lembi di corda, mentre da un vertice di un grafo possono uscire quanti rami desideriate. Eppure esiste un modo di associare un unico link ad un grafo planare segnato, detto il grafo mediale del link, e viceversa.

La costruzione non è semplicissima, e un esempio è più chiaro di mille parole:

fig.4: trasformazione di un grafo in un nodo e di un nodo in un grafo

La prima riga in fig.4 mostra la trasformazione di un grafo planare nell’immagine di un nodo: ad ogni ramo corrisponde un incrocio; uscendo da un incrocio la corda supera il primo vertice che incontra e si riallaccia al primo lembo di corda ad un incrocio disponibile. La costruzione è del tutto rigorosa, e si può trovare in Bollobas, Modern Graph Theory, e nel magnifico articolo di Kaufmann A Tutte Polynomial for Signed Graphs (Per i Matematici: lo scopo di Kaufmann in particolare è quello di estendere la definizione del polinomio di Tutte, che contiene l’informazione topologica sul grafo ed è ben definito per grafi non orientati, pesati o no, a grafi segnati; e lo fà tramite una meravigliosa corrispondenza tra il polinomio di Tutte e le parentesi di Kaufmann.)

Esiste anche una trasformazione inversa (seconda riga in figura). Si colora di nero alternatamente le aree dell’immagine del nodo in maniera tale che lo sfondo sia bianco e che due aree confinanti abbiano colori diversi, e ad ognuna di  quelle nere si associa un vertice del grafo; aree che spartiscono un incrocio sono collegate da un ramo. Il fatto che esista una trasformazione inversa implica che c’è una corrispodenza uno-a-uno tra la categoria dei grafi planari e la categoria delle immagini dei nodi.

Ma come introdurre anche l’informazione su quale corda passa sopra e quale passa sotto ad un incrocio? Per questo abbiamo bisogno di grafi segnati: siccome ad un ramo corrisponde un incrocio, e l’incrocio può esistere in due stati (corda passa sopra/corda passa sotto), bisogna introdurre un doppio stato anche per il ramo; per questo introduciamo il segno + o -. Come si fà ad assegnare univocamente un segno ad un tipo di incrocio?

 

fig.5: orientazioni di un incrocio.

Sovrapponete l’incrocio al ramo (tratteggiato). Ruotate la corda che passa sopra in senso antiorario; se l’area spazzata comprende il ramo (primo caso in fig.5), allora associate un segno +; altrimenti un segno -. E viceversa.

Ora abbiamo un modo per associare biunivocamente l’immagine di un nodo ad un grafo segnato. Ecco un paio di semplici esempi:

 

fig.6: corrispondenza tra due grafi segnati e due immagini di nodi

(more…)

August 25, 2009

Julian Barbour - 1

Filed under: fisica fiscale

Qualche nota personale su The Deep and Suggestive Principles of Leibnizian Philosophy, scaricabile qui. Nessuna pretesa di completezza.

. . .

- Prima di affrontare le proposte più radicali di Julian Barbour, in particolare l’inesistenza del tempo, e il suo entusiasmo per le idee di Deutsch sull’interpretazione manyworlds della meccanica quantistica, bisogna parlare un po’ di, come dire, relativismo, o meglio "relazionalismo". Una delle fonti di maggiore difficoltà nella quantizzazione della Relatività, o in ogni caso nella trattazione quantistica dell’interazione gravitazionale, è che mentre la Relatività Generale di Einstein è una teoria in cui spazio e tempo sono concetti relativi, la cui forma e dinamica è generata dalla presenza di materia e quindi dalle relazioni tra i corpi, Meccanica Quantistica e Teoria dei Campi Quantistici sono definite su uno spazio-tempo assoluto, newtoniano, un palcoscenico fisso su cui i corpi si muovono.

- Il "relazionalismo" è un’attitudine che accomuna vari sforzi di quantizzare la gravità, quelli della piccola (ma in crescita) comunità scientifica che gravita attorno a Lee Smolin, al Perimeter Institute, a Carlo Rovelli e vari altri tra fisici e matematici. L’idea è che questa caratteristica fondamentale della RG debba essere presente, in qualche forma, tra i requisiti fondamentali di una teoria unificata, e non derivata come proprietà emergente, o addirittura nel limite semiclassico, come nell’ide(ologi)a della M-theory (che su questo fronte ha registrato un fallimento). E’ stato fatto qualche tentativo di riformulare in senso relazionale teorie più semplici, a partire dalla meccanica classica fino alla MQ di due particelle, ed anche la RG stessa. Il lavoro di ricerca di Barbour fondamentalmente si innesta tra questi tentativi di vedere teorie esistenti sotto una nuova luce, spesso tramite modelli (molto) semplificati.

- Questi sforzi sono accomunati da un tentativo di chiarezza formale, di pulizia mentale (ecco ad esempio la categorizzazione della fisica da parte di John Baez) e d’altra parte da una profonda ricerca filosofica (ad esempio, il libro di Rovelli su Anassimandro). Anche la Teoria delle Stringhe ha portato ad una produzione filosofica, di segno decisamente diverso; in particolare al principio antropico debole e forte, con degenerazioni di stampo teologico. Ovviamente i compartimenti non sono stagni: alcune osservazioni di Barbour hanno un sapore vagamente "antropico"; per esempio quando invoca un principio di massima varietà, ma vedremo in sequito.

- In questo articolo Barbour abbraccia la filosofia di Leibniz delle monadi per analizzare questa nuova "corrente" in fisica teorica e addirittura per modellizzarla, forse in maniera troppo letterale. Ovviamente contrapponendolo alla sua nemesi, Newton, fautore di uno spazio assoluto in cui i corpi sono collocati. Leibniz è un filosofo alla moda ultimamente: ne è un grosso supporter, per motivi non molto diversi, il matematico Chaitin, e inoltre…

- I pilastri della metodologia di Leibniz sono due: il principio di identità degli indiscernibili, e quello di ragione insufficiente. La Meccanica Statistica (che non è una teoria fisica, ma una gnoseologia) poggia precisamente sulla traduzione di questi principi nell’equiprobabilità a priori e nel principio di massima entropia. Non voglio dilungarmi sui principi fondamentali della Meccanica Statistica, ma soltanto evidenziare che essa descrive (al pari della teoria della misura in MQ) non già la realtà, ma la sua percezione. Probabilità, entropia ed informazione sono concetti estrinseci, non intrinseci; per cui queste teorie sono già, in un certo senso, relazionali, in quanto descrivono come sistemi aperti si "misurano" tra di loro.

- In un certo senso sia la Meccanica Quantistica che la Relatività Generale contengono a livello fondamentale una "teoria della misura". Se in MQ è ben noto, forse risulta meno apparente in RG; ma tutti ricordiamo che la Relatività Generale è una teoria fatta di orologi, righelli, e di osservatori in sistemi di riferimento diversi che si trasmettono segnali; la velocità della luce è "la velocità dell’informazione". Sono convinto che questo sia un fatto non di poco conto; la necessità di uno scambio di informazione, e quindi di un’interazione, tra sistemi di riferimento diversi in RG porta un’indeterminazione: emerge il problema dell’impossibilità di un sistema isolato…

- Quindi l’idea di riscrivere tutta la fisica in senso relazionale. Qui si potrebbe aprire una discussione infinita su sistemi aperti e isolati e scambio di informazione, che non tenterò (ancora) ma che ha molta molta rilevanza quando si vuole parlare di tempo (v. sotto). Notare tuttavia che non potendo essere alcun sistema perfettamente isolato, tranne (forse) l’Universo stesso:

Leibinz argued that, once one starts on the true identification of an actual thing, one must always end by giving a description of the universe. His bold conclusion was that, in reality, actual things are simply descriptions of the universe from different perspectives like all the different views of a city.

Credo che questa sia un concetto meraviglioso. Volendo tradurre in senso informazionale (cioè in soldoni, per come l’ho capita io), se un "oggetto" è definito dalle relazioni con il resto dell’Universo, non potendo essere isolato esso contiene tutta l’informazione dell’Universo; quindi ogni oggetto può essere identificato con un encoding del tutto. Il tutto e la parte nella filosofia di Leibniz coincidono.

- Forse sto deragliando, e vorrei ricondurre questi concetti a qualcosa di più "fisico". Il fatto che in RG nessun sistema sia isolato deriva dal fatto che l’interazione gravitazionale non sia schermabile. Lo spazio, la posizione di un oggetto, dipende da questa interazione gravitazionale. Se in un dato sistema di riferimento la posizione di un corpo è un numero reale, l’infinita informazione contenuta nelle sue cifre decimali (come argomentava Leibniz stesso) contiene l’informazione su tutti i corpi che ne stanno influenzando lo spazio, ossia tutto l’Universo! Fila come discorso?

- Nella sua Nobel lecture Richard Feynmann ha insinuato l’idea (di Wheeler) che esista un solo elettrone, che si manifesta simultaneamente in più parti dell’Universo, ove stimolato o, aggiungo io, misurato. In un certo senso questo concetto è già presente in QFT, in cui i campi permeano l’Universo. Credo che questa idea vada a braccetto con l’idea di un concetto di spazio e tempo puramente relazionale.

- Il "campo" assomiglia in un certo senso alla monade di Leibniz; monadi esistono in quanto si rispecchiano l’una nell’altra, e sono distinguibili solo dalle relazioni che hanno con altre monadi. Devo dire che la cosa mi risulta comunque un po’ sciamaniaca, e preferisco sorvolare.

[continua…]

July 13, 2009

teoria dei grafi e olonomie /I

Filed under: fisica fiscale

E’ da un po’ di tempo che sto ragionando intorno ad un possibile legame tra due oggetti molto distanti, ma in un certo senso analoghi in quanto "circuitanti".

Da un lato abbiamo le forze termodimaniche che mantengono un sistema lontano dall’equilibrio, in stati stazionari in cui fluiscono correnti, ed entropia è scambiata costantemente con l’ambiente. Forze e correnti costituiscono gli osservabili macroscopici fondamentali della meccanica statistica di non-equilibrio, e nella rappresentazione dei processi di Markov su grafo hanno una elegante interpretazione in termini dei cicli (o circuiti) del grafo.

Dall’altro abbiamo i Wilson loops delle teorie di gauge, o per meglio dire le olonomie di una connessione in geometria Riemanniana. Detto in parole povere, se camminate in circolo su una superficie curva in una maniera "naturale", cioè dettata da una particolare regola che vi dice come avviene il trasporto parallelo (una connessione), quando sarete al punto di partenza vi potreste trovare orientati in una direzione diversa da quella di partenza. L’olonomia vi dice, per ogni circuito, di quanto vi siete girati.

Il motivo per cui è ragionevole pensare che ci sia un simile collegamento è dovuto al fatto che le correnti (microscopiche) stazionarie obbediscono ad una legge locale di conservazione:

Quest’equazione ha due possibili classi di soluzioni. Se allo stato stazionario le correnti si annullano si parla di stato d’equilibrio, in cui vale il bilancio dettagliato. In questo caso tutto è fermo. L’altra possibilità è che la corrente sia (in tre dimensioni) il rotore di un potenziale vettore

e quindi che vi siano delle correnti non-nulle che circolano attraverso il sistema e che si bilanciano perfettamente in ogni punto dello spazio. Si intuisce che queste correnti devono fluire in circuiti per non disperdersi all’infinito. Il potenziale vettore è determinato a meno del gradiente di un campo scalare

E’ questa l’invarianza di gauge della teoria che ci fà pensare ad una corrispondenza tra gli osservabili della meccanica statistica di non-equilibro e le olonomie della connessione, alias il potenziale vettore. Notare che il gruppo di gauge sarebbe, molto banalmente, U(1), e come in elettromagnetismo classico esiste una corrente di Noether e quindi una carica conservata: in questo caso si tratta della probabilità totale, ovverosia l’"informazione", normalizzata ad 1.

Diffusione su grafo

L’equazione da cui partiamo è un’equazione di continuità ai nodi di un grafo G=(V,E), una collezione di nodi (vertices) e di rami (edges) tra nodi:

che afferma che la variazione della probabilità di trovarsi in un sito j del grafo dipende dalla somma delle correnti uscenti da quel sito, correnti che sono antisimmetriche per inversione dei nodi (sono forme antisimmetriche). Le correnti hanno una dipendenza funzionale dalla probabilità che non ha veramente importanza per quanto segue, ma che generalmente assume questa forma:

ove \Delta è la matrice laplaciana di un grafo orientato e con pesi lungo i rami, e come accennato qui generalizza ad un’operatore di Laplace-Beltrami nel passaggio ad una varietà. Noi saremo interessati soltanto alle proprietà "topologiche" del grafo, e quindi non abbiamo bisogno di considerare la specifica forma che la laplaciana assume ed i pesi lungo i rami.

Teoria dei grafi

Come trasportare la nozione di invarianza di gauge alla teoria dei grafi, ed in particolare all’applicazione di quest’ultima alla teoria delle maglie di Kirkhoff? Una delle matrici fondamentali, che contengono l’informazione "topologica" di un grafo orientato (ove l’orientazione assegnata ai rami è arbitraria e irrilevante), è la matrice di incidenza che per ogni ramo e, e ogni nodo i ci dice se il ramo parte o arriva al nodo, oppure se non lo tocca:

La matrice di incidenza è un operatore lineare dallo spazio R^E delle combinazioni lineari di rami del grafo, allo spazio R^V delle combinazioni lineari di nodi. Per questa ragione è utile trasferire tutta l’informazione contenuta nella matrice antisimmetrica delle correnti in un vettore in R^E:

La definizione è più involuta di quanto serva: j è semplicemente il vettore delle correnti lungo i rami. In termini di questo vettore l’equazione di continuità nello stato stazionario, detta legge di Kirkhoff, si scrive semplicemente:

La matrice di incidenza svolge quindi il ruolo del gradiente nel continuo. Le proprietà della matrice di incidenza sono ben note: il suo kernel è rappresentato dai circuiti di un grafo, mentre l’immagine della sua trasposta (le righe della matrice) sono una base per lo spazio dei cocicli, secondo le definizioni date l’altra volta. Cicli e cocicli formano spazi ortogonali, e la legge di Kirkhoff afferma che la corrente stazionaria è combinazione lineare di una base di circuiti fondamentali del grafo:

C’è un modo canonico per individuare questa base, ma ne discuterò in futuro (queste promesse sempre disattese…).

La matrice co-laplaciana

Definiamo ora una nuova matrice prendendo il prodotto matriciale della matrice di incidenza e della sua trasposta, in questo ordine:

C è un endomorfismo nello spazio vettoriale delle combinazioni lineari di rami del grafo. Di questo operatore ho cercato di congetturare proprietà dello spettro e degli autovalori, prima di rendermi conto che lo spettro coincide (a meno della moltiplicità dell’autovalore 0) con quello del suo duale, il "laplaciano topologico"*

un oggetto ben conosciuto. Inoltre, A’ = C- 2I rappresenta la matrice di adiacenza del line graph di G, ossia del grafo che si ottiene invertendo rami e vertici adiacenti con vertici e rami (ma C non è la matrice laplaciana del line graph, quindi la trasformazione non è involutiva).  Le entries di C sono date da

Lo spettro risulta essere particolarmente semplice per grafi completi di grado k, che hanno autovalore 0 in corrispondenza dei cicli e autovalore (k+1) in corrispondenza dei cocicli. In questo caso gli operatori

sono proiettori rispettivamente nello spazio dei cocicli e nello spazio dei cicli. Diversamente, se il grafo è meno regolare lo spettro si arricchisce di autovalori positivi in maniera poco prevedibile. Ciò che importa è che se \lambda_i, i = 1,…,V-1, sono gli autovalori nonnulli di C (il perché, per un grafo connesso, siano V-1 è sempre rimandato al famoso seguito…) si ha

ove abbiamo implicitamente definito l’operatore "perpendicolare" a C (da non confondere con un proiettore ortogonale). Torniamo alla nostra equazione di continuità, che riscriviamo nella forma

 
senza perdita di informazione.** La corrente j è un autovettore dell’operatore perpendicolare:
 
 
Quindi mentre C non è un proiettore (perché distorce i cocicli), C perpendicolare, opportunamente normalizzato, sì. Siccome cicli e cocicli formano una base completa per ogni combinazione lineare di vertici di un grafo, la corrente può essere scritta come la proiezione sullo spazio dei circuiti di un opportuno potenziale vettore
 
 
Il potenziale vettore, o connessione, f è determinato a meno di una trasformazione di gauge

Possiamo finalmente calcolare la circuitazione di f lungo un qualsiasi circuito fondamentale del grafo:

ove (,) è il prodotto scalare euclideo. Questa è la famosa olonomia della connessione lungo un circuito. Se ora facciamo una trasformazione di gauge, essendo i circuiti annichiliti da C, si vede subito che le olonomie sono invarianti, come ci si aspetta. Inoltre, ogni osservabile gauge-invariante (e.g. la corrente) si può scrivere come combinazione lineare di olonomie.

- - -

Nella prossima puntata (se ci sarà):

- a cosa servono le olonomie in meccanica statistica di non-equilibrio

- che cosa vuol dire gauge-fixing

- quali paralleli può offrire questo quadro

(alla prossima…)

* Il problema di caratterizzare gli autovettori in termini di combinazioni lineari di cocicli, e gli autovalori interi in termini di proprietà combinatorie dei degree dei vertici rimane, e la visualizzazione grafica offerta da C potrebbe aiutare a capire meglio lo spettro di L.

** L’operatore C rappresenta quindi una sorta di grad div, che si annulla per tutte le div j =0, a meno di una costante. Una domanda interessante è chiedersi quale sia lo spettro di grad div, quali i suoi autovettori e se questi possano ammettere un’interpretazione analoga a quella in teoria dei grafi come combinazioni lineari di "cocicli".

July 5, 2009

complemento

Filed under: fisica fiscale

Se siete riusciti a leggere tutto il post sulla matrice dei circuiti di un grafo, meritate i miei complimenti, ed un complemento. Voglio mostrarvi come sia possibile ricavare gli autovettori della matrice di flusso per sola via grafica, almeno nel caso semplice di un grafo completo.

Innanzitutto, devo migliorare la qualità delle congetture. Facevo una inutile distinzione tra la matrice di flusso e la matrice D^TD, che differiscono di un multiplo dell’unità. Pertanto d’ora in poi mi riferirò a quest’ultima come alla matrice di flusso. Mi piace la teoria dei grafi perché è una scienza induttiva, e non deduttiva; perché è combinatoria, e perché è tuttosommato semplice. Lavorando ad alcuni esempi sono arrivato alla conclusioone che questa matrice abbia come autovalore 0, in corrisponenza dei circuiti, con relativo autospazio di dimensione E - V +1, ove E è il numero di rami e V quello di vertici. Possiede inoltre l’autovalore V, ed il relativo autospazio (V-1)-dimensionale è ortogonale a quello dei circuiti.

Prendiamo in considerazione il grafo completo con 6 vertici e con 6!/(2!4!) = 15 rami (che non è planare), cui assegnamo un’orientazione arbitraria:

 

Quindi scegliamo un albero ricoprente, per esempio

 

Aggiungendo uno dei rami rimanenti (detto "corda") e "defogliando" dai rami inutili si individua una base di circuiti fondamentali:

 

Questi (opportunamente orientati) costituiscono gli autovettori relativi all’autovalore 0 della matrice di flusso. I restanti V-1 autovettori si possono ottenere a partire dallo stesso albero. Si sceglie un ramo e si eliminano tutti gli altri: a questo si associa una doppia freccia, che individua uno stato di partenza ed uno di arrivo. Si costruiscono poi tutti i percorsi di due rami che collegano lo stato di partenza e quello di arrivo.

 

Questi sottografi (chiamiamoli, con poca fantasia, "flussi") costituiscono autovettori della matrice di flusso, relativamente all’autovalore che conta il numero di percorsi dallo stato iniziale a quello finale, che in un grafo completo è pari al numero di vertici V. I grafi che si ottengono con questa prescrizione sono una base per tutti i grafi analoghi, a partire da un qualsiasi albero. La regola di composizione è molto semplice: se F_1 ha il ramo ij marcato dalla doppia freccia, e F_2 ha il ramo jk marcato dalla doppia freccia, allora la loro somma F_1 + F_2 ha il ramo ik marcato da doppia freccia. Interessante poi constatare (per via algebrica) che questi autospazio è ortogonale all’autospazio dei circuiti.

(Update) Uno spazio vettoriale ortogonale allo spazio dei cicli è lo spazio dei cocicli (un risultato dovuto a Gallai), insiemi minimali di vertici che disconnettono il grafo. Una base di cocicli si può generare prendendo il complemento dell’albero generatore dei circuiti (co-tree), aggiungendo ad esso i rami rimanenti (detti twigs) ed eliminando i rami che non contribuiscono a disconnettere il grafo. L’orientazione dei rami del cociclo si impone orientando i rami da uno dei due domini sconnessi all’altro. I cocicli NON sono autovettori della matrice di flusso, ma ovviamente ogni vettore di flusso si può scrivere come combinazione dei cocicli in maniera molto semplice. Se F_1 è il flusso da i in j, si nota subito che F_1 è la somma dei due cocicli che separano i dal resto del grafo, con orientazione uscente, e di quello che separa j dal resto del grafo, con orientazione entrante:

 

Tutta questa regolarità è dovuta all’ipotesi che il grafo sia completo. E’ interessante chiedersi cosa possa succedere se il grafo non è completo (ma comunque ridotto). In questo caso la matrice di flusso può avere diversi autovalori positivi (in base al numero di percorsi di due rami che collegano i due vertici estremali), con relativi autospazi.

Ancora una volta, vale la pena enfatizzare che tutto ciò non è dimostrato, ma solo congetturato, nell’attesa che si manifesti quell’ovvio riferimento bibliografico che, ad opera di indistinguibili ignoti cinesi o di illustri scienziati russi che negli anni ‘60 nascondevano le proprie scoperte in assurde riviste sovietiche, tratta tutto ciò e molto di più con il dovuto rigore.

July 3, 2009

una matrice per i circuiti di un grafo

Filed under: fisica fiscale

I circuiti di un grafo orientato rivestono un ruolo fondamentale in meccanica statistica di non-equilibrio, ove i rami dei grafi rappresentano le possibili transizioni tra stati, ed in termini di circuiti e alberi massimali si costruiscono le grandezze termodinamiche macrocopiche, come le correnti stazionarie e le forzanti esterne.

Per questo ero in cerca, tra libri e semplici calcoli, di qualche interessante relazione algebrica per caratterizzare i circuiti.

La matrice di incidenza e la laplaciana

Come noto, in teoria dei grafi sono definite molte utili matrici. Forse la più fondamentale è la matrice di incidenza, che per ogni ramo (edge) e ed ogni vertice i associa un +1 se il ramo entra nel vertice, -1 se ne esce e 0 se non lo tocca*:

Se |E| è il numero di rami e |V| il numero dei vertici, la matrice di incidenza è una matrice |E|X|V|. Se se ne prende il prodotto matriciale per la matrice trasposta si ottiene la matrice |V|X|V| detta laplaciana (di cui lap(l)aciano è sicuramente un cultore):

ove d_j è il grado del sito, pari al numero di rami che vi afferiscono. Ma non è di questa che voglio parlare.

La matrice di "confluenza"

Molto più interessante per i miei scopi è la matrice |E|X|E| che si ottiene prendendo il prodotto inverso

che ha 2 sulla diagonale, +1 se i due rami confluiscono o provengono dallo stesso vertice e -1 se fluiscono attraverso i. Per questo battezzo la parte non diagonale di DD^T la matrice di "confluenza" F non avendone trovato menzione in letteratura (e lancio l’appello…). Quesa matrice si può intendere come un endomorfismo lineare in uno spazio vettoriale. Ogni sottografo o grafo che si possa ottenere considerando anche più ripetizioni dello stesso ramo orientato si può rappresentare come un vettore sul gruppo dei numeri interi. Esempi espliciti sono riportati più sotto.

Disclaimer: Tutte le affermazioni da qua in poi sono congetturali: nessuna dimostrazione, probabili toppe e pezze a venire.

L’operatore F sembra avere interessanti proprietà.

1) Dato un grafo non orientato G, si ha una rappresentazione della matrice di confluenza G per ogni possibile orientazione arbitraria dei rami del grafo. Congetturiamo (e dev’essere molto semplice dimostrare) che le congetture che seguono siano indipendenti dall’orientazione scelta.

2) F è invertibile (e quindi è un automorfismo) se (non saprei il "solo se") il grafo è privo di foglie ed è ridotto, ovverosia sono eliminati tutti i vertici cui confluiscono solo uno o due rami. In sostanza, partendo da un grafo qualsiasi facciamo la seguente "ristrutturazione":

 

fig. 1

Questo non deve risultare scandaloso, ha senso fisico: nello stato stazionario tra una foglia e il resto del sistema vige una condizione di bilancio dettagliato, che è locale. Rimuovere la foglia non modifica la termodinamica del resto del grafo. Sempre nello stato stazionario, la riduzione di due spigoli consiste nel sommare le relative "differenze di potenziale", mentre la corrente che fluisce, e per la quale vigono leggi di conservazione ad ogni vertice, è la stessa: ancora la termodinamica del resto del grafo rimane invariata. Per cui considero solo questo tipo di grafi.

3) Le proprietà interessanti di F riguardano i circuiti. E’ abbastanza semplice convincersi che D^TD = 2I + F si annulla in corrispondenza di tutti i (quasi)circuiti orientati, come questo:

 

fig. 2

Questi notoriamente formano un sottospazio lineare chiuso nello spazio dei sottografi, in quanto combinazioni lineari di circuiti orientati sono ancora circuiti orientati. Infatti sono tutti autovalori relativi all’autovalore -2 dell’operatore F. Per esempio il grafo in figura è scomponibile in 4 circuiti fondamentali (essendo planare, si può scegliere come base i circuiti che tagliano porzioni finite di piano). In verità questa non è una proprietà di F, ma della matrice di incidenza D stessa.

4) Più interessante è cercare di capire che cosa combina F su un qualsiasi grafo, andando alla ricerca degli autovettori rimanenti. Per questo ho soltanto l’analisi spiccia di un paio di esempi. Considero il grafo planare (ma non k-regolare, il che dà problemi)

 

fig 3

La matrice di confluenza è (scusate il segno meno, non avevo voglia di cambiare tutte le entries)

 

i cui autovalori sono -2,-2,-2,-2,-2,3,3,3,1 (tranquilli, non li ho calcolati a mano). Si notano con il segno negativo i cinque autovalori relativi all’autospazio di dimensione 5 dei circuiti, e due autospazi relativi ad autovalori positivi. La somma degli autovalori è nulla, essendo pari alla traccia che è un invariante.

5) Trovare gli autovettori di una matrice, si sa, è una bella rottura. Sarebbe bello avere una ricetta meccanica per individuare i sottografi che costituiscono gli autovettori relativi agli autovalori positivi, ed una espressione esplicita per il loro relativo autovalore in termini di loro proprietà "topologiche" come connettività, grado etc. Una prima ipotesi è quella di cercare tra i cocicli, insiemi minimali di rami che dividono il grafo in due sottografi disgiunti, in qualche modo duali ai circuiti, ma purtroppo non funziona (ma il "purtroppo" in matematica non esiste: le cose sono o non sono, e non c’è da dispiacersi altrimenti). Per i circuiti c’è un tale trucco, ed è abbastanza semplice. Si può per esempio partire da un albero, aggiungere una corda e buttare via quello che non serve. Per i sottospazi ortogonali, so’ cazzi. Ma sto diventando abbastanza bravo a trovare gli autovettori per via grafica, con un po’ di fantasia.

Prendo due vertici opposti e disegno tutti i percorsi dal primo al secondo che contengono due rami, conteggiando due volte un percorso diretto. Faccio in modo di toccare tutti i vertici del grafo. Se i due vertici sono collegati direttamente, ottengo un autovettore relativo all’autovalore 1, altrimenti ne avrete uno relativo all’autovalore 3:

 

fig 4

 

 

fig 5

Purtroppo la stessa costruzione non funziona benissimo per altri due vertici a caso; ma ci dev’essere qualcosa sotto.

6) Se il grafo è completo, la ricetta qua sopra è esatta e lo spazio ortogonale ha rango |V| - rk(F + 2I). Interessante in questo caso è andare ad analizzare gli operatori di proiezione, ma sarà fatto in un’altra puntata.

7) Può essere interessante domandarsi se esiste una matrice che sta ai cocicli come F sta ai cicli.

8) L’operatore F agisce in uno spazio vettoriale definito su un gruppo, non su un corpo. La cosa non dà problemi perché F ha solo autovalori interi, e quindi ogni vettore si può scrivere come combinazione lineare intera degli autovettori di F. L’analisi dello spettro di questo operatore permette di dare una decomposizione esplicita di OGNI grafo (di quelli che consideriamo noi) in termini di circuiti e… un’entità ancora abbastanza informe.

* Il motivo per cui mi sono addentrato nei risvolti della matrice di incidenza è perché questa permette di transitare da una rappresentazione in rami ad una rappresentazione in vertici del grafo; la matrice di incidenza in un certo senso è l’operatore che calcola il "bordo" di un insieme di vertici, e si può definire analogalmente un operatore di "cobordo". I circuiti orientati sono grafi senza bordo. Mi interessano molto le analogie tra teoria dei grafi e la teoria di Hodge-deRham, di cui parleremo un’altra volta. Segno solo un appunto. Le grandezze termodinamiche (e.g. le forze microscopiche A) che ci interessano sono antisimmetriche per inversione del senso dei rami de grafo. Le due possibili rappresentazioni che ne possiamo dare sono come un vettore nello spazio lineare dei rami del grafo, o come matrice antisimmetrica in rappresentazione "vertici":

 
Questo dualismo tra un vettore ed una forma antisimmetrica ricorda il duale di Hodge, che per esempio associa al differenziale esterno della 2-forma "campo magnetico" (e quindi ad una 3-forma) il vettore "rotore del campo magnetico". Notare che D si comporta come un operatore di Dirac, dato che DD^T = laplaciano.
 
ERRATA. Niente di sostanziale. Il grafo in fig 3 non corrisponde alla matrice F sotto riportata; bisogna bensì collegare con il ramo curvilineo gli altri due vertici opporti.

June 29, 2009

tornati per lamentarci

Dopo alcuni giorni di black-out, dovuto ad un problema ad un disco del server, il blog è tornato, facendomi prendere un grosso respiro di sollievo e qualche precauzione in più (un back-up periodico dei contenuti ad esempio).

Riprendo segnalandovi questo articolo ironico e provocatorio sull’insegnamento della matematica, che rispecchia in pieno le mie opinioni. L’articolo si riferisce alla realtà scolastica americana, che nonostante tutto è a livelli di mediocrità non paragonabili alla situazione italiana (e su questo posso garantire personalmente, avendo passato il quarto anno delle superiori in una scuola pubblica americana, peraltro eccellente rispetto agli standard). Ciò non toglie che anche in Italia una discussione sull’argomento sarebbe opportuna, visto il "disamoramento" degli studenti per la matematica e lo scollamento tra le "due culture". Basti pensare che un presidente emerito della Repubblica, nonché ex presidente della Banca d’Italia, non ebbe timori a dire di essere stato un asino in matematica: chi mai confesserebbe di essere stato sgrammaticato?*

Ho qualche esperienza come insegnante privato. Gli studenti che sono passati sotto le mie grinfie consideravano le lezioni private come l’occasione per fare i compiti e togliersi di mente il problema, cercando di estorcermi la formula per risolvere un dato problema che avrebbero trovato uguale-uguale nel compito in classe. Ho sempre tentato di aiutarli a ragionare su un dato problema e ad arrivare alla formula da soli, di solito con ottimi risultati, ma purtroppo i frutti di questo sforzo marcivano in fretta; mai una volta che uno di loro si sia messo a ragionarci da solo. Piuttosto, passavano ore a compilare dettagliati foglietti zeppi di formule inutili e decontestualizzate, che poi avrebbero infilato in ogni orifizio trasformando il compito in classe in una pantomima constorsionistica. Quello stesso tempo, lo avessero impiegato a capire il poco (pochissimo) che serve per vivacchiare in matematica alle superiori, avrebbero avuto risultati molto migliori.

Estrapolo dal testo dell’articolo alcune frasi che mi hanno divertito/fatto pensare/entusiasmato:

Math is not about following directions, it’s about making new directions.

The art is not in the “truth” but in the explanation, the argument.

Mathematics is the art of explanation.

Would you accept as an art teacher someone who has never picked up a pencil or stepped foot in a museum? Why is it that we accept math teachers who have never produced an original piece of mathematics, know nothing of the history and philosophy of the subject, nothing about recent developments, nothing in fact beyond what they are expected to present to their unfortunate students?

Queste sul metodo mi piacciono particolarmente:

In particular, you can’t teach teaching.

Teaching is a messy human relationship; it does not require a method.

Or rather I should say, if you need a method you’re probably not a very good teacher.

Questa potrebbe essere una massima buddista:

Students learn that mathematics is not something you do, but something that is done to you.

E poi l’amara constatazione sui programmi ministeriali:

Students must also memorize the quadratic formula for some reason.

Questo "lamento del matematico" mi pare tuttavia più il grido di frustrazione di un insegnante capace e intelligente che vorrebbe insegnare la matematica in una maniera illuminata, facendo percorrere agli studenti il percorso creativo e stimolante della scoperta (e, come dice Feynman nella sua Nobel lecture, una cosa non la capisci davvero finché non la scopri da solo) che una vera proposta. Io stesso mi sentirei costretto dal programma in una maniera intollerabile, se potessi insegnare. Quanto vorrei poter insinuare nei miei studenti il dubbio che i numeri primi siano finiti o infiniti, o che ogni numero pari sia la somma di due numeri primi, e vedere con che cosa se ne vengono fuori, magari dopo un po’ di frustrazione, e guidarli verso una delle tante possibili risposte al problema, e vedere se questo dà loro una soddisfazione autentica. Il problema non si pone perché in Italia le carriere del ricercatore e dell’insegnante sono separate a priori, molto prima che qualche eventuale merito possa risaltare; mi dispiace dirlo così schiettamente, ma (con le dovute eccezioni) chi opta per la via dell’insegnamento è spesso un mediocre matematico/fisico, e i due anni di SSIS non aiutano in questo senso. Anzi, in nessun senso. Provo solo a immaginare al buon didatta addomesticato in pedagogia e metodologia quando si trova di fronte classi di 27 (ormai questi sono i numeri nella nostra scuola in disfacimento) persone tutte diverse pronte a ridicolizzarti al primo passo falso.**

D’altra parte, penso anche nella prospettiva opposta. Cosa direi se mio figlio si ritrovasse alle prese con un insegnante originale, vivace, disordinato e incapace? E passi per la matematica, ma quando cose simili dovessero succedere anche per la delicatissima storia, o la filosofia? Forse non sarebbe meglio un’istruzione di base, un po’ sterile, ma consolidata, con ben in mente che la vera formazione e gli interessi vengono delle esperienze di vita e, forse, ma solo forse, anche da un po’ di "scuola parentale"?

[Mi rendo conto che quest’ultimo paragrafo pochi anni fà non ci sarebbe stato. La vecchiaia precoce fà brutti scherzi.]

* A questo si collega il problema della "predisposizione alla matematica". E’ la scusa più consueta per giustificare gli insuccessi scolastici dei figli. ‘Non è tagliato per la matematica. Come ad essere stonati, non si può fare il musicista…’ o si? Io conosco una marea di musicisti che non hanno intonazione spontanea (che comunque non è una dote innata, ma dipende da quanto ascolto e quanto esercizio vocale si è fatto da piccoli). Ma l’hanno imparata. Ho avuto un insegnante di ear training (educazione all’intonazione) che per sua ammissione non era intonato, ma ha imparato ad intonare. E non per costrizione, ma per amore della musica. D’altra parte, non bisogna essere intonati per essere musicisti; ci sono musicisti che hanno un incredibile senso del ritmo, una capacità di analisi armonica o strutturale, oppure semplicemente hanno delle IDEE.

** Una volta ebbi a lezione un’insegnante di chimica che doveva dare supplenze in fisica. Non solo non sapeva niente, ma non capiva niente, e pretendeva di fare tutta la termodinamica in due ore. Alla fine le ho detto: fai di tutto per non farti scoprire, è l’unica.

 

June 25, 2009

diffusione e geometria

Filed under: fisica fiscale

Ci sono molti elementi che mi portano a ipotizzare, un po’ astrattamente, che ci sia un collegamento tra meccanica statistica di non-equilibrio e la geometria delle varietà curve, secondo questo schemino:

equilibrio = varietà piatta, sistema di riferimento globale

non-equilibrio = curvatura , sistemi di riferimento locale

Il più immediato è questo che segue. Considerate l’operatore di diffusione di Fokker-Planck

 

ove gli indici ripetuti si intendono sommati. Gli stati stazionari annullano l’operatore di diffusione. Ci sono due modi perché questo succeda: che si annulli la corrente (il termine tra parentesi quadre), o che questa abbia divergenza nulla. Nel primo caso si parla di equilibrio e nel secondo di non-equilibrio.

Se volessimo promuovere quest’equazione da R^n ad una generica varietà differenziale M, potremmo sostituire alle derivate parziali le derivate covarianti rispetto ad una qualche connessione, ottenendo un operatore sostanzialmente diverso:

Siccome la matrice di diffusione è simmetrica, la si può interpretare come tensore metrico, che a sua volta induce una connessione di Levi-Civita in termini della quale l’operatore di diffusione si scrive con grande economia di simboli

 

ove la generalizzazione del laplaciano è detto operatore di Laplace-Beltrami. Questa è di fatto l’equazione di una diffusione con rumore bianco delta-correlato, ed è quella che generalmente si studia (il libro di riferimento per queste cose è quello di Ikeda-Watanabe).

Tornando alla questione dell’equilibrio/non-equilibrio. La derivata covariante agisce sulle funzioni scalari come la derivata parziale, mentre aggiunge termini ai tensori di ordine superiore, per cui i due operatori differiscono per un termine

 

ove le Gamma sono i coefficenti di Christoffel della connessione. Essi coincidono solo in corrispondenza di stati d’equilibrio. In particolare, questo implica che gli stati d’equilibrio dell’equazione di Fokker-Planck siano tali in ogni sistema di coordinate, perché se valutato su uno stato di equilibrio il generatore si comporta come un tensore, ed essendo nullo rimarrà nullo in ogni altro sistema di coordinate. Lo stesso non si può dire per generici stati di non-equilibrio.

June 12, 2009

il non-equilibrio come non-scienza

Filed under: fisica fiscale

So, what was I doing these past few weeks that could possibly take precedence over writing ill-considered blog entries that I’d probably regret for the rest of my life? (Scott Aaronson)

Io personalmente sto cercando di arrivare ad una stretta con alcuni lavoretti relativi al mio ambito di expertise (haha), che poi sarebbe la meccanica statistica di non-equilibrio. Una scienza interessante ancorche’ inesistente, la scienza del tutto, perche’ ogni sistema e’ di non-equilibrio, e quindi destinata a non poter dire (quasi) niente di sintetico. Sono in vena di citazioni, ed una prima che mi viene in mente e’ questa:

"Non tentare le essenze, ma contentarsi delle affermazioni quantitative" (Galileo)

I Teoremi di Fluttuazione (FT) lontano dall’equilibrio sono la moda del momento in NESM, e di fatto sono i primi risultati che valgono lontano dall’equilibrio, non soltanto nel "regime lineare". Me ne sono occupato in tesi ed ora mi sto accodando alla moda. Se cercate sugli archivi "fluctuation theorems" troverete centinaia di articoli scritti negli ultimi anni; e notando i nomi degli autori vi renderete conto che ci sono delle autentiche fabbriche di pubblicazioni che lavorano a ritmo serrato. Nella maggior parte degli articoli non troverete una sola considerazione nuova, tantomeno una formula o una predizione; chi aveva qualcosa da dire (per esempio, Lebowitz) l’ha gia’ detta parecchi anni fa’ e poi se ne e’ stato zitto.

I FT sono affermazioni relative alle probabilita’ di traiettorie in uno spazio degli stati in cui avvenga un qualche tipo di dissipazione, dissipazione che puo’ essere descritta per mezzo di approcci stocastici oppure tramite sistemi dinamici non-hamiltoniani (per esempio i cosidetti "termostati"). Alla base del FT transiente sta il fatto che la probabilita’ che una traiettoria sia effetto di un’evoluzione "indetro nel tempo" e’ esponenzialmente soppressa rispetto alla stessa traiettoria prodotta dall’evoluzione "avanti nel tempo"

ove l’esponente e’ dato dall’entropia prodotta lungo la traiettoria (se vi disturba il fatto che si consideri la probabilita’ di una singola traiettoria, considerate che quella a SX sia una derivata di Radon-Nycodim e questa relazione una semplice conseguenza del teorema di Girsanov-Cameron-Martin, con un’opportuna identificazione di s(\gamma).). Il vero e proprio teorema di fluttuazione si ottiene integrando rispetto a tutte le traiettorie che hanno una certa entropia e ricordando che l’entropia e’ dispari per inversione temporale:

C’e’ pero’ un qualcosa di tautologico nei teoremi di fluttuazione. In primo luogo, hanno una validita’ troppo generale. Essi colgono l’essenza (ma non l’Essenza) dell’irreversibilita’, ma dubito che possano dare predizioni quantitative significativamente lontano dall’equilibrio, a meno di non trovarsi nei casi assolutamente banali in cui e’ stato finora "sperimentato" il teorema. In secondo luogo, le definizioni e le ipotesi alla base sono un po’ troppo ad hoc, e con tali definizioni il teorema e’ una banalita’.

Il mio lavoro attualmente consiste nello studiare quali sono le ipotesi implicite dei teoremi. Con il mio relatore di tesi ci siamo resi conto che queste ipotesi e definizioni hanno un valore puramente matematico, ma non hanno consistenza fisica. A partire dal concetto di entropia lungo una traiettoria, a quello di inversione temporale. Considerate il film di un uomo che cammina in avanti; i TF confrontano la probabilita’ che si realizzi la traiettoria dell’uomo che cammina avanti rispetto alla traiettoria descritta dall’uomo nel film proiettato all’indietro. Fisicamente, invece, in laboratorio si confronta il film dell’uomo che cammina in avanti con il film dell’uomo che si sforza di camminare all’indietro ripercorrendo tutti gli stati "macroscopici" che aveva attraversato prima. La differenza e’ tutta qui, e si fa’ sentire.

Spesso nell’incipit degli articoli che trattano del teorema di fluttuazione si parla dell’esempio del gas in compressione in un pistone per visualizzare comodamente il sistema. A noi risulta, gia’ per un modellino iper-iper-iper semplificato di un tale gas, che le proprieta’ statistiche delle grandezze termodinamiche "fisiche" divergono significativamente dal TF, e passare a modellini piu’ complessi non puo’ che peggiorare la situazione. In secondo luogo, parrebbe che le assunzioni alla base dei singoli approcci presumano in qualche modo di essere vicini all’equilibrio Per esempio, l’utilizzo di una descrizione basata sul moto browniano non deve dimenticare quali sono le ipotesi alla base, cioe’ che la particella risenta di urti scorrelati e con statistica gaussiana: vale a dire che siamo vicino all’equilibrio. E all’equilibrio, dove tutto e’ gaussiano o eredita le proprieta’ delle gaussiane, il teorema e’ ovvio.

Se dai nostri risultati venisse fuori un quadro coerente, saremo molto piu’ delicati nel comunicarlo.

- - - 

In questa foga distruttiva (ma istruttiva) sto anche personalmente cercando di produrre qualcosa di piu’ creativo e divertente: un principio variazionale decente per gli stati stazionari di non-equilibrio, basandomi sulla teoria di Schnakenberg. La citaziona appropriata e’ sicuramente questa:

C’è qualcosa che affascina nella scienza. Uno ricava un tale carico di congetture all’ingrosso da un così trascurabile investimento di fatti.

Mark Twain

Spero di avere qualcosa di concreto da scrivere presto. Per il momento segnalo solo questo byproduct. Vicino all’equilibrio e’ pacifico che forze termodinamiche e correnti coniugate siano legate dalla relazione

ove L_ab e’ una matrice indipendente dallo stato del sistema e simmetrica. Quest’ultima proprieta’ viene detta reciprocita’ di Onsager, ed e’ un fatto parecchio affascinante: dice che l’effetto reciproco, per esempio, di una differenza di temperatura sulla corrente elettrica e di una differenza di potenziale sulla corrente di calore e’ lo stesso. Mi risulta che questa stessa relazione valga anche in stati stazionari di non-equilibrio, ove pero’ la matrice L_ab dipendera’ dallo stato del sistema, e pertanto non si puo’ parlare di regime lineare. Cionondimeno, le relazioni di reciprocita’ resistono invariate.

Semprerebbe che le relazioni di Onsager valgano arbitrariamente lontano dall’equilibrio; se (e sottolineo se) le relazioni di Onsager nel regime lineare sono testabili senza variare lo stato del sistema, allora in principio lo sono anche in stati stazionari di non-equilibrio. Altrimenti, bisognerebbe variare le correnti senza variare lo stato del sistema, cosa in principio possibile sulla carta ma, credo, molto poco praticabile sul piano pratico. In questo modo si "simulerebbe" di fatto un regime lineare, e quindi siamo sempre da capo: la NESM rivelerebbe ancora una volta quella che io credo sia la sua incapacita’ intrinseca di parlare del suo oggetto di ricerca.

 

May 31, 2009

il piacere della scoperta

Filed under: fisica fiscale

 

Più sai, meno pubblichi

[Attribuita a Landau]

Avevo preso in prestito questo libro in biblioteca un mese fà, incuriosito dal titolo, ma me ne ero presto dimenticato. L’altro giorno ricevo un promemoria di restituzione, mi torna in mente quel volumetto scritto da matematici per matematici, quindi non troppo appetitoso per me, e lo ritrovo seppellito tra le carte. Prima di restituirlo apro a caso una pagina, così, giusto per onorare il prestito. E leggo una frase a caso

Proof. By the de Rham dual theorem there exist closed one-forms […]

Mi viene un colpo. Perché parlano di teoria di de Rham in un libro che ha a che fare con i processi stocastici? Vediamo a che proposito. Il capitolo è Entropy production of diffusions. A questo punto comincio a innervosirmi. Sfoglio attentamente il capitolo, e si!, è quello che temevo.

Da qualche mese mi ero convinto che certi risultati di teoria dei network dovuti a Schnakenberg, in particolare la possibilità di scrivere la produzione di entropia nello stato stazionario in termini di forze e correnti macroscopiche definite su una base di circuiti fondamentali del grafo, potessero essere estesi ai processi diffusivi tramite applicazione di risultati di geometria differenziale (ne avevo accennato qui, qui e qui). Non ne sapevo molto, per cui ho cominciato (anche per cultura personale) a studiare seriamente geoemtria differenziale, che è una lunga, lunga strada in salita. Più andavo avanti più mi convincevo che l’intuizione potesse essere corretta.

Ora ne ho la certezza. E’ solo che esiste già, tutto scritto nero su bianco. E’ un risultato piuttosto recente e spero presto di riuscire a capirlo nei suoi dettagli per poterne scrivere qui. Sicuramente si tratta di un risultato molto formale e che offre tantissime possibilità di approfondimento, soprattutto in direzione fisica; si presta ad essere messo in parallelo con risultati analoghi di teoria di gauge, dal punto di vista concettuale credo che abbia a che fare con il principio olografico in una sua formulazione termodinamica, e il mio maggiore interesse rimane quello di individuare un principio variazionale per gli stati stazionari di non-equilibrio (se non c’è già, che non è mai detto…). Sicuramente è un risultato che la comunità dei fisici non conosce e degno di essere rielaborato.

Certo, è piacevole scoprire che un’intuizione grezza si è rivelata corretta, vuol dire che le domande che ci si pone sono sensate. Ma rimane la delusione. Avevo investito molto in questa intuizione perché mi offriva la possiilità di "personalizzare" il dottorato, di darmi un mandato autonomo. Così invece si aggiunge alla pila dei libri un’altra cosa da studiare, non facile, necessaria per raggiungere la frontiera della ricerca e da lì, forse, riuscire a limare qualche dettaglio.

Forse sono stato ingenuo, a pensare che un newbie fosse in grado di porsi domande interessanti. Se si pensa alla mole immensa di scienza già elaborata, sembra che l’atteggiamento corretto sia quello di mettersi a studiare umilmente. Fatto sta che abbiamo 30 anni adesso, e quando arriveremo a porci domande forse saremo già fusi da non poter dare loro risposta, o non averne più la voglia. D’altra parte vedo intorno a me che chi ha cominciato fattivamente a fare ricerca, ha smesso di studiare e le nozioni si sono sedimentate a quello che si sapeva alla fine del periodo di dottorato. Ad un certo punto bisogna smettere di studiare, deporre i libri, evitare di surfare troppi articoli altrui, e mettersi a lavorare. E il risultato è che la maggior parte della ricerca sarà una ri-scoperta di cose note; non priva di valore, perché c’è un certo margine di reinterpretazione personale che può aiutare a mettere in luce aspetti diversi. Come disse Feynman nella sua Nobel lecture, una cosa non la si capisce veramente finché non la si scopre personalmente. Ma il rischio è chiaro: che mole di scienza diventi così grande che ogni nuova ricerca non riesca mai ad uscire dall’alveo delle cose note. E’ la "fine della scienza" invocata dal giornalista scientifico John Horgan.

 

Un’ultima riflessione. La scienza ha anche scopi d’utilità sociale, consente il cosidetto "progresso" dell’umanità, etc. Ma ritengo che rimanga in primo luogo una questione di soddisfazione di un personale desiderio di scoperta. A volte mi chiedo, che diritto ha l’uomo di togliere all’uomo questa enorme soddisfazione? Abbiamo tutti giocherellato con i numeri primi, magari arrivando a formulare ipotesi come la congettura di Goldbach, o tendando di dare loro un ordine come fece per primo Eulero per arrivare a Riemann. Magari abbiamo provato il brivido di aver trovato una dimostrazione del fatto che i numeri primi sono infiniti, e poi veniamo a sapere che questa dimostrazione è un fatto elementare, il primo teoremino nel manuale la cui dimostrazione è lasciata per esercizio a casa. Certo, siamo stati dei fessi a pensare di poter fare ipotesi che non fossero già note. Ma chi è che si è arrogato il diritto di togliermi il piacere della scoperta e di deludermi? E costui, è sicuro costui che, indietro nella storia, nella Grecia antica, tra i Sumeri o gli Egizi, non ci fosse qualche pastore solitario e geniale che questa cosa la sapeva già, ma che se l’era tenuta per sè?  Oggi non può più nascere un nuovo Eulero, un nuovo Ramanujan che possa trarre piacere dal fatto di ipotizzare e verificare semplici ipotesi.

Lo stesso non succede in musica, filosofia e nelle arti: i musicisti neri del jazz primordiale hanno "riscoperto" molte delle arditezze armoniche che venivano già usate in Europa dai compositori del tardo ottocento, ma la musica che ne è venuta fuori è completamente diversa, e il fatto che il materiale armonico sia lo stesso poco importa, nessuno verrà a bollarli come "poco originali". Lo stesso per il pensiero umano: si dice che i filosofi moderni non abbiano fatto altro che ripetere quello che dicevano Platone e Aristotele, ma ogni volta che si dice la stessa cosa, acquisisce nuovo valore e un nuovo autore. Le scienze invece sono accumulative, e siamo condannati al fatto che ogni scoperta ci impoverisce, ogni cosa in più che sappiamo ci toglie qualcosa dentro. E non c’è modo di rimediare a questa situazione, a meno che il piacere della scoperta non torni ad essere una questione personale, e non universale.

May 19, 2009

riduzione dell’informazione /1

Filed under: fisica fiscale

La settimana scorsa sono stato qui per una rimpatriata, fermandomi a cena con gli organizzatori e con l’ospite, Fabrizio Illuminati, fisico teorico di area ottica e informazione quantistica. Istrionico e dissacratore con il suo eloquio travolgente. Tanti gli spunti dalla serata, sia scientifici che professionali che umani. Mi concentro su una tematica, che avrei potuto ugualmente attaccare da qui, e che svilupperò in una serie di post.

Tre anni fà avevo invitato Fabrizio a Festivaletteratura con Giancarlo Ghirardi a parlare di fondamenti della meccanica quantistica. Ghirardi è autore di un famoso meccanismo di riduzione della funzione d’onda (il Ghirardi-Rimini-Weber) che incorpora un rumore stocastico nell’equazione di Schroedinger riproducendo la transizione quantum to classical per tempi di decoerenza sufficientemente lunghi. Come ben saprete le equazioni di Schroedinger e di Heisenberg che determinano l’evoluzione di un sistema quantistico isolato sono assolutamente deterministiche finché non incorre il processo di misura. Il meccanismo GRW incorpora il rumore, quindi una sorgente di indeterminismo e di rottura dell’unitarietà, nell’equazione fondamentale. Un’ottica che ha come controparte classico-statistica l’interpretazione di Prigogine del caos come elemento intrinseco. Posso dire con relativa sicurezza che entrambe le prospettive sono abbondantemente superate oggi. Di questo pare che Ghirardi fosse sconsolatamente consapevole; aiutato da qualche bicchiere di vino si sarebbe aperto con Illuminati dopo una pesante cena mantovana, confessando il dispiacere di non poter assurgere al firmamento degli scienziati-che-hanno-rivoluzionato-la-fisica. Al che sarebbe stato rassicurato che Einstein, sul letto di morte, se ne fregava della Relatività Generale e delle relazioni omonime.

Lo sforzo di Ghirardi rimane comunque importante perché rappresenta lo sforzo, anzi la battaglia dell’uomo che si confronta con una domanda ultima ed eterna e tenta di afferrare una verità forse ontologica con mezzi razionali. Se anche la teoria GRW non sopravviverà, rimarrà invece l’insopportabile dualismo quantistico/classico, che poi, come voglio convincervi qui, non è altro che il problema del determinismo/indeterminismo, caos/armonia, e forse anche intelligenza/macchina.

La transizione quantum to classical

Tra le varie tematiche sollevate da Illuminati, molte delle quali avrebbero meritato approfondimento a parte, mi concentro su quella che scaturisce dalla domanda: esiste una transizione quantum to classical non innescata dall’interazione con l’ambiente? Non ero a conoscenza, e non lo sono tuttora visto che non ricordo gli estremi dell’esperimento (se qualcuno ha qualche coordinata, mi faccia sapere!), che si fosse riusciti a produrre stati sovrapposti di una catena di molecole molto grande. Si parla di una macromolecola di migliaia, o forse di decine di migliaia, di atomi, che attraverso misure indirette che non ne riducono la funzione d’onda si è potuto constatare vivere per tempi lunghi in uno stato misto, entangled. Uno stato tipo "spin-up-spin-down". La possibilità di effettuare una simile misura è di per se sorprendente: si tratta di una meta-misura, una misura non già dello stato d’interesse (lo "spin"), ma del fatto che il sistema giace in una certa sovrapposizione di questi autostati. Misura possibile perché esiste un osservabile diagonale nella base "spin-up-spin-down". Una misura che ci dice se in effetti il gatto di Schroedinger si trova in uno stato "vivo e/o morto" senza guardare il gatto. Fantastico, non trovate?

La tentazione è quella di dire: allora facciamolo per davvero un gatto macroscopico di Schroedinger. Che cosa ce lo impedisce? Due cose innanzitutto, e poi una terza che è tutta da capire:

1) il rumore dell’ambiente diventa ineliminabile: anche se si potesse in principio costruire cose grosse isolate che vivono in stati sovrapposti, in pratica l’ambiente esterno ne determinerebbe la decoerenza in tempi troppo brevi perché il fenomeno possa essere osservabile

2) un problema di spettro degli osservabili (questo me lo sono sognato adesso, dovrei consultarmi con chi ne sa qualcosa davvero): l’esistenza di osservabili che hanno due stati di "spin" (qualunque cosa voglia dire spin in questo contesto) sovrapponibili e di un osservabile diagonale nella base mista dovrebbe essere molto sensibile alla simmetria dell’oggetto. Per il teorema di Noether, se il sistema non ha simmetrie difficilmente esisteranno osservabili commutanti, per cui addio gatto; rimane la possibilità per concatenazioni di molecole uguali, comunque interessanti

3?) un meccanismo di decoerenza intrinseco e conosciuto (tipo il GRW) che subentra ad una qualche scala mesoscopica

Quest’ultima ipotesi è l’oggetto di questo e dei futuri post. En-passant, vorrei mettere fine (ma solo nella mia testa) ad un esempio sbagliato di bizzarria quantistica, il famigerato esempio della Luna. Si piglia la Luna solo per esagerare, basta molto meno. Dunque: Luna è là dove la vedi nel momento in cui la vedi (posto c = infinito)? Perché magari la sua funzione d’onda è bella sparsa in giro per la sfera celeste di competenza (una sottovarietà lagrangiana). E la risposta è Si!, perchè se la vedo la sto misurando in quel determinato autovalore dell’osservabile posizione. Se poi non mi considero l’unico uomo sulla terra, ma tengo conto che miliardi di persone prima di me, di animali, di protozoi, di raggi luminosi provenienti dal sole e dalle altre stelle che la illuminano (altrimenti non la vedremmo affatto), di venti solari di neutrini, di raggi cosmici etc. etc. continuano a misurarla fin da quando c’è, beh allora la risposta può anche essere data con un certo fastidio. Perché è dura affermare che la Luna sia un sistema isolato. Fine della storia.

La misura

E siamo al problema della misura. La misura quantistica nell’interpretazione ortodossa della scuola di Copenhagen presuppone che da qualche parte dell’universo esista un osservatore classico, quindi che una porzione di universo obbedisca ad una fisica diversa. Un dualismo abbastanza fastidioso. E’ difficile chiamare l’interpretazione di Copenhagen una vera interpretazione. Si tratta più che altro di una filosofia pratica: l’atteggiamento è "funziona, quindi non mi pongo ulteriori domande", anche detto "shut up and calculate". Sicuramente inattaccabile dal punto di vista metodologico. Ma c’è di più nella vita.

Il problema della misura ha uno o entrambi di due grossi problemi, ognuno dei quali ha uno o entrambi di due grandi problemi che ne hanno altri due etc.:

1) la misura è antropica: da qualche parte c’è un essere cosciente che performa la misura

2) la misura è caotica: esiste un elemento di rottura del determinismo quantistico

Lasciamo il primo ai creazionisti e approfondiamo il secondo, che come accennato ha subproblemi non banali.

Se si include l’osservatore nella descrizione quantistica del sistema, accade che la funzione d’onda complessiva (nello spazio prodotto tensore) a sua volta non riuscirà a collassare. Il nuovo sistema non può essere isolato, quindi ci sarà un osservatore/ambiente esterno. Allora includiamo anche questi, non otterremo un sistema isolato? Pare proprio di no, altrimenti come si spiega il collasso della funzione d’onda totale, e così via fino all’intero "universo", che in questo contesto vuol dire soltanto l’insieme di tutti i sistemi fisici, con la sua funzione d’onda. Conclusione: l’universo non può essere isolato, a meno che non ci siano meccanismi intrinseci di riduzione della funzione d’onda. Dei "pozzi di caos", delle sorgenti di informazione, delle singolarità. C’è chi ipotizza che i fantomatici buchi neri possano svolgere questo ruolo.

Credo di aver posto domande a sufficienza. Nella prossima puntata, altre domande.

May 7, 2009

Edward Witten - Supersimmetry and strings…

Filed under: fisica fiscale

Sono stato oggi a Padova, ad un seminario di Edward Witten, il fisico, con forti propensioni matematiche, più citato del mondo. Il suo interessamento alla teoria delle stringhe fu negli anni ‘80 alla base della "seconda rivoluzione stringhista" e fece esplodere l’interesse (e poi la moda) per questa teoria esotica, stravagante ma dalle forti propensioni maggioritarie (eh, insomma, come il PD).

Attorno alla sua persona c’è un alone di sacralità e un rispetto incondizionato che lo circondano ad ogni passo. Nel suo metro quadro di aura vitale nessuno osa insinuarsi per paura di sminuire la sua figura piuttosto austera o di turbare un pensiero geniale che forse si sta insinuando in quel momento nel suo testone (fosse stato mio amico l’avrei soprannominato "spillo").

Figuratevi quindi la delusione alla fine di un talk qualunque, quasi tutto letto da slide (perlomeno molto sobrie, senza uso di comicsans che per un fisico è un bel passo avanti) che avrebbe potuto tranquillamente mandarci via mail, una ricostruzione cronologica delle ragioni per cui la supersimmetria va a braccetto con la teoria delle stringhe, ma senza nulla di personale o di non noto agli addetti ai lavori. E soprattutto senza una valutazione delle prospettive, dei limiti (se ce ne sono, ovviamente), dello stato e del significato della ricerca di una teoria unificata. E’ nello stile di Witten evitare di fare affermazioni forti e non accuratamente scientifiche (congetture, ipotesi, credenze) sul valore della teoria, e quindi tenersi alla larga da possibili discussioni. L’atteggiamento è quello un po’ minimalista di uno che presenta un’idea inconsueta, una come tante, una che si approfondisce così tanto per sport, se non vi piace fate altro.

E’ un atteggiamento apprezzabile rispetto alle tante barzellette che vengono spacciate in giro sui giornaletti parascientifici. Solo che Witten è il guru della teoria che ha monopolizzato la fisica teorica negli ultimi trent’anni, che se lui dice A oggi domani tutti dicono A, e quindi spetterebbe a lui prima di tutti cercare di ragionare sulla bontà della strada percorsa, di difendere la teoria dalle critiche che le vengono mosse in maniera sempre più consistente, e per esempio raccontarci se veramente (come sembrerebbe) il suo interesse nella teoria come qualcosa di fisicamente fondato si sia indebolito a favore degli aspetti più puramente matematici (peraltro non propriamente di teoria delle stringhe). Altrimenti chi, chi nell’Universo? Perché se veramente una conferenza come questa fosse la presentazione di un’ideuzza inudita che è venuta al primo rispettabile pinco pallino professore universitario, il quale comincia a raccontarti che la sua teoria descrive una particella mai vista, ma ci vogliono 10 dimensioni, 6 delle quali compattificate, e il gruppo di gauge è E8 X E8 perché torna comodo per ottenere altre due teorie fantasiose di due suoi amici SU(5) e SO(10), e che però va tutto a scatafascio se in più non ci si mette anche una simmetria rotta in tutte le scale sperimentabili e i cui strascichi non sono osservabili, e che dovendo essere l’unica richiesta perentoria ad una teoria fisica quella di predire un buon spettro dell’energia, questa teoria fà ad oggi il contrario. Beh, se questo signore venisse a fare un simile intervento la sala conferenze si svuoterebbe dopo pochi minuti in un brusio sommesso e tra evidenti segni di fastidio.

Ma la cosa che più mi ha esterrefatto è che al fisico che hai sempre desiderato incontrare, faro della tua ricerca, nessuno di 500 è riuscito a fare una domanda, tant’è che per colmare il silenzio si sono spesi tre professori con domande di rito per risposte di rito. La risposta ad una di queste domande è indicativa dello stile. Come la mettiamo con il problema della costante cosmologica (che la quasi totalità delle teorie di stringhe prevedono con il segno sbagliato)? La risposta è stata più o meno "è un bel problema, chissà che non ci siano soluzioni", liquidando la questione spinosa del landscape come una tecnicalità, quando su questo argomento si stanno consumando battaglie interpretative feroci.

Avrei voluto fare io una domanda; ma avrei sicuramente chiesto qualcosa di antipatico, e, lo ammetto, di fronte a tanti ammirati professori e studenti adoranti non me la sono sentita. Tantopiù che non avrei ricevuto risposta.

Siamo ben lontani dalla genialità totale di Einstein e dalla vivacità intellettuale di Feynman.

Capitano, ci dia la via!

PS. OK, lo ammetto; la vocina esile subito mi ha spiazzato. Ma questo è inelegante.

May 4, 2009

Correlazione e interferenza

Filed under: fisica fiscale

Nei commenti ad un post precedente è in corso una discussione sulla natura peculiare del concetto di variabile aleatoria in meccanica quantistica. Si assiste infatti a questo fenomeno. Le variabili aleatorie coniugate X e P sono perfettamente ben definite e hanno una misura di probabilità indipendente dal tempo, se il sistema si trova inizialmente in un autostato dell’hamiltoniana. Tuttavia queste due variabili sono intrecciate in maniera tale che non abbia senso chiedersi quale sia la probabilità congiunta di X e di P, a meno di non inserire una nozione di "prima" e "dopo", e quindi rompendo la simmetria per traslazione e inversione temporale che è alla base della conservazione dell’energia e dell’informazione.

Quindi, volendo tentare di incastrare questa teoria in una teoria classica delle probabilità (di cui non sappiamo a priori la misura di probabilità e lo spazio degli eventi), ci si scontra con il fatto che

P(X=x,P=p) diverso da P(P=p,X=x)

Qual è il problema con la MQ? Le due variabili aleatorie X e P non sono soltanto dipendenti, nel senso che l’eventualità dell’una modifica l’eventualità dell’altra, ma accade che l’eventualità dell’una modifica la legge di probabilità cui obbedisce l’altra o (che è la stessa cosa) l’insieme degli eventi che sono misurabili: un evento di quello spazio, accadendo, modifica lo spazio stesso rendendo non misurabili eventi che prima lo erano e viceversa. Si compie quindi un salto meta-logico. La parola adeguata potrebbe essere interferenza.

Faccio un semplice esempio.

Variabili aleatorie interferenti

Ho tre monete: due normali (fifty-fifty) ed una truccata (1/3 testa, 2/3 croce). La prima moneta lanciata decide quale delle altre due monete bisogna usare per il secondo lancio. Per esempio se lancio prima una moneta normale avrò:

I°       II°       congiuzione

1/2 T  1/3 T    1/6 TT

          2/3 C   1/3 TC 

1/2 C  1/2 T    1/4 CT

          1/2 C    1/4 CC

Se lancio prima quella truccata ho

I°       II°       congiuzione

1/3 T  1/2 T    1/6 TT

          1/2 C   1/6 TC 

2/3 C  1/2 T    1/3 CT

          1/2 C    1/3 CC

La meccanica quantistica è come chiedersi la probabilità

P(truc=C,norm=C) = P(truc=C|norm=C)P(norm=C)

= 0 * 1/2 = 0

dal momento in cui quella truccata non viene lanciata se la normale risulta croce, e confrontarla con

P(norm=C,truc=C) =  P(norm=C|truc=C)P(truc=C)

= 2/3 * 1/2 = 1/3

Non dico che questo sia corretto dal punto di vista probabilistico, anzi… Dico però che la MQ forse funziona proprio così, e che non si tratta solo di correlazioni strane tra v.a. classiche.

May 2, 2009

Probabilità negative?

Filed under: fisica fiscale

Riprendo una tematica affrontata qui prendendo spunto dallo stesso input:

La Meccanica Quantistica è quello a cui si arriva inevitabilmente se si parte dalla teoria della probabilità e si prova poi a generalizzarla in maniera che i numeri che usualmente chiamiamo "probabilità" possano essere negativi. In questi termini, la teoria avrebbe potuto essere inventata dai matematici nel XIX secolo senza alcun input sperimentale. Non è stato così, ma avrebbe potuto essere.

[Scott Aaronson]

Aaronson nella sua Lecture 9 parla di probabilità negative riferendosi alla funzione d’onda, che assume valori complessi sulla circonferenza unitaria (e non solo reali negativi), interpretandola alla stregua di distribuzione di probabilità, con la sola differenza che si applica la norma quadra e non la somma.

E’ opinabile, e opinerò, il fatto che le funzioni d’onda possano essere interpretate come distribuzioni di probabilità. Ma le probabilità negative entrano in quantistica anche da un’altra porta, e questa volta l’analogia con la teoria della probabilità classica è molto più forte.

La funzione di Wigner

Uno stato quantistico è rappresentato in maniera astratta da un ket e la sua proiezione sulle autofunzioni di un operatore (per esempio la posizione X o il momento P) fornisce la funzione d’onda in rappresentazione x o p:

 

 

Le due rappresentazioni sono legate dalla trasformata di Fourier

 

I moduli quadro delle funzioni d’onda forniscono le distribuzioni di probabilità della variabile aleatoria. Wigner si pose la domanda se esistesse una funzione delle due variabili, definita quindi nello spazio delle fasi (x,p), le cui distribuzioni marginali ottenute integrando rispetto a x o a p fossero proprio le densità di probabilità. Questo avrebbe fornito un parallelo con la teoria classica nello spazio delle fasi, in cui data la distribuzione iniziale f(q,p) di posizioni e impulsi l’evoluzione è ottenuta tramite applicazione del flusso hamiltoniano (unitario). Notare che date due variabili aleatorie correlate non è garantito che esista una distribuzione di probabilità congiunta.

Si dimostra facilmente che la funzione

 

è tale che le sue proiezioni nei sottospazi x e p sono proprio le densità marginali:

 

 

Succede anche un’altra cosa meravigliosa. Con un po’ di lavoro potete ottenere un’equazione di evoluzione per f^W del tutto analoga all’equazione di Liouville, a meno di termini di ordine accatagliato^2:

C’è solo un problema: la funzione di Wigner può diventare negativa e quindi non può essere interpretata propriamente come distribuzione di probabilità congiunta. Le aree dello spazio delle fasi in cui effettivamente questa diventa negativa sono grandi solo pochi accatagliati, e corrispondono alle zone dello spazio delle fasi dove p e x interferiscono. D’altra parte, mentre la correlazione è un fenomeno trasversale, che esiste sia in fisica classica che quantistica, l’inferferenza (contenuta nei termini non-diagonali della matrice di densità) è intrinsecamente quantistica. Facendo un coarse graining si può ottenere una distribuzione di probabilità semiclassica.

Note

i) Non sono d’accordo con Aaronson col chiamare densità di probabilità la funzione d’onda, perchè per sistemi finiti una densità di probabilità dovrebbe avere significato intuitivo di probabilità di singolo evento.

ii) Non mi sembra che il passaggio dalla teoria delle probabilità alla meccanica quantistica sia quello più intuitivo, stando all’articolo di Hardy che Aaronson cita. Hardy mostra che la MQ discende dagli assiomi classici di teoria delle probabilità più un altro assioma che la differenzia. Non parla affatto di probabilità negative con norma quadrata.

iii) Se c’era un modo per arrivare alla quantistica per mera intuizione matematica, ce l’aveva in mano Hamilton che secondo leggenda in alcuni suoi appunti avrebbe annotato tabelle del tipo

ottica geometrica             |   ottica ondulatoria

meccanica hamiltoniana   |       ???

(i punti di domanda sono miei). L’analogia tra le tre branche indicate è evidente quando si va a scrivere l’equazione di Hamilton-Jacobi della meccanica classica e ci si rende conto che essa descrive la propagazione di onde di informazione nello spazio delle fasi.

iv)  In ogni caso, sarebbe stato impossibile scoprire la quantistica se non ci fosse stata una motivazione fisica, come era stato incapace Minkowsky di interpretare la propria geometria in senso fisico e di scoprire il principio di relatività. Nel XX secolo vedo la teoria delle stringhe come un tentativo estremo di capire cose che ancora non esistono, nè sperimentalmente nè da un punto di vista di pulizia intellettuale. Con i risultati che ne conseguono.

v) La funzione di Wigner non è una distribuzione di probabilità, e quindi non c’è da scandalizzarsi se risulta negativa. Non è affatto detto che due variabili aleatorie correlate abbiano una densità di probabilità analitica.

vi) Il fatto che la funzione di Wigner obbedisca all’equazione classica di Liouville a meno di termini di ordine 2 in accatagliato mi ricorda dell’equazione di Hamilton-Jacobi quantistica, che contiene un potenziale quantistico di ordine accatagliate, e l’equazione di Schwinger in teoria dei campi. In tutti questi casi si tent di ricongiursi alla teoria classica e ci si arriva quasi, a meno di termini correttivi quantistici. Nel caso della funzione di Hamilton-Jacobi esiste una trattazione soddisfacente della procedura di quantizzazione a partire dall’analogo classico. Chissà che procedure simili non esistano anche negli altri due casi.

vii) Leggendo l’articolo di Hardy mi sono accorto che l’assioma in più, che rende quantistica le cose, è un assioma che richiede l’esistenza di trasformazioni tra stati quantistici. D’altra parte l’approccio tramite equazione di HJ presume l’esistenza di una trasformazione tra stati quantistici, intesi come traiettorie in uno spazio delle fasi. Le analogie però finiscono qua. Il primo approccio è probabilistico, il secondo analitico. Nel primo si considerano solo sistemi discreti (di spin), nel secondo la trattazione è continua. per cui non ci sono ovvie connessioni. Forse la trasformata di Wigner potrebbe fornire l’anello mancante.

April 27, 2009

Alexandr Andrianov ::: Advanced QFT ::: 2

Filed under: fisica fiscale

Si va sul tecnico, per cui ci sono meno spunti per divagazioni.

1) [Funzionale generatore] In primo luogo, il funzionale generatore:

 

aka funzione di partizione, ove S(\phi) è l’azione classica. Si possono fare molte interessanti manipolazioni portando fuori le derivate rispetto alla corrente coniugata, esprimendo così la funzione di partizione della teoria interagente in termini di quella della teoria libera. Volendo proprio esagerare si può anche scrivere

L’integrale è ovviamente orribilmente divergente e non so che utilità possa avere questa scrittura se non a mostrare che quantizzare equivale vagamente a sostituire operatori di derivazione (ad argomento dell’azione) a funzioni. La somiglianza con una trasformata di Fourier

   

ma intesa in senso funzinonale mi farebbe scrivere

Notare che \delta(j)  (intesa in senso funzionale!) è proprio la distribuzione in probabilità della corrente, che come discusso nella precedente puntata è un oggetto classico. Non ho idea di cosa questo significhi.

2) [Equazione di Schwinger-Dyson]  Smanettando in maniera simile con gli altri funzionali generatori (funzionali energia libera di Hemlholtz e di Gibbs) si ottiene l’equazione di Schwinger-Dyson

 

   

OK, scritta così non vuol dire un tubo. Vi basti sapere che con \omega si intendono le equazioni del moto classico. Non so voi, ma io trovo che le formule della teoria dei campi nella formulazione lagrangiana sia esteticamente meravigliose, mentre non posso vedere quelle della quantizzazione canonica. A destra le equazioni del moto sono valutate su un operatore di derivazione, a sinistra invece sono valutate su una funzione, e compare una forza quantistica dell’ordine \hbar, quindi soppressa nel limite classico. Vi ricorda qualcosa?

Quando applicate l’equazione di Schroedinger ad un ansatz \exp i S(q,p), ottenete l’equazione di Hamilton-Jacobi classica per l’azione più un potenziale quantistico. E’ l’approssimazione semiclassica WKB. Viceversa, quantizzare vuol dire precisamente sostituire nell’hamiltoniana un operatore ad una funzione

   

L’approssimazione WKB in MQ è semiclassica, pertanto gli approcci che tentano di ripercorrere la strada a ritroso sono guardati con sospetto, perché in qualche modo esiste il concetto di traiettoria di una particella, il che ovviamente pone problemi relativi a variabili nascoste etc. Esiste però un approccio, di cui vorrei parlare prossimamente sul blog, che rende il tutto rigoroso e digeribile, e consente di quantizzare un sistema non-relativistico a partire da un semplice assioma di stampo geometrico (Equivalence Postulate), che non è la mera sostituzione di numeri con operatori. Il problema delle traiettorie c’è e non c’è, ma di questo parlerò in futuro.

3) [Teoria di Hamilton-Jacobi e QFT] D’altra parte l’applicazione della teoria di Hamilton-Jacobi ai campi è abbastanza sconosciuta, ma esiste, e per esempio è alla base della quantizzazione del campo gravitazionale in LQG. E’ un mondo fatto di geometria, varietà differenziali, forme simplettiche, e sicuramente non è il modo più semplice di enunciare una teoria di campo. Ma la teoria di Hamilton-Jacobi è indubbiamente un setting adeguato per QFT. Le equazioni di Hamilton-Jacobi infatti emergono quando si vuole individuare le geodetiche passanti per due punti dati dati in due istanti dati, e quindi si impongono condizioni al contorno diverse da quelle tradizionali di Cauchy (posizione, tempo, energia e momento iniziale). In MQ i problemi hanno condizioni al contorno del primo tipo, visto che non è possibile fissare momento e posizione ad uno stesso istante e si vogliono studiare i propagatori da un punto all’altro dello spazio-tempo.

Tutto questo per dire. Esiste EP => QM. Esiste QM => HJ. Esiste QFT => HJ. Domanda. Esisterà EP => QFT? La cosa avrebbe grande interesse, visto che ci si lamenta sempre del fatto che QFT non ha un’assiomatizzazione decente.

April 20, 2009

Alexandr Andrianov ::: Advanced QFT ::: 1

Filed under: fisica fiscale

Appunti sparsi. Warning: non sono gli appunti della lezione, sono solo mie divagazioni.

1) [regolarizzazione] In meccanica quantisica vale il principio di indeterminazione, che afferma che variabili coniugate (per esempio, posizione e impulso di una particella nella stessa direzione spaziale) non possono essere misurabili simultaneamente con precisione arbitraria. Il principio di indeterminazione segue dalle relazioni di commutazione tra operatore posizione e operatore momento

 

E’ questo il formalismo della prima quantizzazione. Se la meccanica classica dei corpi studia sistemi con un numero finito di gradi di libertà, la teoria dei campi estende la descrizione a sistemi i cui gradi di libertà sono infiniti (i modi di un campo), per cui dovremo sostituire a q e p il campo e il suo momento coniugato e agli indici i,j indici continui x e y, eventi dello spazio-tempo in cui sono valutati i campi. Nella procedura di seconda quantizzazione si interpretano il campo e il suo momento coniugato come operatori e si impongono tra loro analoghe relazioni di non commutazione

 

Emerge fin da subito il problema di fondo della teoria dei campi: non solo non possiamo misurare simultaneamente il campo e il suo coniugato in un certo punto dello spazio-tempo, ma non potremo misurare nessuno dei due con precisione arbitraria, vista la singolarità della delta di Dirac. Questo fatto non è irragionevole: conoscere il campo in un punto significa conoscere con certezza arbitraria il punto stesso, che è un numero reale e quindi necessita di infinita informazione per essere univocamente determinato. Per poter trattare i campi in QFT bisogna procedere ad una loro regolarizzazione:

 

 

con f_\epsilon nucleo integrale opportuno che smussa le distribuzioni. In questo modo le relazioni di commutazione divengono finite  

 

La seconda procedura da effettuare è quella della rinormalizzazione, ovverosia prendere il limite \epsilon \to 0  in cui f e g tendano a due distribuzioni di Dirac, avendo cura che i risultati tendano effettivamente a qualcosa, ed eventualmente isolando le singolarità e riassorbendole nelle costanti di accoppiamento. Regolarizzazione e rinormalizzazione sono tecniche tradizionali della teoria delle distribuzioni. Queste equazioni sopra sono colpa mia, effettivamente non ho mai visto un approccio al problema della rinormalizzazione in QFT (che è un problema enorme, vastissimo) a partire da questo approccio di base. Di solito si procede tagliando le divergenze direttamente nei risultati dei calcoli, oppure, oppure discretizzando lo spazio.

(more…)

April 17, 2009

Il cammello simplettico e altre storie

Filed under: fisica fiscale

Il teorema di Gromov:

Il cammello simplettico non passa per la cruna dell’ago.

E’ un teorema piuttosto recente (metà anni ‘80) e poco conosciuto ai fisici, ma di grande importanza. La formulazione originale è leggermente più rigorosa (non ho neanche idea di dove si trovi nell’articolo, mi viene il mal di testa solo a sfogliarlo; non a caso ha vinto l’Abel prize quest’anno). Tuttavia il concetto è piuttosto semplice.

Simplettomorfismi

…tanto per usare un parolone. Le trasformazioni simplettiche (pensate al flusso di un sistema fisico hamiltoniano) preservano il volume nello spazio delle fasi. Intuitivamente, questo significa che il volume delle condizioni iniziali del problema di Cauchy della meccanica classica rimane invariato per evoluzione hamiltoniana: non si perde informazione per la strada.

Ma non è tutto qui. Le trasformazioni che lasciano invariato il volume sono quelle con determinante della jacobiana F uguale a 1 (e quindi l’elemento di volume è preservato dx’ = dx), mentre quelle simplettiche lasciano invariata la forma simplettica J:

(volume preserving)         

(symplectic)                  

Infatti mentre posso trasformare un compatto in un lungo spaghetto conservando lo stesso volume e facendo quindi "passare" lo spaghetto nella cruna dell’ago, comunque sia orientata questa cruna, lo stesso non può succedere per il cammello simplettico. La simpletticità è molto più forte della conservazione del volume, le due sono equivalenti solo per F in Sl(2,R) (gruppo simplettico di matrici reali 2 X 2). In uno spazio 2n-dimensionale, posso deformare simpletticamente i volumi quanto voglio, e posso schiacciarli ma rispettando l’area di certe sezioni particolari. E’ come se aveste un palloncino che pensate di poter schiacciare in tutti i modi che volete, e invece sospeso dentro il palloncino non vi eravate accorti che c’è un anello rigido che impedisce di comprimerlo nel piano individuato dall’anello.

Il teorema si chiama anche non-squeezing, e non ne ho trovata una dimostrazione semplice in giro. Ma il concetto si può intuire con un caso particolare e qualche immagine. Le variabili canoniche vengono in coppie coniugate:

 

Canoniche sono tutte le trasformazioni che lasciano invariate le parentesi di Poisson:

 

 

Prendiamo in considerazione le più semplici trasformazioni che preservano il volume: dilatiamo una variabile di un fattore a e contraiamo un’altra variabile di un fattore 1/a. Per esempio è simplettica la trasformazione:

ma non lo sono

anche se preservano il volume. Controllare le parentesi di Poisson per credere. Pertanto, non posso contrarre a piacere contemporaneamente entrambe le variabili coniugate. Ed ecco qua il nostro cammello (scusate le dimensioni dispari, ma quattro dimensioni proprio non ci riesco a visualizzarle):

La cruna dell’ago per cui vogliamo farlo passare è orientata lungo un piano di variabili non coniugate (asse nero / asse grigio) e pertanto si può comprimere a piacimento:

 

Se invece orientiamo la cruna nel piano individuato da due variabili coniugate (assi neri):

 

non c’è verso di schiacciarcelo dentro.

Il principio di indeterminazione

Variabili coniugate tali che tanto più piccola è l’imprecisione sull’una, tanto più grande quella sull’altra… vi ricorda qualcosa? Qualche fisico perspicace ha pensato bene che questo teorema potesse servire per fare una piccola incursione nella Meccanica Quantistica:

M A de Gosson, The Symplectic Came Principle and Semiclassical Mechanics
M A de Gosson, Symplectic Non-Squeezing Theorems, Quantization of Integrable Systems, and Quantum Uncertainty

L’idea è questa. Una trasformazione simplettica possiede altri invarianti oltre che il volume. Supponiamo di comprimere il cammello B più che possiamo fino a farlo stare tutto in un cilindro. La sezione del più piccolo cilindro in cui riuscite a schiacciarlo è detta capacità simplettica A(B) ed è un invariante per simplettomorfismi.

Ci sono molti fatti interessanti relativi a questo invariante. Per esempio, se considerate un compatto B, tutte le orbite periodiche C sulla superficie del compatto hanno azione maggiore della capacità simplettica di quel compatto

ed esiste almeno un orbita per cui l’uguaglianza è soddisfatta. Ora questa condizione ricorda molto da vicino la condizione di quantizzazione di Bohr-Sommerfeld, che conosco molto bene perché ha giocato un qualche ruolo nella mia tesina triennale:

Sembra tutto perfetto… fino a qui. I problemi interessanti arrivano adesso: i) da dove salta fuori la costante di Planck? ii) dove sta scritto che non posso prendere un compatto piccolo a piacimento? iii) e tutto il resto dello spettro? iv) ed il fatto che la regola di Bohr-Sommerfeld è semiclassica? Sono ansioso di leggere la soluzione a tutti questi problemi quando mi rendo conto, ad una prima occhiata, che negli articoli su esposti:

i) la costante di Planck è introdotta, così, senza una motivazione teorica

ii) viene postulato che non ci possano essere celle simplettiche con capacità inferiore a 1/2 h

iii) viene definito un sistema quantizzato quando una combinazione dell’azione e di un certo indice topologico (di Maslov) è intero

iv) la trattazione è inerentemente semiclassica

Così, a occhio e croce, mi sembra che si stia postulando un po’ troppe cose, la più grave delle quali è la quantizzazione (peraltro approssimata) dello spettro, che dovrebbe essere una predizione della teoria. Unico caso in cui tutto funziona bene: l’immancabile oscillatore armonico, che come ben noto è il sistema quantistico in cui l’approssimazione semiclassica è esatta (anche le equazioni del moto per i valori medi sono uguali identiche a quelle classiche).

Tuttavia ci sono tantissimi punti di contatto con la teoria dell’Equivalence Postulate che qui non racconterò, ma che valgono la pena di essere approfonditi.

Informazione e costante di Planck

Ma perché fermarsi quando si può sproloquiare ancora un po’ dilungandosi inutilmente? Delle varie assunzioni che de Gosson fa, quella più necessaria è quella sull’esistenza di un limite inferiore alla precisione sperimentale. La comparsa della costante di Planck è un fatto assolutamente misterioso, se non altro per motivi dimensionali, essendo indipendente da ogni altra costante, e deve essere assunta con contratto a tempo… indeterminato. Che l’informazione che uno sperimentatore può raccogliere su un sistema sia finita è un fatto del tutto ragionevole, se non altro per motivi di finitezza dell’hardware che raccoglie l’informazione, degli strumenti di misura etc. Ma la meccanica quantistica fissa questo limite superiore con una costante, e questo fatto non è intuitivo, perché classicamente uno può sempre pensare di migliorare la propria misura. Per esempio riducendo il rumore e quindi le interazioni con il sistema stesso. Rimarrà pur sempre il segnale necessario per captare il fenomeno, ma anche questo si potrà ridurre.

In meccanica classica infatti le interazioni infatti sono sotto controllo. Possiamo schermarle, bilanciarle, neutralizzarle. Tranne una. La gravità. Quella non si può schermare, e per quanto uno si ingegni, l’interazione gravitazionale che l’apparato sperimentale esercita sul sistema è intrinsecamente ineliminabile, perché la gravità non è una forza, ma è la forma stessa dello spazio-tempo, e quindi anche della posizione e impulso dell’apparato di misura e del sistema. Questa peculiarità della gravità mi fa pensare che, se deve esistere una spiegazione di stampo informazionista dell’origine dell’incertezza, questa debba necessariamente coinvolgere la gravità.

April 15, 2009

simplettico complettico

Filed under: fisica fiscale

Una lunga premessa per una domanda conclusiva.

La meccanica hamiltoniana vive in una varietà simplettica 2n-dimensionale in cui il ruolo della "metrica" è giocato dalla forma simplettica (mettiamoci ,in due dimensioni)

L’unità simplettica ha la proprietà

 

proprio come l’unità immaginaria, da cui il nome. I guppi simplettici Sp(2n), gruppi di matrici che rispettano la forma-volume simplettica, esistono di sole dimensioni pari. Ma siccome due gradi di libertà in R sono un grado di libertà in C, si può tentare di rendere l’analogia con l’unità immaginaria più spinta costruendo una rappresentazione complessa unidimensionale delle equazioni di Hamilton.

Rappresentazione complessa delle equazioni di Hamilton

Consideriamo un sistema classico caratterizzato da un’hamiltoniana H(q,p), q la posizione e p il momento del sistema, la cui evoluzione temporale sia determinata dalle equazioni di Hamilton

  ,    

Definiamo la variabile complessa

 

Perché questa definizione abbia senso bisogna che q e p abbiano le stesse dimensioni fisiche. L’hamiltoniana contiene sempre dei parametri con le dimensioni necessarie per trasformare opportunamente q e p. In seguito supporrò sempre che tutto sia adimensionale. La derivata rispetto a z, pensata come variabile indipendente da z*, risulta:

 

Le mie reminescenze di analisi complessa sono deboli. La seconda uguaglianza non è intuitiva ma è sicuramente standard. Qui la motivo con le seguenti considerazioni. Vale consistentemente (* indica coniugazione)

   ,   

e applicando la derivata a qualsiasi funzione che ammetta un’espansione in potenze di z e z*:

 

si vede che la definizione funziona bene.

Con queste definizioni possiamo riscrivere le equazioni di Hamilton molto sinteticamente

 

Finalmente mi sono tolto lo sfizio di vedere l’unità simplettica scritta come un’unità immaginaria. Preciso che non è nulla di straordinario. Semplicemente ho definito due vettori 1 = (1,0) e i = (0,1) e scritto le equazioni di Hamilton nella base individuata dai due vettori. Potrebbe essere interessante però vedere come trasformano le variabili di azione-angolo e che relazione hanno con i teoremi integrali sulle funzioni olomorfe.

Un esempio semplicissimo

L’immancabile oscillatore armonico assume una forma graziosa (anzi direi che questo formalismo è fatto su misura per l’oscillatore armonico, come in meccanica quantistica quando si definiscono gli operatori di creazione e distruzione)

 

Le equazioni di Hamilton risultano:

 

con soluzione

 

Parte reale e parte immaginaria obbediscono alle equazioni del moto:

   ,   

L’equazione di Liouville

Prendiamo ora in considerazione l’evoluzione di una qualsiasi funzione reale f(q,p). In meccanica hamiltoniana vale l’equazione di Liouville (supponiamo che H sia indipendente dal tempo):

 

In notazione complessa questa assume la forma

 

L’unità immaginaria in quantistica

Ecco è tutto qui. O quasi. Infatti è forte la tentazione di ridimensionare un po’ le cose, in tutti i sensi. Se continuiamo a considerare z adimensionale, ma con H un’energia e t un tempo, dovremo inserire una costante con le dimensioni di un’azione:

 

 

La prima equazione è reminescente dell’equazione di Schroedinger (o meglio quella di Heisenberg per l’evoluzione degli osservabili)

 

e la seconda dell’equazione di continuità della probabilità in Meccanica Quantistica. L’analogia con la meccanica quantistica si ferma qua. Ma. Mi domando. La comparsa dell’unità immaginaria in quantistica è un fatto un po’ misterioso che però tanto misterioso non è se si pensa che scende (letterarlmente) dalla trasformata di Fourier. Ciò non toglie che possa avere anche altra natura. Non potrebbe essere che l’unità immaginaria in Meccanica Quantistica non sia in qualche modo (che assolutamente non sarà il modo qui su esposto) intrecciata con la natura simplettica della Meccanica Hamiltoniana?

April 12, 2009

I disastri e il metodo scientifico

Filed under: fisica fiscale

Ho partecipato qui e alla discussione sul "caso Giuliani". Per quanto riguarda il terremoto, sono molto meno interessato al radon che non al cemento delle case dell’Aquila, molto meno interessato agli allarmi che non allo stato ordinario delle cose. Penso che uno dei drammi dell’Italia oggi sia la trasformazione di ogni problema in un allarme, in un emergenza, in qualcosa di eccezionale e inimmaginabile.

Mi interessa però la questione scientifica per i suoi aspetti metodologici.

Metodo galileiano e sistemi complessi

Ho letto discussioni sulla scientificità delle affermazioni di Giuliani e sulla sua autorevolezza. Parlare di metodo scientifico però in questo caso è azzardato, perché le scienze dei sistemi complessi come la geologia, la climatologia etc. non poggiano propriamente sul metodo galileiano. Manca un ingrediente fondamentale del metodo sperimentale, la replicabilità: gli eventi hanno condizioni al contorno diverse l’uno dagli altri, e la fisica del sistema spesso è molto sensibile alle condizioni iniziali. Inoltre gli eventi sono rari: anche fossero uguali, non sarebbe possibile fare una statistica tendente ad un valore centrale che assuma il valore di "fatto scientifico". Pertanto ogni proposizione intorno ai fenomeni complessi deve essere probabilistica.

Ma cosa vuol dire probabilistica? Per i frequentisti, la probabilità di un evento è proprio data da numero di casi indipendenti favorevoli, su numero di casi totali, e siamo da capo. Il giusto framework interpretativo per le scienze naturali è l’inferenza Bayesiana, per cui la probabilità è una stima a priori, umana, soggettiva, irrazionale quanto volete, che viene poi modificata e perfezionata in base all’esperienza. Tutti sappiamo che il lancio di un dado ha probabilità 1/6 di ogni outcome, ma nessuno di noi si è mai messo a tirare il dado migliaia di volte per controllare che fosse vero, ci siamo fidati di un’autorità (la maestra, i genitori) o di una ragionevole stima a priori, data l’evidente simmetria del sistema e una supposta equiprobabilità a priori (principio di Liebniz).

Pertanto, quando valutiamo la possibilità che Giuliani abbia ragione o torto stiamo già sbagliando. Giuliani avrà una certa autorevolezza e pertanto una certa probabilità di dire una cosa sensata, e il resto della comunità scientifica un’altra probabilità (sicuramente più alta). Nessuna certezza. Dopodiché dobbiamo chiederci se dopo l’evento la probabilità che le affermazioni di Giuliani abbiano vlidità scientifica sia aumentata o diminuita. Tutte le proposizioni dovrebbero essere corredate da probabilità e barre di errore. Per esempio: "in un raggio di 20 km da Sulmona ci sarà un terremoto con il 50% di probabilità, di intensità 4 più o meno 0.5". E si potrà dire "La previsione di Giuliani ha un 90% di probabilità di essere sbagliata" etc. etc.

Consiglio la lettura di questo interessante articolo di Valerio Lucarini sul metodo scientifico, di cui riporto l’abstract, che è illuminante: 

The intrinsic difficulties in building realistic climate models and in providing complete, reliable and meaningful observational datasets, and the conceptual impossibility of testing theories against data imply that the usual Galilean scientific validation criteria do not apply to climate science. The different epistemology pertaining to climate science implies that its answers cannot be singular and deterministic; they must be plural and stated in probabilistic terms. Therefore, in order to extract meaningful estimates of future climate change from a model, it is necessary to explore the model’s uncertainties. In terms of societal impacts of scientific knowledge, it is necessary to accept that any political choice in a matter involving complex systems is made under unavoidable conditions of uncertainty. Nevertheless, detailed probabilistic results in science can provide a baseline for a sensible process of decision making.

Quando si tratta di prendere decisioni, bisogna trasformare le probabilità in certezze, fatti, politiche. Per questo bisogna adottare principi non scietifici, come il principio di precauzione. E, se la probabilità di prevedere un terremoto è il 10%, è necessario far sgomberare le case tutte e dieci le volte.

Modelli e dati

In molte discussioni ho incontrato una fiducia estrema per il lavoro serio e pubblicato della comunità scientifica, e una descrizione di Giualiani come un amatore. Ho avuto un po’ fastidio per questa immagine della comunità scientifica come monolitica, coordinata, saggia incriticabile.

Cosa vuol dire fare scienza su un sistema complesso? Ci sono due strade. Si possono fare modelli teorici e applicarli a simulazioni numeriche più o meno raffinate, i cui risultati costituiscono il banco di prova "sperimentale". Il lavoro è sicuramente raffinato, capace spesso di fare affermazioni importanti su larga scala ma ovviamente inutilizzabili per lo studio della fenomenologia quotidiana. Bisogna capire che i modelli teorici non sono fatti per studiare e prevedere i singoli fenomeni catastrofici. Per esempio sapremo dire che il globo si scalderà di tot gradi nei prossimi anni, ma non se fra due settimane ci sarà un’improvvisa calura a Bologna. Non è una cosa che i modelli possono o vogliono fare. Per questo, è del tutto ragionevole che pur essendoci una spiegazione teorica del perché il flusso del radon è intomatico di sommovimenti della crosta terrestre, non ci siano modelli teorici in grado di valutare la prossimità di un terremoto. Stiamo cercando di estrarre dal modello troppa informazione.

L’altra via è di osservare, catalogare, studiare, imparare, ricordare tutto il possibile sul proprio piccolo orticello, e anche in mancanza di un modello teorico raffinato si potrà dire qualcosa di scientificamente valido, con una certa probabilità. Se si sbaglia la teoria non è falsificata, ma ne diminuisce la probabilità.

Per gli estimatori della "comunità scientifica che da anni studia il problema" vorrei far notare che la crisi economica non solo non è stata vista, ma anzi è stata addirittura nascosta dai modelli teorici e in un certo senso stimolata da un modo troppo allegro di interpretare questi raffinatissimi strumenti. Stiamo parlando del fior-fiore di un’intera comunità che si rietiene scientifica ma che scientifica, nel senso galileiano del termine, non è. Per cui avrebbero dovuto dire "il prezzo di questo prodotto derivato è tot, al 40%". Ma non potevano, perché oltre a essere comunità scientifica erano anche venditori di prodotti. Un cortocircuito simile è presente negli organi di ricerca statali, spesso troppo subordinati ad un modo di concepire la ricerca organica alla politica. Ad esempio, l’IPCC nelle scienze climatologiche. Ogni singolo pezzo di ricerca è di valore scientifico, ma manca una visione complessiva autenticamente scientifica, aperta, problematica, falsificabile.

Per capire la crisi economica imminente serviva togliersi il modello da sotto gli occhi e guardare un po’ di "fenomenologia" quotidiana. Ci voleva una brava massaia (e ce ne saranno state a migliaia) per capire che accettare di contrarre un mutuo senza avere i soldi per onorarlo è una pratica sbagliata. Alla faccia della "comunità scientifica".

April 7, 2009

metodo scientifico?

Voglio dare la mia opinione sull’intrigo scientifico che serpeggia nelle cronache dal terremoto, la vicenda della premonizione di Giuliani, tecnico INFN. Cercherò di fare solo considerazioni metologiche e non di merito, dato che non sono competente, aggiungendo e in parte contrapponendo la mia voce a quella di Leonardo e di Cattaneo. Ma vorrei premettere che la richiesta di scuse da parte di Giuliani a Bertolaso non mi sembra così scandalosa e che finora il comportamento di Giuliani non mi è sembrato troppo avventato, in fondo ha ricevuto dell’idiota da una persona che impiega le proprie forze e quelle della protezione civile per l’organizzione dell’inutile summit della Maddalena, come si evince qui (via piovonorane):

Il Capo del Dipartimento della protezione civile della Presidenza del Consiglio dei Ministri è nominato Commissario delegato e provvede al coordinamento di tutti gli interventi e le iniziative correlate al grande evento che si svolgerà dal 1° gennaio 2009 al 31 dicembre 2009; provvede altresì alla definizione ed all’attuazione degli interventi di realizzazione, di allestimento e adeguamento delle strutture presso le quali si svolgeranno le manifestazioni, collegate al Vertice del G8.

Cattaneo dice:

Giuliani spiega nelle interviste di oggi che il sisma era prevedibile, e che ieri sera lo vedeva anche dai sismografi. Perché non ha nuovamente lanciato l’allarme?

Forse perché una denuncia basta? Mi pare che ci siano le condizioni perché questa denuncia decada; il beneplacito del dubbio deve andare a favore anche di chi eventualmente provoca un allarme eccessivo sulla base di predizioni "scientifiche" incerte, e non solo per gli amministratori che sulla base della medesima incertezza non si preoccupano di mettere in sicurezza i cittadini.

Incertezza. Ogni predizione scientifica si accompagna ad una incertezza; sulla previsione dei terremoti tramite il rilevamento del radon evidentemente l’incertezza è talmente grande che la comunità scientifica ha sempre ritenuto il metodo inefficace. Tuttavia molti ipotizzano che il comportamento della comunità scientifica sia ideale, ma così non è, soprattutto quando la ricerca è condotta in organi non indipendenti e verticistici. Può ben darsi che un volgare tecnico che conosce il suo strumento alla perfezione, che ha avuto la pazienza di anni ed anni di osservazioni, tarature, normalizzazioni abbia qualcosa da dire. Negare a priori che ci possa essere una correlazione tra le misure di Giuliani e l’evento sismico è un’idiozia, e la comunità scientifica dovrebbe prendere atto che il metodo forse è da rivalutare. Se Giuliani si sbaglia, sarà comunque un contributo alla scienza, che progredisce grazie a quell’unica scoperta corretta ma anche grazie alle novantanove ipotesi sbagliate. Se le competenze di Giuliani si rivelassero fondate, forse una migliore applicazione, più estensiva, più accurata del suo metodo di presa ed analisi dei dati potrebbe migliorare la previsione ed evitare morti. Chiedere ad un tecnico di indovinare il giorno esatto e la locazione esatta di un evento che si colloca in un’attività costante mi pare eccessivo. Tenere aperta la porta all’incertezza in questo momento è anche un modo di evitare di essere troppo cinici.

Ci sono sempre margini di errore ed il metodo scientifico consente di stimarli. Purtroppo il metodo scientifico però fallisce per eventi, come quelli climatologici o geologici, per i quali non si possono studiare realizzazioni indipedenti del modello. L’evento accade solo una volta e non si verifica più con le stesse condizioni al contorno. Per questo, sia qualificare che suqalificare la previsione di Giuliani come scientifica o pseudoscientifica è sbagliato.

La politica dovrebbe però basarsi, oltre che sul metodo scientifico (giammai in Italia!), anche su altri principi, come il principio di precauzione. Se la scienza ti dice che ogni dieci previsioni di terremoto una si avvera, è sensato prendere precauzioni (magari non integrali) in tutte e dieci le occasioni. Mi sembra invece che da noi regni un certo fatalismo e sindrome del giorno dopo, o del senno di poi. Dell’articolo linkato da Leonardo, non mi sorprende tanto la notizia del falso allarme, quanto che

…lo sciame sismico che da metà febbraio ha trasformato questo angolo d’Abruzzo in una pista di rock and roll, con oltre 30 scosse di magnitudo superiori ai 2 gradi, scuole chiuse, malori, tetti pericolanti e gente sull’orlo di una crisi di nervi

Si intuisce che le cose sarebbero venute giù da un momento all’altro, bastava una scrollata un po’ più vigorosa. Capire il pericolo vuol dire rendersi conto che ci sono zone edificate male, pericolanti, sull’orlo del rasoio, sempre. Come lo sono la Turchia, la Grecia e gli altri paesi al nostro livello di sviluppo sociale ed economico. Prendere coscienza di questo fatto è doloroso. Ora è stato l’Abruzzo, ma provate a immaginare cosa potrebbe succedere, non per portare sfiga, in Calabria. Certo, mobilitare l’intera popolazione è eccessivo (secondo i detrattori di Giuliani parrebbe l’unico provvedimento fattibile a fronte di una "predizione"), ma ci sono molte altre misure che si possono prendere per minimizzare i danni. Allestire campi, fare controlli sulla condizione delle strutture, preparare un piano di evacuazione, istituire un osservatorio speciale, un segnale d’allarme etc. Quando Giuliani ha lanciato il suo allarme

è stato il panico: gente in strada con i materassi, parroci che hanno svuotato le chiese, famiglie radunate nelle palestre. Poi è passata la domenica. E pure il lunedì. La terra ha tremato ancora. Ma piccole scosse. Niente al confronto del «terremoto che non c’è».

update. Su Keplero leggo che

E una previsione è una previsione solo se è basata su un meccanismo compreso, spiegabile e riproducibile. Altrimenti, dovremmo chiedere scusa anche a quelli che ogni tanto azzeccano un oroscopo. 

A parte il fatto che il meccanismo per cui il radon si diffonde in precedenza di un terremoto è compreso e spiegabile, mi concentro sul riproducibile. Cosa vuol dire riproducibile per un evento raro? Non potrai mai riprodurre le stesse condizioni iniziali, non potrai mai avere una copia del sistema. Devi affidarti ad una certa fenomenologia più o meno accurata, che deve essere studiata sul campo. Oppure simulare con modelli ultrasemplificati di trasporto, frattura, conduzione etc. Un casino; non so in Giappone, ma dubito che in Italia la ricerca sia esauriente in materia.

Questo non vuol dire che l’orospoco sia affidabile, visto che non abbiamo un pregiudizio razionale sul fenemeno. Infatti solo i frequentisti riterranno che la probabilità di un evento sia numero di casi favorevol su numero di casi contrari. I bayesiani come me partono da una probabilità a priori, ragionevole, e la migliorano con l’esperienza. Nessuno ha mai tirato il dado milioni di volte per controllarne la frequenza, semplicemente diamo per scontato che per motivi razionali di simmetria la probabilità sia 1/6. Un oroscopo parte improbabile e peggiora in continuazione. Un evento raro con una spiegazione ragionevole che si verifica una volta su una, per quanto troppo poco, rende comunque più probabile l’ipotesi. E’ un fatto probabilistico, non ideologico.

Ci tengo a sottolineare che io sono un pedante sul metodo scientifico, ci tengo tantissimo; ma non si può parlare di metodo scientifico per le scienze complesse, non secondo il paradigma popperiano. Il fatto che larga parte della comunità scientifica dei fisici teorici (la créme) persegua un’idea palesemente antiscientifica come la teoria delle stringhe mi pare che dica tutto sull’affidabilità del sistema direzionale della ricerca scientifica.

April 3, 2009

lesson n.2

Filed under: fisica fiscale

Oggi ho tenuto la seconda lezione su dinamica e termodinamica della master equation, e prossimamente renderò pubblica una dispensina anonima. E’ stata una lezione piacevole, in cui ho coperto qualche buco lasciato nella precedente, fatto qualche esempio pratico ed integrato con un po’ di entropia che tira sempre un sacco.

Stamattina preparando la lezione mi sono accorto di un fatto molto semplice che rafforza alcuni sospetti che covo da tempo. La termodinamica della master equation si avvale di alcuni importanti risultati di teoria dei grafi, in particolare il concetto di albero, il teorema di Hill, il teorema di Kirkhoff e le basi di circuiti fondamentali. In particolare dato un grafo connesso, un albero è un insieme massimale di rami del grafo che collegano tra di loro tutti i vertici senza formare circuiti. Per esempio per il grafo a 6 verticie 7 rami

|X|X|

gli alberi sono

|\|\| ; |/|/| ; |\|/| ; |/|\|

|X/|  ; |X\|  ; |\X|  ; |/X|

|XX  ;  XX|

Sono grafi ad albero le reti idriche e i bacini idrografici.  Un circuito fondamentale si ottiene aggiungendo uno dei rami rimanenti ad un qualsiasi albero. Tutti i circuiti così ottenuti formano una base in termini della quale si possono scrivere tutti gli altri circuiti, e al variare dell’albero generatore si ottiene una base diversa.

L’applicazione alla meccanica statistica di non-equilibrio di questi concetti risiede nel fatto che certi funzionali valutati lungo i circuiti fondamentali hanno interpretazione come forze macroscopiche che mantengono il sistema in esame in uno stato stazionario lontano dall’equilibrio. Queste forze macroscopiche consentono di abbassare i gradi di libertà del sistema, passando da una descrizione microscopica (ramo per ramo) ad una descrizione macroscopica: tutta l’informazione sul sistema è contenuta nelle forze fondamentali. Questo è esattamente il mandato della meccanica statistica e della termodinamica: descrivere configurazioni microscopiche che sfuggono al nostro controllo, tramite opportuni potenziali termodinamici macroscopici ed eventualmente un principio di massima entropia (che ancora non esiste nel non-equilibrio).

La mia fissa è il passaggio al continuo. Sono sempre più convinto, come avevo accennato qua e qua, che passando al continuo tutta questa teoria si trasformi in una bellissima teoria di gauge (per fisici), o di coomologia (per matematici), ove il ruolo dei circuiti fondamentali è sostituito dai loop di Wilson (per fisici), o dalle olonomie (per matematici).

Mi conforta quest’osservazione. Per ottenere la teoria del continuo devo considerare reticoli, non grafi generici: un retiolo d-dimensionale posso vederlo andare, al limite di spaziatura infinitesima, in uno spazio continuo. Grafi più connessi corrisponderebbero a spazi con patologie topologiche. Come mi ha segnalato un commentatore, l’analisi non-standard potrebbe essere il giusto framework per dare un senso preciso alla mia procedura di limite. Io infatti considero soltanto transizioni a "primi vicini", e quindi mi immagino di definire la derivata come vero e proprio rapporto di infinitesimi, non come limite "per ogni epsilon esiste un delta". Se N è il numero di vertici (per unità di volume V), ogni albero contiene N-1 rami e pertanto rimangono (d - 1 )N + 1 rami con cui formare i circuiti fondamentali. La descrizione per forze macroscopiche diminuisce di uno la dimensionalità del sistema! Questa è una sorta di principio olografico, principio ipotizzato da ‘t Hooft che sostiene che la fisica nel bulk di un sistema sia descritta con gradi di libertà che vivono sulla (iper)superficie, e per il momento corroborato soltanto dalla dualità di teorie molto peculiari come AdS/CFT. C’è però nell’aria l’idea che il principio olografico sia un byproduct della nostra comprensione del mondo in termini di informazione ed entropia, e mi pare che questo abbia risonanza con l’invarianza di gauge e del teorema di Stokes. In particolare è abbastanza stupefacente che un risultato che dovrebbe fittare bene in questo quadro indiziario e che potrebbe tornare utile è un teorema di loop quantum gravity (sic!) sul fatto che la conoscenza di una base di loop di Wilson (invarianti di gauge) permette di ricostruire tutta la connessione di gauge.

Per cui fantastico di una connessione tra queste cose (ed ho sulla scrivania almeno un libro a riguardo di ognuna che attende invano la mia attenzione):

- teoria di grafi

- meccanica statistica di non-equilibrio

- processi stocastici continui (eq. forward di Kolmogorov)

- teoria di de Rham / gauge

- Yang-Mills su reticolo

- teoria dei loop / loop quantum gravity

- olografia

- teoria dell’informazione

- massima entropia

Un’altra domanda interessante potrebbe essere, molto più semplicemente (o forse no), che cosa diventano gli alberi in un passaggio al continuo? Integrali sui cammini in uno spazio dei cammini?

April 1, 2009

lesson n.1

Filed under: fisica fiscale

Ieri ho tenuto la mia prima lezione e domani terrò la seconda, un’opportunità del tutto eccezionale che cerco di sfruttare al meglio facendo sputare lacrime e sangue agli sventurati che subiscono le mie numerose digressioni. A partire dalla nota storica (la vicenda di Louis Bachelier e la scoperta del random walk), passando per il commento socio-economico (l’equazione di Black-Scholes e il suo ruolo nella crisi economica), la puntualizzazione logico-matematica (differenza tra teorema di Bayes e inferenza bayesiana) e le intuizioni fisiche (la celle convettive nelle pentole d’acqua) siamo, forse, riusciti ad accennare alla dinamica e termodinamica dell’equazione master, quindi stiamo parlando di processi di Markov a tempi continui su uno spazio degli stati discreto.

Sono partito con un compendio minimale di probabilità, la definizione di processo di Markov, l’equazione di Chapman-Kolmogorov e ho derivato l’equazione master. Poi conservazione della probabilità, chiacchiere sparse e finalmente un esempio, il random walk in una dimensione, con passaggio al limite del continuo in cui si ottiene la statistica del moto browniano (ottenuta calcolando la funzione generatrice dei cumulanti). Ho accennato al processo di Poisson e alle condizioni per cui esiste lo stato stazionario. Nella seconda ora mi sono concentrato sulla termodinamica, parlando in maniera molto sintetica e discorsiva della natura di equazione di conservazione per la probabilità della ME, introducendo le correnti e la nozione di equilibrio e bilancio dettagliato, enunciando il criterio di Kolmogorov e la sua analogia con la nozione di conservatività, e accennando a come si ottiene (con il teorema di Hill) un generico stato stazionario.

Domani faremo un’altra applicazione, quello dei processi di nascita e morte (ME in una dimensione con transizioni a primi vicini e spazio degli stati limitato in basso) che mi consentono di parlare ancora di equilibrio e bilancio dettagliato e di introdurre la relativa trattazione di campo medio, e come caso particolare propongo l’analisi dello stato stazionario di una semplice reazione chimica X <=> A, con X prodotto di reazione incognito e A chemiostato a concentrazione costante. Sono indeciso se approfondire la dimostrazione dell’esistenza dello stato stazionario per catene di Markov oppure fare un esempio pratico di stato stazionario di non-equilibrio per un semplice grafo a tre stati, oppure se introdurre il concetto di entropia di Gibbs e di correnti e affinità micro- e macro-scopiche.

Per esaurire quello che mi piacerebbe raccontare dovrei fare un corso, invece mi dovrò accontentare di queste quattro ore di lezione ricavate, ebbene si (poveri loro), nel programma di un corso di similazione numerica!

February 28, 2009

autopromozione

Filed under: fisica fiscale

S’è fatto parecchio rumore su Not Even Wrong, l’accurato blog di Peter Woit dedicato alla smitizzazione della teoria delle stringhe e affini, riguardo ad un ennesimo "caso" controverso di comunicazione/pubblicazione scientifica. Woit e commentatori si sono accorti che alcuni articoli di wikipedia sulla teoria di Yang-Mills, sulla teoria delle perturbazioni ed altri, sono stati editati con l’inserimento di paragrafi che contenevano materiali non tradizionali e non particolarmente di primo piano, frutto di ricerca recente, e soprattutto con referenze alla ricerca dell’autore stesso, contrariamente alle policies di wikipedia, in particolare quella sui contenuti originali e quella sul conflitto di interessi. Non linko da wikipedia perché le parti controverse sono state rimosse, ma le stesse pecche analoghi contenuti si possono trovare su Dispersive wiki e una fotocopia delle pagine inglesi, non ancora ripulita, su Wikipedia Italia. Infatti l’autore è uno scienziato italiano, il quale a giudicare dagli indirizzi appuntati sugli pubblicati su arXiv lavora indipendentemente da centri di ricerca (non che questo sia motivo di discredito). Su spires viene per taluni articoli ricondotto della Sapienza Università di Roma, ma ad ispezionare la rubrica interna del sito dell’università non compare; errore di Spires probabilmente. Costui lavora a teorie di gauge classiche (non stringhe, non supersimmetria), è un autore solitario,  è molto prolifico ed ha una tendenza un po’ spinta all’autocitazione, e a quanto pare anche all’autopromozione sulle pagine delle enciclopedie online. Tiene un blog in cui discute le sue idee, che ad un profano come me sembrano esposte in maniera molto seria. Non entro nella piccola battaglia che si è creata tra i fan di Woit e i fan del suddetto, con messaggi anonimi, censura di messaggi dall’una e dall’altra parte, attacchi personali grauiti e Einstein tirato per la giacchetta (che, se fosse vivo, il mio Einstein personale spalerebbe raffinata merda sulla teoria delle stringhe).

Non voglio dire niente di più di quanto uno può leggere in questi due blog, anche per evitare commenti disinformati e sgradevoli. E’ probabile che nei prossimi giorni la blogosfera reagisca sfornando nuove verità. Non voglio neanche aprire un discorso sull’accuratezza di Wikipedia (che uso regolarmente), a parte ribadire questo commento lasciato nel blog di Woit (non badate al cattivo inglese, è pensato in italiano):

A personal thought. I think scientific articles in wikipedia are both too technical and not enough. I mean: from a generalistic encyclopedia I would expect the articles to be accessible to laymen, at least in the first few sentences. From a specialistic encyclopedia I would expect rigour and carefulness. It seems to me that there is a sort of clash among opposite forces in Wikipedia that mediates these two positions with the result that articles are neither simple nor correct, and in the interstice anything can insert. Moreover, they almost never are fluent: different sections of an article are decorrelated one from another, there often is not a coherent development.

Voglio però riferire di un fenomeno curioso. Su Google Scholar, motore di ricerca per la ricerca (indispensabile), impostando come chiave il nome dell’autore, saltano fuori tutta una serie di articoli di cui lui e gli altri autori indicati dal motore non sono gli autori, e negli articoli i loro nomi non compaiono mai, neanche nella bibliografia. Questo fatto ovviamente non gli è certo imputabile, ci deve essere un errore del motore di ricerca. Mi pare un cosa abbastanza inspiegabile e che meriterebbe di essere risolta.

Update. Come prevedibile i toni si alzano. Si registra in particolare la discesa in campo di Motl, ed un nuovo post sul blog di Frasca, con una difesa della sua posizione. Mi colpiscono due frasi:

What would be Woit’s position if I am right?

In a very short time an eventual Woit’s error will be exposed. And by irony, Wikipedia’s entry will be updated with my ideas. Much better than now.

Mi sembra che si confondano due livelli di discussione: la correttezza delle idee e la correttezza della promozione di queste idee su Wikipedia. Non credo che Woit sia mai entrato nel merito della ricerca di Frasca, e non è quello il punto. Potrebbe anche essere ricerca avveniristica che conducerà ad un Nobel, ma se al momento non è ancora assimilata da una comunità scientifica non ha sede in Wikipedia. Un buon turning point potrebbe essere quello di aspettare che questi risultati e referenze siano collezionati in libri sulle teorie di gauge.

Il tono di queste frasi mi fa pensare che Frasca si senta come uno scienziato illuminato ma ignorato, in attesa del trionfo delle sue idee. Un’idea romanitica. Personalmente, tendo ad essere sempre molto scettico: è forte il pericolo che si tratti di millanteria. Sicuramente Wikipedia è un territorio inadatto per questa campagna di verità.

February 7, 2009

l’argomento diagonale di Cantor

Filed under: fisica fiscale

Oggi sono tornato brevemente a distrarmi con un po’ di fondamenti della matematica. Non avevo mai notato nelle precedenti peregrinazioni solitarie un argomento classico come l’argomento diagonale di Cantor, che è spiegato benissimo nel solito posto che non linko neanche. L’argomento di Cantor è una specializzazione ai numeri reali del fatto che l’insieme potenza di un insieme non può essere messo in relazione biunivoca con l’insieme stesso. Ovverosia, preso un insieme A, l’insieme P(A) di tutti i sottinsiemi di A è sostanzialmente più grande di A.

L’argomento di Cantor serve a dimostrare che i numeri reali, intesi come insieme potenza dei naturali, e quindi come insieme di tutti i numeri "con infinite cifre decimali", non è numerabile, ovverosia non è possibile mettere tutti i numeri reali in fila uno per volta.

Supponiamo quindi per assurdo che sia possibile enumerare i reali. Sarà quindi possibile enumerare i reali compresi tra 0 ed 1. Scriviamo lo sviluppo decimale di questi numeri in codice binario, come se dovessimo programmare un computer (cambiare base non cambia l’essenza del ragionamento) ed enumeriamoli. Ad esempio si può avere:

1)  0 1 0 0 1 1 0 0 1 …
2)  1 1 1 0 0 1 0 0 0 …
3)  0 0 1 1 0 0 1 0 1 …
4)  0 1 0 0 0 1 1 1 0 …
5)  1 1 0 0 1 1 0 1 0 …

 
Prendiamo in considerazione le cifre diagonali. Queste formeranno lo sviluppo decimale di un numero reale x compreso in [0,1]:

x = 0.01101 … 

Costruiamo ora un numero y scambiando nello sviluppo decimale di x gli 0 con 1 e gli 1 con 0: 

y = 0.10010 …

Questo è ancora un numero reale compreso tra 0 ed 1, e quindi sarà enumerato tra gli altri. Supponiamo che sia in posizione k.

1)  0 1 0 0 1 1 0 0 1 …
2)  1 1 1 0 0 1 0 0 0 …
3)  0 0 1 1 0 0 1 0 1 …
4)  0 1 0 0 0 1 1 1 0 …
5)  1 1 0 0 1 1 0 1 0 … …

k) 1 0 0 1 0             …     0 1 ? 1 0

 

Ora è facile convincersi che la k-esima cifra decimale di y e la k-esima cifra diagonale, ovverosia la k-esima cifra decimale di x, sono la medesima cifra. Ma sono anche cifre opposte, per definizione di y! Questo è un assurdo, quindi l’ipotesi è falsa: i numeri reali non sono numerabili.

Questo ragionamento è basato sul paradosso del mentitore:

io mento.

Se mento dico la verità, e se dico la verità mento. Si costruisce una variabile booleana i cui valori di verità sono interdipendenti. Lo stesso procedimento è alla base della dimostrazione del teorema di Goedel, in cui a partire da un insieme di assiomi sufficientemente forte da permettere la caratterizzazione dei numeri naturali si costruisce una proposizione della forma

questa proposizione non è dimostrabile. 

Se falsa, allora dovrebbe esserne dimostrabile la verità, il che è assurdo. Quindi è vera. Ma se vera, allora non è dimostrabile, e quindi esistono proposizioni con un valore di verità definito all’interno della teoria ma che la teoria non permette di dimostrare. Inoltre segue come corollario che la proposizione che esprime la consistenza della teoria assiomatica è falsa: ovverosia la teoria stessa non può garantire di non portare a risultati contraddittori.

- - -

Devo confessare di essere scettico nei confronti di questo argomento, come del fatto che non esistano modelli numerabili dei numeri reali. Non che non ci creda, è che non ne sono convinto, e finché non vedo non credo. Ma non sono pronto a sostenere delle tesi, ci devo ragionare (e studiare) un po’. Per quanto riguarda il ragionamento di Cantor, quello che è fallace è la caratterizzazione dei numeri reali come numeri "di infinite cifre decimali". Per specificare una quantità continua di tali numeri serve infinita informazione. Ma se ammettiamo che la logica tratti solo predicati finiti, il numero diagonale non è definibile, e quindi non è possibile sapere quale è la sua enumerazione. I corretti assiomi dei reali sono quelli di Dedekind, e la mia preoccupazione è che non sono sicuro che coincidano con la comprensione euristica di numero reale come numero di infinite cifre decimali.

February 1, 2009

moto browniano e discretizzazioni

Filed under: fisica fiscale

In questo meraviglioso articolo sul moto browniano non lineare Klimontovich chiarisce gli effetti fisici delle diverse interpretazioni dell’integrale stocastico, à la Stratonovich, à la Ito ed una terza interpretazione che lui chiama kinetic form. In particolare solo quest’ultima è consistente con la richiesta ragionevole che le particelle browniane tendano asintoticamente ad una distribuzione di Maxwell-Boltzmann, ovverosia una distribuzione di equilibrio canonico con una temperatura media mantenuta dal bagno termico delle particelle microscopiche. E’ proprio quest’ultima richiesta che forza una relazione di fluttuazione-dissipazione (diffusion-drift), una procedura di chiusura delle equazioni stocastiche di stampo fisico, assente nella trattazione generale dei processi stocastici*.

Il problema della trattazione di Klimontovich è che non chiarisce a priori l’interpretazione dell’equazione differenziale stocastica, ovverosia come è discretizzata. Ho quindi rifatto i calcoli. Consideriamo una particella browniana soggetta ad un drift dispari nella velocità e ad un rumore diffusivo:

ove W è un processo di Wiener.  L’interpretazione del differenziale stocastico è di Ito. Per passare da questa ad altre interpretazioni basta sommare al termine di drift un termine dipendente dalla derivata del coefficiente di diffusione, secondo le regole di trasformazione:

Ad esempio, l’interpretazione "end point" studiata in un recente post  si ottiene per \alpha = 1/2. L’equazione di Fokker-Planck per la distribuzione in velocità di singola particella si ottiene con un calcolo tradizionale e fornisce:

Sostituiamo ora (il fattore cinetico del)la distribuzione di equilibrio di Maxwell-Boltzmann:

Si ottiene la condizione

Questa è la relazione di fluttuazione-dissipazione cercata, che mette in relazione il coefficiente di diffusione con quello di deriva ed il coefficiente \alpha che contraddistingue l’interpretazione del differenziale stocastico. Vediamo che l’interpretazione "end point" semplifica quest’espressione fornendo la relazione di Einstein

generalizzata al caso in cui diffusione e deriva dipendono dal modulo della velocità. Una simile relazione si può ricavare senza dfficoltà nel caso multidimensionale. Ci sono ragioni indipendenti dal discorso fin qui affrontato per ritenere valide queste relazioni, ma questo è un argomento che dovrò approfondire. Pertanto l’esatta interpretazione del differenziale stocastico è quella "end point", e si scrive:

Ciò che Klimontovich chiama kinetic form corrisponde pertanto alla nostra interpretazione "end point", e un confronto più stretto mostra che anche le altre due interpretazioni coincidono. E’ in ogni caso curioso che questa interpretazione sia quella più adatta per una modellizzazione fisica, laddove essa appare come quella che "viola la causalità" nella maniera più radicale. Infatti "guardando infinitesimamente nel futuro" la discretizzazione cinetica fa seguire la causa alla conseguenza, ma tiene conto anche di un contributo di gradiente; quindi, in qualche senso che dovrei chiarire, ribaltando la prospettiva, il rumore sente sia lo stato della particella browniana sia la sua derivata prima.

Nota: in questo articolo la discretizzazione di punto finale viene chiamata convenzione isoterma. Presto una recensione.

Nota: in questo articolo invece pare che una procedura di discretizzazione di Stratonovich porti alla stessa equazione di diffusione cercata. Un po’ seccante.

* Forse anche l’equazione di Black-Scholes si può vedere come la chiusura di equazioni differenziali stocastiche rispetto ad una qualche relazione di fluttuazione-dissipazione?

 

January 28, 2009

end-point discretization

Filed under: fisica fiscale

Per motivi imperscrutabili ho avuto bisogno di un’interpretazione dell’integrale stocastico diversa dalle due più importanti, quella di Ito e quella di Stratonovich. Un integrale stocastico si definisce in maniera del tutto analoga all’integrale di Riemann, ovvero come limite di approssimazioni di "aree" di funzioni a gradoni:

Il differenziale però non è la variabile temporale, ma un moto browniano, ossia un processo stocastico markoviano con incrementi indipendenti distribuiti con statistica gaussiana:

ove \omega designa la particolare traiettoria nello spazio di probabilità sottostante, ed \alpha seleziona un punto tra \tau_k e \tau_{k+1}.

La convergenza della discretizzazione all’integrale stocastico è da intendersi in probabilità, ed il limite differisce a seconda di come si procede alla discretizzazione. Questo dà origine a diverse interpretazioni dell’integrale stocastico. Scegliendo di approssimare la funzione all’estremo inferiore dell’intervallo temporale si definisce l’integrale di Ito:

Un’altra importante discretizzazione è quella à la Stratonovich, di punto medio:

I due integrali hanno pregi e difetti, e la scelta di come interpretare un’equazione differenziale stocastica dipende dalle condizioni fisico-matematiche che rendono l’una o l’altra preferibile. L’integrale di Ito ha il vantaggio di essere una martingala e di essere più adatto alla computazione. L’integrale di Stratonovich è agevole per calcoli analitici ed è più adatto ad essere applicato su varietà. Il primo rispetta la causalità, il secondo "guarda" nel futuro; tuttavia risulta che il secondo è fisicamente più sensato a modellizzare situazioni in cui il rumore non è perfettamente bianco, ma dipende anche dalla storia del processo (ma dovrò studiare meglio il rumore colorato). Questo rende l’integrale di Stratonovich apparentemente più adatto, ma nel nostro caso, in cui siamo interessati a tener conto di un certo lag tra protocollo sperimentale e risposta del sistema, rimaniamo con la formalizzazione di Ito.

Nel contesto dei teoremi di fluttuazione, è centrale il concetto di inversione temporale di una traiettoria. Per questa ragione può essere utile introdurre una nuova procedura di discretizzazione, "invertita" temporalmente rispetto a quella di Ito, per fare in modo che anche le traiettorie inverse subiscano un’azione causale consistente. Ha senso quindi definire

Il nostro scopo è di trovare una semplice procedura per passare da una discretizzazione à la Ito ad una discretizzazione end-point. Con pochi passaggi l’integrale end-point si dimostra essere in relazione con l’integrale di Ito secondo

   (1)

ove [dfdW] seleziona in termini con differenziale di ordine dt = (dW)^2 (quest’ultima relazione è data per scontata). Definito l’integrale end-point è possibile introdurre un differenziale stocastico e la generica equazione differenziale stocastica

     (2)

Data la relazione (1) e il differenziale (2), si ha

Pertanto il processo soddisfa l’equazione differenziale stocastica di Ito

     (3)

Quest’ultima relazione fornisce la regola di trasformazione del drift che consente di passare da una interpretazione end-point di un’EDS ad una interpretazione di Ito.

January 23, 2009

Additività ed estensività /2

Filed under: fisica fiscale

Come promesso [qui] abbiamo letto l’articolo When is a quantity additive, and when is it extensive? di Hugo Touchette. Sostanzialmente non si distacca da ciò che avevamo anticipato, ma ci sono un paio di puntualizzazioni da fare. Touchette parte spiegando che la motivazione per un articolo così elementare è una certa confusione nella letteratura che riguarda le entropie non-additive di Tsallis. Introduce poi il concetto di additività come da noi fatto, e pertanto un dubbio rimane. Se parliamo di una grandezza additiva come di un potenziale H(x,y) tale che

dobbiamo dire che cosa è H(x) . Per esempio, i gradi di libertà x e y hanno valori nello stesso spazio degli stati? E in che senso H(x) ha la stessa forma di H(x,y)? La cosa è chiara quando si tratta dell’entropia, ma la definizione rischia di essere tautologica nel caso dell’energia. Forse si dovrebbe parlare di additività semplicemente quando la funzione H(x,y) è la somma di due contributi Q(x) e P(y), ossia se le variabili sono separabili. In meccanica quantistica, questo succede se le relative autofunzioni sono fattorizzabili. Un concetto che Touchette chiama pseudo-additività. Debbono necessariamente P e Q avere la stessa forma, e x ed y assumere valori nello stesso spazio? Pare che non sia necessario, per cui vale la pena generalizzare. Un simile discorso è implicito per quanto riguarda l’entropia. La condizione

sembrerebbe assumere che x e y assumano valori nello stesso spazio ed abbiano la medesima distribuzione di probabilità, ma questo non è necessario. Basta intendere

Pertanto saremmo per l’abolizione di queste distinzioni che dal punto di vista matematico paiono un po’ forzate.

Un secondo punto importante, su cui abbiamo peccato, è che non è affatto vero che l’additività implichi l’estensività. Infatti uno può facilmente scrivere una successione 

che diverge più velocemente di n, ma questo dipende dal fatto che l’ennesimo termine diverge all’infinito o va a zero perché lo stato ennesimo si sceglie in un luogo singolare o banale dello spazio degli stati, il che è un caso fisicamente irrilevante. Quando parliamo di energia, per esempio, presumiamo che questa sia finita per ogni sottosistema anche nel limite termodinamico.

Quanto alle entropie non-additive di Tsallis, sono queste anche non-estensive? In effetti parrebbe così. Ricordiamo che da quanto discusso nella scorsa puntata l’entropia è estensiva perché le distribuzioni statistiche crescono combinatoriamente con n, cosa che si verifica in fisica a meno che non ci siano forti soppressioni dello spazio degli stati. Vadiamo come si comportano le entropie non estensive:

Per un combinatorio p(x) = a^{-n} (lancio congiunto di n dadi con a facce) si ha

che nel limite termodinamico cresce esponenzialmente per q < 1 e decade esponenzialmente per q > 1 (per q=1 si ottiene la solita entropia). Non ho fatto il conto in altri casi, ma presumo che sia un comportamento universale. Pertanto queste entropie sono veramente non-additive ed anche non-estensive.

Additività ed estensività

Filed under: fisica fiscale

Additività ed estensività di una funzione di stato (un potenziale termodinamico) sono proprietà diverse che vengono spesso confuse, come da me fino ad oggi. Un articolo di Touchette [qui], che mi ripropongo di leggere e commentare presto, è dedicato a delineare le differenze e ad analizzare vari casi in cui i due concetti non coincidono. Provo a precedere questa lettura con alcune considerazioni personali.

Siano x,y i gradi di libertà microscopici di un sistema ed H una funzione di stato. L’additività è una caratteristica piuttosto stringente per cui, partizionando il sistema in due (o più) componenti, la funzione di stato del sistema totale risulta pari alla somma delle funzioni di stato dei sottosistemi

Per esempio, è una funzione additiva l’energia se i due sottosistemi non sono tra essi interagenti, ma se già è accesa una piccola interazione l’additività è violata, perchè ai due termini su indicati si deve aggiungere un termine di interazione. Notare come questa definizione valga purché esista una funzione energia ben definita sull’uno e sull’altro sottosistema, altrimenti perde di significato. Similmente, è additiva l’entropia di Gibbs

ove p è una misura di probabilità, se le variabili aleatorie x e y sono indipendenti, ossia se le probabilità di x condizionata al verificarsi di y ne è indipendente e viceversa:

Per il teorema di Bayes si ha pertanto

In sostanza l’additività richiede che i due sottosistemi siano almeno approssimatamente isolati l’uno dall’altro, indipendenti, e pertanto ognuno dei due sia di fatto descrivibile separatamente. Una modellizzazione fisica triviale. Un concetto più utile è invece l’estensività. Si considera in questo caso una collezione di N stati microscopici e si richiede che per N molto grande (il cosidetto limite termodinamico) la densità della funzione di stato per grado di libertà converga ad una costante:

    (1)

Se agganciamo ad N il volume (nello spazio degli stati, o nello spazio fisico) il significato dell’estensività è che il potenziale termodinamico cresce come il volume, ed effetti "a cavallo" tra diversi settori del sistema crescono meno velocemente del volume. L’additività implica l’estensività, ma non viceversa.  Casi in cui vale la seconda ma non la prima sono i sistemi fisici con interazioni a corto raggio, ad esempio un gas con sole interazioni collisionali per cui N è dell’ordine del numero di Avogadro ≈ 10^23 particelle per mole. Aumentando il numero di particelle e proporzionalmente il volume disponibile, oppure dividendo il sistema in celle (ma facendo attenzione che queste contengano sempre un numero abbastanza grande di molecole), l’energia d’interazione a cavallo tra celle cresce solo come l’area e quindi è negligibile rispetto all’energia interna ad una singola cella, proporzionale al volume. Il sistema è estensivo, ma non è additivo. Esempi invece di sistemi fisici per cui non vale l’estensività sono quelli con interazioni a lungo raggio, come l’interazione coulombiana tra cariche dello stesso segno (per evitare effetti di screening) oppure l’interazione gravitazionale, che per la sua natura attrattiva dà origine a comportamenti apparentemente contraddittori con la comprensione elementare (e sbagliata) della termodinamica. Per questi sistemi in verità non è neanche chiaro come si debba fare una partizione.

(more…)

January 21, 2009

Dissipazione e cifre significative

Filed under: fisica fiscale

In fisica classica (= non quantistica) l’evoluzione deterministica di un sistema isolato è descritta dal flusso

di un’equazione differenziale, ove x sono le condizioni iniziali. Il sistema può essere hamiltoniano (conservativo) o non-hamiltoniano (dissipativo) a seconda che sia conservato o non sia conservato il volume nello spazio delle fasi, nonchè l’energia. Spieghiamo. Gli stati iniziali si considerano campionati da un insieme di stati possibili, ognuno con una certa probabilità \rho(x), la quale evolverà "trascinata" dalla dinamica del sistema. Con F^\ast indichiamo l’azione indotta da F su questa distribuzione

Siccome il sistema è deterministico, date le condizioni iniziali gli evoluti sono automaticamente determinati. Pertanto la misura di probabilità "seguendo" l’evoluzione di un certo insieme qualsiasi X di stati deve mantenere lo stesso valore:

Questa è di fatto una definizione. Equivalentemente si impone che \rho^t sia una misura normalizzata per ogni tempo t. Per sistemi conservativi, il teorema di Liouville assicura che l’elemento di volume nello spazio delle fasi è conservato:

Cioè la misura di probabilità rimane sostanzialmente la stessa, non deve neanche sforzarsi di seguire gli stati nel loro vagabondare. Inoltre come conseguenza si ha l’equazione di Liouville, che non è altro che un’equazione di continuità per la densità di probabilità:

ove D_t è la derivata totale rispetto al tempo. Quest’equazione afferma che la probabilità che esce da una parte se ne deve entrare dall’altra. Ponento x^t=x const. si ha banalmente

il che esprime quanto detto prima, ossia che la distribuzione di probabilità non varia nel tempo, come d’altra parte non varia l’energia.

Tutto ciò ha una interessante interpretazione in termini di informazione ed entropia. E’ definita l’entropia informativa (o di Gibbs-Shannon) S come

Si può mostrare in maniera semplice che questo funzionale positivo (nonostante il segno meno) della densità è costante per un’evoluzione hamiltoniana e varia per un’evoluzione non-hamiltoniana. Infatti si ha

ove J_t è il modulo del determinante jacobiano del cambiamento di variabili x \to F^{-t}x, che per una dinamica hamiltoniana è pari ad uno per la conservazione del volume nello spazio delle fasi. Se il determinante jacobiano non è nullo ma strettamente maggiore di 1 vi è dissipazione, aumento di entropia, e diminuzione dell’informazione. Come si può vedere questo?

Contrazione significa minor capacità risolutiva degli strumenti fisici. Nonostate il sistema sia deterministico, per cui è sempre possibile, note le equazioni del moto, mappare ogni insieme di stati avanti e indietro nel tempo come si desidera, tuttavia se ammettiamo che l’insieme degli stati sia noto con una certa approssimazione dovuta alla grossolanità dei nostri strumenti fisici, tanto più saranno concentrati gli stati tanto meno saremo in grado di ricostruire da quale insieme iniziale di stati provenivano, come ben mostrato in figura:

 

Per un matematico questo ragionamento di stampo fisico può dare fastidio, ma se ne può fare uno analogo. Gli stati sono caratterizzati da numeri reali, solo una quntità numerabile dei quali sono descrivibili con un’informazione finita. La maggior parte dei numeri reali richiedono infinita informazione per essere caratterizzati (pensate alle infinite cifre decimali senza regolarità). Tanto più le traiettorie sono contratte, tante più cifre significative avranno in comune i numeri reali che le rappresentano. Supponendo di disporre solo di informazione finita, si comprende come la contrazione determini l’irreversibilità delle traiettorie e l’aumento dell’entropia. 

January 16, 2009

simmetria ed informazione

Filed under: fisica fiscale

Ok, è solo una stupidatina, un pensiero en passant. Che cos’è una trasformazione di simmetria? Si tratta di una trasformazione che lascia invariata la dinamica del sistema e si manifesta nell’invarianza della di un lagrangiana, un’hamiltoniana etc. sotto una certa trasformazione. Insomma se osservo una certa quantità cambiare in una certa trasformazione, allora il sistema non è simmetrico, e viceversa. Quindi, senza bisogno di portarci dietro il concetto di hamiltoniana, dato un sistema ed un certo numero di osservabili macrosocpici (torneremo su questo) del sistema una simmetria è una trasformazione che lascia invariati i valori che questi osservabili assumono (e da qui il teorema di Wigner in MQ). Quindi la simmetria ha a che fare con il concetto di informazione sul sistema, e quindi di entropia, i quali sono pure concetti dipendenti dalla scelta dell’osservabile che si sta considerando. In breve:

una simmetria è una trasformazione che preserva l’informazione

In meccanica hamiltoniana preservare l’informazione vuol dire preservare il volume nello spazio delle fasi e quindi avere determinante jacobiano in modulo uguale ad uno. Il flusso hamiltoniano di un sistema isolato, per esempio, preserva l’informazione e quindi è una trasformazione di simmetria (traslazione temporale, conservazione dell’energia). Su questo argomento torneremo, specialmente sul concetto di entropia apparente e di cosa si intenda per sistema e per ambiente.

January 12, 2009

Gravitation and thermodynamics

Filed under: fisica fiscale

[warning: great amount of entropy and little information following. premise: bad english writing. disclaimer: no scientific accuracy. synopsis: just personal considerations, which will probably change in time]

There’s some discussion over the web (here, here, here and here) about thermodynamics and gravitation, a discussion that comes out regularly. I think some takes on the argument are confused, as well pointed out by The Statistical Mechanic. Many among cosmologists and string theory phenomenologists are trying to make sense of expressions such as "growth of entropy", "low entropy states", "loss of information" and fanciful "boltzmann’s brains", "manyworlds", yet knowing little about the basic principles of SM (Statistical Mechanics, not Standard Model!). And it must be said that little is known about TD and SM in General Relativity and for far-from-equilibrium systems, both of which are relevant for cosmology (yes, they both are). I happen to know a little about non-equilibrium, having worked on fluctuation theorems for my graduate thesis, where I strongly focused on interpretational and foundational issues.

(more…)

January 3, 2009

Energia e tempo /3

Filed under: fisica fiscale

[disclaimer: quanto segue sono speculazioni e domande dell’autore, senza nessun valore scientifico o didattico]

[][] Mi dirò ora cosa quale penso che sia il requisito fondamentale della direzionalità del tempo: il fatto che l’energia abbia uno "spettro limitato in basso", o equivalentemente prenda valori su una semiretta. In parole povere: l’energia di un sistema (che a priori può essere negativa, per esempio negli stati legati) non può essere infinitamente negativa: da qualche parte deve avere un minimo assoluto. Una condizione necessaria, peraltro, perchè acquisti senso il principio euristico della "minimizzazione dell’energia". Queste considerazioni dovrebbero inserirsi in un più generale quadro teorico-speculativo per la comprensione del significato fisico delle simmetrie dello spazio-tempo.

Antefatto

In genere l’energia di un sistema è data: tramite la lagrangiana, tramite l’azione, posta uguale a en. cinetica + potenziale, quantizzata da un’analogo classico, etc. consistentemente con i requisiti che la specifica teoria impone. Si scopre poi che in tutti gli approcci considerati l’energia è una grandezza dinamica coniugata alla variabile cinematica tempo, in vari modi che vedremo.

L’energia di un sistema è data, non ci si chiede mai "che cos’è l’energia di un sistema?" partendo da principi primi più generali, ma si stabilisce che "l’energia del sistema è questa". Per cui non ha molto senso chiedersi a priori che valori possa assumere l’energia: di caso in caso lo spettro è noto. Le considerazioni che seguiranno invece si dovrebbero adattare ad un quadro più generale, in cui l’energia non è data a priori ma determinata a posteriori con certe caratteristiche; un quadro che al momento non esiste, e di cui non parlerò, ma che dovrebbe implementare consistentemente la relatività ristretta e quella generale, in cui la forma del tensore energia-impulso è severamente vincolata.

Vi propongo ora un brevissio compendio delle ragioni per cui tempo ed energia sono variabili coniugate.

Simmetrie e conservazioni

Uno dei grandi paradigmi della fisica del ‘900 è la corrispondenza tra simmetrie e leggi di conservazione. In poche parole: se un sistema fisico possiede una certa simmetria, per esempio è invariante per rotazioni, nel senso che non ci sono punti di riferimento che ci permettano di distinguere una direzione privilegiata dello spazio (lo spazio è isotropo), allora puoi star sicuro che ci sarà una grandezza fisica che si conserva nel tempo: in questo caso, il momento angolare. Si generano così coppie di grandezze cinematiche/dinamiche coniugate: posizione-quantità di moto, angolo-momento angolare, tempo-energia, fasi-cariche. Ad una simmetria della prima corrisponde la conservazione della seconda.

Il significato "fisico" del teorema di Noether che sottende a questo femeno mi è rimasto sempre piuttosto oscuro. Non è affatto evidente perchè una simmetria debba dare vita ad una conservazione; ho intenzione di dedicare a questo problema un post prossimamente.

Indeterminazione tempo-energia

In meccanica quantistica variabili coniugate obbediscono alle relazioni di Heisenberg. Per esempio famosissima è

che afferma che non possiamo misurare con precisione infinita momento e posizione di una particella, e che tanto più precisa è la misura dell’uno tanto più imprecisa è quella dell’altro. Meno famosa è la

che tuttavia è meno rigorosa da un punto di vista formale, visto che in meccanica quantistica il tempo non è un operatore (questo articolo affronta e risolve il problema). L’esatta interpretazione di quest’ultima è più sibillina: deve valere, visto che in relativià speciale tempo ed energia sono trattati alla stregua di spazio e momento. Di questo erano coscienti Einstein e Borh. Ma come diceva Lev Landau: "To violate the time-energy uncertainty relation all I have to do is measure the energy very precisely and then look at my watch!". La relazione viene impiegata  a livello eurisitco in molti casi pratici in cui acquisisce un significato rigoroso. Un esempio lo svilupperò in futuro, stay tuned!

Infine è ragionevole pensare ad una relazione di indeterminazione angolo-momento angolare. In effetti questo articolo sembra riempire il vuoto, anche se non ci ho dato un’occhiata.

[Una domanda interessante è se simili relazioni possano scendere, fuori dal formalismo quantistico, direttamente da un principio di finitezza dell’informazione e da considerazioni sulle simmetrie, con la costante di Planck in qualche modo avente ruolo di unità di informazione (di entropia). Anche a questo vorrei dedicare un post in futuro, dopo aver letto articoli come questo e questo]

L’energia come generatore delle traslazioni temporali

Più rilevante per le nostre considerazioni è il fatto che l’hamiltoniana (l’energia) è il generatore dell’evoluzione temporale, nel senso che se F è una funzione delle posizioni e dei momenti una traslazione infinitesima nel tempo genera una proporzionale traslazione infinitesima della funzione secondo

ove le parentesi sono di Poisson nel caso della meccanica hamiltoniana e sono commutatori (fratto i\hbar) in meccanica quantistica. Vale anche

L’evoluzione infinitesima indietro nel tempo ha come generatore meno-l’hamiltoniana (il che non equivale a invertire le equazioni del moto*). Equivalentemnte, se definiamo t’ = -t il tempo crescente, la dinamica nella sua direzione è generata da -H. Quindi abbiamo inversione del tempo = inversione dello spettro dell’energia. In fisica classica, e quindi in meccanica quantistica, abbiamo però un metodo univoco per determinare la direzionalità del tempo. Infatti, se prendiamo in considerazione la forma abituale dell’hamiltoniana

ove il potenziale dipende solo dalle posizioni relative delle particelle del sistema, osserviamo che, mentre una rotazione delle coordinate spaziali non modifica il valore dell’energia, un cambio di segno dell’energia è ben visibile, perchè modifica la sua espressione; la forma dell’hamiltoniana non è invariante per inversione temporale.

*Se chiamiamo J l’operatore di inversione temporale, che inverte il segno dei momenti e mantiene le posizioni, e T(t) l’operatore di traslazione, si ha

 

La relatività e le antiparticelle

Mentre in fisica classica il tempo è il parametro che determina la relazione d’ordine causale tra gli eventi, in relatività ristretta si possono compiere trasformazioni di sistema di riferimento che mischiano tempo e spazio; una relazione d’ordine può essere stabilita ma in maniera più elaborata. La differenza sostanziale tra tempo e spazio è che si possono prendere sistemi di riferimento spaziali che invertono gli assi coordinati, e quindi il segno delle componenti della quantità di moto, ma non si può compiere una trasformazione di sistema di riferimento che inverta il segno del tempo, e quindi il segno dell’energia. In un certo senso, che spiegherò in futuro, momento ed energia sono le grandezze che ci consentono di "vedere" lo spazio ed il tempo: il fatto che la seconda sia definita su un semiasso di "dice" che il tempo fluisce in una sola direzione. Ma quale? In relatività l’una e l’altra sono del tutto equivalenti, perchè le prescrizioni causali vengono imposte a posteriori. La freccia del tempo ha a che vedere con le condizioni iniziali di sistemi statistici di particelle, non con il singolo evento sul "palcoscenico" dello spazio-tempo. Infatti, a differenza che in fisica classica, energia e momento sono trattati su uno stesso piano:

Ad esempio in elettrodinamica bisogna imporre la causalità definendo quale è il potenziale ritardato e quale è avanzato. Similmente, in QED, la teoria quantistica dell’elettrodinamica relativistica, si hanno apparentemente soluzioni con energia positiva e negativa: le seconde sono interpretate come antiparticelle di energia positiva che si muovono in avanti nel tempo; ma per il teorema CPT si possono del tutto consistentemente interpretare come particelle di energia negativa che si muovono indietro nel tempo.*

Stabilita la direzione del tempo ed un segno dell’hamiltoniana, questa e quello rimangono fissi. La ragione di questo fatto è sfuggente.

*Stiamo qui escludendo la possibilità che esistano dei tachioni, particelle con quadrimpulso di tipo-spazio, o equivalentemente particelle con massa immaginaria, che viaggiano ad una velocità spaziale più veloce di quella della luce.

Quale minimo

L’energia deve avere un minimo, ma quale minimo? Un sistema legato in fisica classica può avere energia negativa, mentre in relatività ristretta l’energia è almeno uguale alla massa del sistema. D’altra parte la massa del sistema è determinata dall’energia interna del sistema, e l’energia non è altro che la carica dell’interazione gravitazionale. La massa-energia di un sistema dipende da quale livello di raffinazione (coarse-graining) di un sistema si vuole assumere, e si dovrebbe ricavare da una procedura di rinormalizzazione, e quindi è un concetto osservativo, termodinamico, come lo è l’entropia […]

Sunto

Energia e tempo sono grandezze coniugate, come lo sono la quantità di moto e la posizione. Direzionalità del tempo e segno dell’hamiltoniana sono intimamente legati. In fisica classica, il segno dell’hamiltoniana individua automaticamente la direzione del tempo causalmente consistente, mentre in relatività ristretta esistono due modelli consistenti, uno con energia negativa ed uno con energia positiva. La possibilità di scegliere sistemi di riferimento spaziali orientati a piacimento permette di concludere che il momento può assumere valori simmetricamente rispetto a 0. Il fatto che gli eventi obbediscano ad una prescrizione causale, quale delle due essa sia, vincola necessariamente lo spettro dell’energia ad essere definito su un semiasse? In che modo? Esistono risultati in MQ che legano la struttura del gruppo delle traslazioni temporali con lo spettro dell’hamiltoniana? In che modo tutto ciò si lega al principio euristico della minimizzazioe dell’energia?

December 28, 2008

Energia e tempo /2

Filed under: fisica fiscale

Complessità computazionale

[Il presente è liberamente tratto da qui]

I teorici della computazione studiano quanto tempo e memoria siano necessari per far girare algoritmi che trovino o controllino la validità di una soluzione ad un dato problema. Tante sono le categorie di problemi; i teorici della computazione cercano di catalogarli a seconda che richiedano risorse ragionevoli (di tempo e memoria) o nel caso in cui non siano efficienti. A seconda di precise distinzioni matematiche i problemi matematici si dividono in varie classi di complessità. Ad esempio con "P" si intende l’insieme dei problemi per la risoluzione dei quali è noto un algoritmo che, dato un qualsiasi input iniziale espresso in n bits, trova una soluzione in tempo polinomiale, ossia in un tempo non più lungo di n^k per qualche k intero. In quanto segue sostituirò la parola "polinomiale" con la parola "ragionevole", come contrapposte a "esponenziale" o "esagerato", e fregatevene dell’esempio.

Esempio. Per fare un prodotto "in colonna" tra due numeri di massimo n/2 cifre dovete moltiplicare ogni cifra del secondo per ogni cifra del primo, un compito che richiede un numero di passaggi proporzionale ad n^2, dovete sommare i risultati e i riporti opportunamente incolonnati, un compito che richiede un numero proporzionale ad n passaggi. La moltiplicazione di due numeri qualsiasi è un problema di classe P.

Un’altra classe importante è la classe "PSPACE". Mentre i problemi di classe P sono risolubili in un tempo ragionevole, i problemi di classe PSPACE sono risolubili utilizzando una ragionevole quantità di memoria. E’ chiaro che tutti i problemi risolubili in un tempo ragionevole occupano solo un ragionevole spazio su memoria: la classe PSPACE include P. Ma è vero il viceversa? Posso sempre risolvere in tempo ragionevole un problema che richiede quantità ragionevole di memoria?

Non-riutilizzabilità del tempo

I teorici della computazione congetturano che PSPACE sia sostanzialmente più grande di P, ed il motivo dovrebbe risiedere nel fatto che la memoria può essere cancellata e riscritta, mentre il tempo va avanti inesorabile. Il tempo non è riutilizzabile, la memoria si, sempre che contenga informazioni non più necessarie per proseguire; quindi posso ottimizzarne l’utilizzo. Ora da un punto di vista fisico la memoria sarà supportata da un hardware esteso nello spazio: è così che arriviamo a concepire la differenza tra tempo e spazio di cui abbiamo parlato nella precedente puntata: io posso tornare in istanti diversi nello stesso posto, non posso essere nello stesso istante in diversi posti.

E se invece il tempo fosse riutilizzabile? Scott Aaronson e John Watrous hanno mostrato recentemente che se facciamo in modo che il tempo sia riutilizzabile le due classi diventano banalmente equivalenti. E’ questo che loro prendono come indizio per sostenere che tempo e spazio devono essere sostanzialmente diversi, se crediamo che la teoria della computazione non sia solo un’enorme banalità. Come si può tornare indietro nel tempo (ovviamente da un punto di vista puramente matematico-speculativo)? Beh un modo è di pensare che si possa semplicemente invertire il fluire del tempo quando si preferisce, così come è possibile invertire la propria direzione di marcia. In questo caso abbiamo risolto il problema della non-riutilizzabilità del tempo, che diventa nient’altro che un’altra identica dimensione spaziale, e quindi risulta ovvio che le due classi siano equivalenti. In maniera meno ovvia, si può ipotizzare di poter tornare indietro nel tempo come con una macchina del tempo, compiendo cicli, sfruttando "curve temporali chiuse" che tornano su se stesse e permettano di "rivivere" un precedente istante e di utilizzarlo in altra maniera. Per essere rigorosi bisogna che questo viaggio indietro nel tempo sia consistente, cioè che non si creino paradossi del tipo "uccido mio nonno" o cose del genere.

Aaronson e Watrous hanno mostrato che se esistono queste curve temporali chiuse contenenti quantità ragionevoli di tempo, allora il tempo diventa una risorsa esattamente equivalente allo spazio come riserva di memoria e PSPACE = P. In questo caso, inoltre, la computazione classica e quella quantistica risultano equivalenti.

December 26, 2008

presentire il futuro?

Filed under: fisica fiscale

 

La lunga digestione del pranzo di Natale è stata eccessivamente efficace nell’ottundere la mia coscienza e lenire la mia razionalità. Solo stamattina svegliandomi mi sono reso conto, come reduce da una colossale sbornia, di un comportamento vergognoso tenuto la sera prima: l’esser rimasto incollato alla televisione a guardare Voyager, ipnotizzato da quel impudente millantatore di Giacobbo. Non mi dilungherò in un vaniloquio sul perchè il servizio pubblico non dovrebbe rendersi reo di produrre e trasmettere simili stronzate.

Ieri sera Voyager parlava, tra uomini-falena ed extratterrestri sempre all’ordine del giorno, di intelligenza collettiva, e di influenza di eventi futuri sul presente. Dell’argomento mi ero interessato anche recentemente per via della comparsa di articoli totalmente deliranti sull’arXiv, da parte di un fisico una volta serio che deve aver perso la testa. Il fatto è che eccezionalmente oltre che i soliti giornalisti specializzati in occultismi vari, erano intevistati due ricercatori, apparentemente seri. Uno di Princeton, ed uno dell’università in cui mi sono laureato, Padova. Evidentemente sotto effetti ipnotici ho preso nota dei loro nomi per indagare. L’italiano è uno psicologo; e già il fatto che sia psicologo ci dice che non stiamo parlando di scienza, ma di fiction: aggettivi, non numeri. Inoltre solo per il fatto di aver partecipato a Voyager dovrebbe essere marcato con infamia nel mondo accademico, fine ultimo di ogni scienziato rivoluzionario: poter dire di essere stato incompreso e allontanato dall’accademia. Ma forse era in buona fede e non sapeva di cosa si trattava. I suoi attuali progetti di ricerca ruotano intorno all’intuito e l’anticipazione di eventi futuri, e si può anche collaborare con alcuni test che vanno dalla previsione dei numeri del lotto alla lettura della mente di una persona cara. Per partecipare bisogna passare attraverso una lunga trafila di domande, che vanno da domande su possibili esperienze extresensoriali tipo telepatia, telecinesi etc., domande su stati alterati della percezione, ma anche domande più flessibili relative a sensazioni, sogni etc. Apprendo che alcune di queste domande servono per assegnarmi un punteggio sulla scala Tellegen [qui], che misura una proprietà detta assorbimento, in pratica la sensibilità di una persona all’ipnosi: una scala numerica basata su domande tipo "a volte senti la tua coscienza abbracciare l’Universo?". Comunque avendo compilato il questionario con sincerità devo aver ottenuto un punteggio Tellegen piuttosto basso, fuori dal loro campione prediletto, quello delle persone con assorbimento > 20. Un loro precedente lavoro infatti si basa su un campione piuttosto ridotto (50 persone) composto da simili mitomani.

Partecipo alla lettura anticipata dei numeri del superenalotto: scrivo i miei numeri, dopodichè un non meglio specificato algoritmo provvederà a mettere insieme tutte le previsioni dei partecipanti e a produrre una sequenza di numeri. La sequenza verrà confrontata con quella del monopolio. Aggiornamenti a presto…

Ora io non voglio criticare questi articoli sulla base di preconcetti antipsichici o psicologici che non ho. Sarà interessante vedere quanti numeri del lotto saranno azzeccati, ammesso che si riesca a raccogliere un campione statistico tale da poter fare un confronto sensato con le probabilità ordinarie. Noto solo che ad esempio l’articolo succitato presenta un’analisi dati piuttosto scarna, con un campione ridotto e delle barre d’errore enormi… quasi ogni conclusione si può trarre da simili analisi, considerato che anche analisi ben più approfondite possono essere malleabili (vedi il caso della Hockey Stick). Inoltre in questo tipo di esperimenti spesso ci sono bias, anche involontari, da parte dell’autore o dei soggetti, che tendono a shiftare i risultati nella direzione desiderata. Quello che però mi infastidisce è che per dare dignità a queste ricerche parapsicologiche si ricorre a suggestioni malposte dalla fisica, ovviamente pescando sempre dalla mitica e bistrattata Meccanica Quantistica, che viene presa dagli ambienti culturali più disparati e interpretata e piegata a proprio piacimento. Già si è vista la teoria dei campi in azione in fenomeni tipo la memoria dell’acqua, il fondamento pseudoscientifico dell’omeopatia.

Il cosidetto "modello teorico" per queste teorie è contenuto in un intervista al parapsicologo Dean Radin. Subito una chicca: Radin contesta i critici delle "scienze psichiche", osservando che non potendo avere conoscenza di tutto quello che succede nel mondo e di tutte le ricerche altrui basano i loro pregiudizi sull’ignoranza. Peccato che le scienze basate sul metodo scientifico prevedono che l’onere della prova si a carico dei proponenti della teoria, e che l’autorevolezza di queste teorie sia basata sulla quantificazione. Come in giurisprudenza si è innocenti finchè non si è provata la colpevolezza, così nelle scienze, le cose non esistono finchè non si è provata la loro esistenza, "oltre ogni ragionevole dubbio". E’ vero comunque che la comunità scientifica ostacola l’instaurarsi di nuovi paradigmi, e quindi può darsi che la "teoria" di Radin sia uno di quei casi di scienza di primo livello, provata e comprovata, seppellita dall’estabilishment accademico: bisogna sempre essere prudenti.

Le suggestioni di Radin sono comunque ben informate, e fino ad un certo punto hanno senso: il cervello non è contenuto tutto nella testa, i fenomeni elettromagnetici all’interno del nostro corpo fanno si che ci siano continue correlazioni con l’ambiente e il mondo esterno, insomma siamo un sistema aperto a flussi di energia elettromagnetica ed informazione. Il passaggio da sistemi isolati a sistemi aperti è un paradigma che si sta imponendo in tutte le branche della scienza, ad esempio nella genetica, a contrastare un certo riduzionismo basato su assiomi semplici ma limitati (come le leggi della genetica). Il problema è che il passaggio da qui, l’entanglement, la decoerenza, le correlazioni a lunga distanza, a là, i fenomeni paranormali, è un salto troppo grande e viene fatto con una leggerezza sorprendente. E’ questo il motivo per cui una teoria non deve parlare per metafore e per aggettivi, ma per numeri: il modello deve mostrare che ci sono meccanismi che permettono di trasmettere informazione coerente, e non semplicemente che il nostro cervello è immerso in un rumore bianco; e deve fare previsioni sperimentabili e univoche, in modo tale che la teoria sia falsificabile. Voglio dire: è vero che i fotoni prodotti dal mio cervello e assorbiti dal cucchiaio davanti a me possono essere entangled, ma qualcuno deve spiegarmi come è possibile da questo trasmettere un’informazione coerente ed eventualmente generare una forza per piegarlo questo benedetto cucchiaio, e deve dirmi se si piegherà a destra oppure a sinistra e di quanti gradi. Può anche darsi che teorie quantitative prima o poi nasceranno, che sia solo una questione di tempo. Non bisogna essere prevenuti. Ma non venitemi a dire che i fenomeni paranormali hanno una spiegazione fisica.

Ora posso dirvi quello che sicuramente non può essere in base alla fisica finora nota. E’ vero che l’entanglement crea correlazioni non-locali, ma è anche vero che non può trasmettere informazione. L’entanglement permette la trasmissione istantanea di una chiave di lettura per un messaggio già corrisposto. In crittografia: prima mando la lettera cifrata per posta ordinaria, poi mando il codice con il teletrasporto. Per questo è impossibile che un fenomeno emergente macroscopico come la lettura della mente possa verificarsi in virtù dell’entanglement: non posso trasmettere informazione nuova. Secondo: le forze necessarie per generare fenomeni cinetici negli oggetti macroscopici sono ordini di grandezza superiore al momento che i fotoni prodotti dal mio cervello possono trasferire. Terzo: nessuna teoria sperimentata della fisica permette reperimento di informazione dal futuro, e qui non c’è entanglement che tenga. Quello che può invece succere è che io intuisca lo svolgimento delle cose in base ai dati a mia disposizione: se vedo un vaso delicato cadere so che si frantumerà. Allo stesso modo, in un esperimento di previsione di un suono bello o brutto, è possibile che dopo parecchi tentativi il mio corpo abbia imparato a percepire gli impulsi elettrici che precedono l’emissione di simili suoni dalle macchine e quindi ad "anticiparli", pavlovianamente. Sono sicuro, al 100%, che se l’evento è abbastanza ritardato non ci sarà intuizione di "eventi futuri random".

E per finire, i miei numeri del lotto: 5,15,16,54,84,87, da giocare sulle ruote di Molfetta e Mestre.

Update: i miei numeri sono diventati quelli ufficiali del sito, essendo evidentemente stato l’unico partecipante. Comunque ne ho beccato uno su sei. Non male!

December 24, 2008

Energia e tempo /1

Filed under: fisica fiscale

Sul blog del teorico della computazione Scott Aaronson [qui] è comparso un bell’articolo in cui egli spiega perchè il tempo è diverso dallo spazio, dalla sua particolare prospettiva scienifica. Ora vi chiederete "ma che razza di problema è questo?". Tempo e spazio sono chiaramente diversi, almeno dal punto di vista percettivo. Ma spogliamo il tutto dal concetti soggettivi come "percezione", "misura" etc. e dalla "freccia del tempo" che si ritiene essere individuata dall’aumento del disordine, che a sua volta è determinato dalla dinamica dei corpi (come il moto di un corpo influisce sugli altri). Consideriamo il problema su un piano cinematico, rappresentando lo spazio-tempo come un palcoscenico su cui sono collocati gli eventi. E ci chiediamo, ammesso che questo spazio-tempo esista indipendentemente da ciò che gli succede sopra*, che caratteristiche deve avere perchè la fisica abbia un senso. Per esempio: spazio e tempo debbono essere intrinsecamente diversi?

Lo spazio-tempo

La domanda è sorta nella storia della fisica teorica del XX secolo quando con la Relatività Speciale di Einstein si scoprì che spazio e tempo si mescolano, tanto da far pensare che il tempo non sia che un’altra dimensione spaziale. Vediamo in che modo. In fisica classica l’unità di lunghezza invariante (uguale in tutti i sistemi di riferimento che sono in moto relativo rettilineo ed uniforme, altrimenti detti inerziali) è data dalla distanza tra due oggetti (applicando il teorema di Pitagora in tre dimensioni):

 

ove x,y,z sono le coordinate spaziali. Due osservatori in moto relativo rettilineo uniforme usando ognuno il proprio righello misureranno dello stesso oggetto la medesima lunghezza. In Relatività Speciale l’unità di misura invariante è data dall’intervallo:

ove t è la coordinata temporale e c è la velocità della luce. Osservatori che si muovono di moto reciproco rettilineo ed uniforme misurano con righello e cronometro diverse distanze ed intervalli di tempo, ma lo stesso intervallo. Ciò che è tempo per uno per l’altro diventa spazio e viceversa, ma tempo e spazio, pur mescolandosi, sono trattati in maniera sostanzialmente diversa: vedete quel segno meno davanti al tempo? Quello fa in modo che esista una nozione di passato e futuro, esista una causalità, una relazione d’ordine parziale tra eventi, e che eventi del futuro non possano influenzare quelli del passato. O meglio, esiste un modello interpretativo coerente della Relatività Speciale in cui gli eventi del futuro non influenzano quelli del passato. E’ questa una necessità? Possiamo costruire teorie in cui spazio e tempo sono veramente la stessa cosa e che hanno come modello interpretativo una fisica coerente con una nozione di tempo sottoprodotto macroscopico, pura illusione?

Alcuni ritengono che sia proprio così: ad esempio Stephen Hawkings sostiene che "il tempo è immaginario", in due sensi: allusivo e matematico. Vediamo perchè il secondo: affinché nella formula dell’intervallo il tempo sia trattato alla stessa stregua delle altre variabili bisogna che prenda un segno + al posto del -; cioè vogliamo definire un tempo fisico "tau" che sia in relazione con il tempo "percepito" tramite

La soluzione di quest’equazione coinvolge l’unità immagianaria i, quel numero che elevato al quadrato dà -1; per questo il tempo sarebbe matematicamente "immaginario". Spesso vengono in fisica studiate teorie (dette euclidee, contrapposte a quelle con geometria di Minkowski) in cui la grandezza invariante è proprio simmetrica rispetto a spazio e tempo

 

In queste teorie il tempo è un’altra dimensione spaziale e si ipotizza che la causalità sia un fenomeno emergente, cioè non presente a livello fondamentale ma che si ingenera a livello macroscopico.

Di altro avviso è Aaronson, e l’autore di questo post (a seguire…).

- - -

*Dico "se esiste" perchè ci sono affascinanti prospettive legate agli sviluppi di Loop Quantum Gravity che vedono l’esistenza stessa e la forma dello spazio-tempo dipendenti dalla presenza e dalle interazioni di oggetti: lo spazio ed il tempo sono solo concetti "relazionali", che non esistono a priori. Altre concezioni prevedono che il tempo non esista, ma sia soltanto percepito da un osservatore cosciente. Non preoccupiamoci di queste paranoie: non bisogna che il nostro concetto intuitivo di spazio-tempo sia fondamentale; basta che ad un qualche livello di descrizione della realtà sia un buon paradigma.

 

December 18, 2008

metabolismo

Filed under: fisica fiscale

Un indovinello di fisiologia spiccia, che nasce dall’interrogativo: "quanta massa corporea si porta via l’attività fisica?". Riformulata: secondo voi, quanta parte della massa che immettiamo nel corpo sottoforma di cibo e liquidi e aria viene espulsa? In altre parole, se supponiamo che un uomo si pesi in un certo momento e di nuovo al termine di un lungo periodo di tempo (mettete un anno), risultando sostanzialmente dello stesso identico peso, e raccogliamo tutti le emissioni in quel periodo (gas, liquidi, solidi), la massa degli scarti risulterà uguale a quella del cibo, acqua ed aria mangiati bevuti e respirati in quell’anno?

(more…)



Get free blog up and running in minutes with Blogsome
Theme designed by Helga Cleve and widely (wildly)
rearranged by matteoeo (sorry helga!)