Month: May 2007

Rescaling boxplot with R

R è un software fenomenale, ed i grafici di R sono eleganti, belli e soprattutto informativi. Ma non è di questo che voglio parlare.

Scenario: Avete dei dati di tipo quantitavo, tipo delle frequenze e volete visualizzarli per capire come sono distribuiti. Ovviamente vi serve un modo per farlo.

Quello che volete è un box plot. 🙂

Importing data:

Con R importare un set di dati separati da tab come questi:

term freq
nitrite/creatinine 2
irration 3
nmole/mumole 4
asid 5
hydrocorphin 6
gln74 7
sidegroups 8
perispindle 9
procline 10
airtract 11
na2autm 12
dptp99a 13
mbmass 14
sr233377 15
pyrocarbon 16
antiamoebin 17
sh3px1 18
thr50 19
visioning 20
swgdam 21

è abbastanza semplice:
data <- read.csv(file="nome_file", sep="t")

ora se volete visualizzare i dati basta dare un
data
e tutti i vostri dati saranno visualizzati. Se sono troppi per essere visualizzati tutti insieme, le funzioni head() and tail() Potranno esservi utili.

Ora volete plottare i vostri dati in un box plot. Come fare?
boxplot(data$freq, main="Medline frequent term")
ed automaticamente vi si aprirà una finestra dove ci sarà il vostro grafico. Da notare che abbiamo indicato la colonna numero 2 (quella delle frequenze) usando l’intestazione :). Very handy.

plot ex 1

Tuttavia come vedete, le frequenze dei dati sono molto differenti tra loro, quindi un plot con una scala diversa potrebbe essere + interessante. Come?
plot <- boxplot(data_t_1$freq, col="lightblue", ylim=c(1,50000))

plot ex 2

Il boxplot prende, come scala, un vettore ylim=c(1,50000).

Se volete vedere le stats del vostro grafico, sono tutte dentro l’oggetto plot

> plot
$stats
[,1]
[1,] 2.0
[2,] 2378.5
[3,] 6203.0
[4,] 20226.0
[5,] 46960.0
attr(,"class")

...

Ryan Air: low cost = low luggage

La Ryan Air è abbastanza simpatica come compagnia per due semplici motivi:

  1. vola su Ancona da Cambridge
  2. se prenoti 2 mesi prima un giorno infrasettimanale non costa troppo.

Tuttavia è anche una compagnia completamente bastarda dentro:

  1. Ti dà la possibilità di comprare bagagli extra, facendoteli pagare 7 € in + l’uno (si anche il primo).

Ti metti l’anima in pace e prendi 4 bagagli, che in fondo torni a casa e devi portarti con te tutte le valigie. In questo lazy saturday t’arriva una mail dalla stessa ryan air che ti dice il tuo numero di prenotazione e tutta la sfilza delle cose che non può fare/portare/pensare se sali su un aereo.

L’occhio ti cade (in questa e-mail formato HTML schifosissima) su questa frase:

Customers may purchase up to 5 items of baggage per person. Please Note: That the total Checked Baggage Allowance per person is 15kg irrespective of the number of items of baggage purchased per person.

E’ ridicolo
Puoi anche acquistare 5 bagagli ma tutti insieme non possono superarare 15 Kg. E’ una presa in giro.
Questa sarà ovviamente scritto in corpo 4 da qualche parte sulle condizioni di viaggio, ma è realmente una cosa che mi ha fatto girare seriamente ….

Ora devo trovare un modo per spedire queste cose in Italia, ed ovviamente i primi preventivi fatti non fanno ben sperare.
uff….

The evil plan is working: Dell vende ubuntu

Oramai è una notizia vecchia (ha un giorno 🙂 ma dell vende i pc con ubuntu .

Oltre a notare la fenomenale gif sulla pagina di ubuntu.com, mi sono messo a configurare due pc:

Notebook:

My Components
PROCESSOR Intel® Core™ processor DUO processor T2350 2MB Cache/1.86GHz

OPERATING SYSTEM Ubuntu Edition version 7.04

LCD PANEL 15.4 inch Wide Screen XGA Display with TrueLife™(glossy)

MEMORY 1GB DDR2 SDRAM at 667MHZ, 2 DIMM

HARD DRIVE 80GB 5400rpm SATA Hard Drive

OPTICAL DIVE 8X CD/DVD Burner (DVD+/-RW) with double-layer DVD+R write capability

My Accessories
BATTERY OPTIONS 85 WHr 9-cell Lithium Ion Primary Battery

WIRELESS CARDS Intel PRO/Wireless 3945a/g

My Service
WARRANTY AND SERVICE 1Yr Ltd Warranty and Mail-In Service

ENVIRONMENTAL OPTIONS Recycling Kit and Plant a Tree for Me

ALSO INCLUDED WITH YOUR SYSTEM
VIDEO CARD Intel® Graphics Media Accelerator 950
SOUND OPTIONS Integrated Audio
Processor Branding Intel Centrino Core Duo Processor

Prezzo: 805$ = 597.31€

Desktop (solo il tower, no monitor)

My Components
PROCESSOR Intel® Core™2 Duo Processor E4300 (1.8GHz, 800 FSB)

OPERATING SYSTEM Ubuntu Desktop Edition version 7.04

MONITORS No Monitor

MEMORY 2GB Dual Channel DDR2 SDRAM at 667MHz- 2DIMMs

HARD DRIVE 250GB Serial ATA Hard Drive (7200RPM) w/DataBurst Cache™

OPTICAL DRIVE 16x DVD+/-RW Drive

VIDEO CARD Intel® Graphics Media Accelerator 950

SOUND CARD Integrated 7.1 Channel Audio

My Accessories
SPEAKERS No speakers (Speakers are required to hear audio from your system)

KEYBOARD & MOUSE No Keyboard

FLOPPY & MEDIA READER No Floppy Drive Included

My Service
WARRANTY AND SERVICE 1Yr In-Home Service, Parts + Labor – Next Business Day

ENVIRONMENTAL OPTIONS Recycling Kit and Plant a Tree for Me

ALSO INCLUDED WITH YOUR SYSTEM

Keybord Dell® USB
Mouse Dell® 2-button USB mouse
Network Interface Integrated 10/100/1000 Ethernet
Miscellaneous Award Winning Service and Support
MODEM No Modem

Prezzo: 545$ = 404.39€

Si, sono i prezzi da lancio promozionale in the USA. Ed il problema è che non li spediscono fuori dagli Stati Uniti.

Cmq per chiunque volesse dare una telefonata a Dell Italia

Io una telefonata la faccio 😉

Ubuntu pc worldwide from Dell

Qui c’è l’ ideaStorm dove votare se volete PC con ubuntu preinstallata venduti worldwide e quindi anche in Europa.

Io ho votato per promuovere l’idea.

Se ho la sicurezza che sul mio prossimo portatile c’è solo hardware compatibile con Linux, mi sembra chiaro che la scelta è presto fatta.

Ritorno di fiamma

La Microsoft vuole fare causa a Linux (GNU e pare anche openOffice.org e a qualcun altro sicuramente ma ancora non si è capito chi), ma e c’è un ma:

  1. non vogliono + fare causa perchè hanno paura
  2. c’è una marea di gente che si è iscritta qui dicendo che facciano causa anche a loro.

Inoltre su groklaw c’è un articolo che dice che la Microsoft ha distribuito dei coupon senza la data “di scadenza” e che, con qualche mossa da avvocato, rende non valido qualsiasi brevetto loro abbiano.

Da notare che cmq questo è e rimane solo FUD. Aspettiamo tutti il famoso “lancio della sedia” di Ballmer.

Ovviamente fiduciosi

divisioni and holy war

Sembra che quest’estate (si, voglio andare in vacanza e dico già che è estate) la moda è Beagle vs Tracker 😉

Sembra che la contrapposizione dalla blogosfera italiana si stia spostando anche su quella internazionale:

http://thomas.apestaart.org/log/?p=482 .

Sono due progetti diversi:

Beagle indicizza tutto l’indicizzabile (+ o – bene, ma quello è riconducibile all’estrattore dedicato a quello specifico mime-type e non al programma stesso. Poi se crasha l’estrattore e tira giù tutto beagle… bè questa è un’altra storia)

Tracker è un metadatabase ed un indicizzatore. (sorpresa: sono diversi).

Beagle è scritto in C# e dovrà sempre lanciare una macchina virtuale per indicizzare e prendere vagoni di RAM (ed io le cose le cerco una volta ogni 4 giorni… e buttare 24/28 Mb così a gratis non mi sembra il caso), Tracker soffre di tutti i problemi di un progetto giovane e sta un pò sulle palle per default…. 😉

Tracker manca della libreria per gli sviluppatori ed integrare tracker in una applicazione ora come ora è un pò incasinato e non supporta il mondo.

Serve il tempo e Tracker è più giovane di Beagle, è sviluppato attivamente (grande diff tra la 0.5.4 stabile ora e quello che è in svn e sarà 0.6) e potrà essere la chiave di volta per GNOME e Linux.

Vedremo, io dico solo che bisogna aspettare e vedere come và a finire.

Ah, e giusto un appunto: io non ho il computer della NASA e non posso buttare vagonate di RAM per un affare che dovrebbe stare in angolo, fare il suo lavoro.

Posso capire se vagoni di RAM li usa ECLIPSE o un altro IDE o un gioco. Non un indicizzatore che dovrebbe trovare le cose.

Io tifo per Xesam, così dopo il motore di indicizzazione sotto è indifferente e la libreria sarà condivisa da tutti i motori di ricerca.

P.s.: Ringrazio tutti quelli che leggono la pagina di tracker e si accorgono che i supporti e-mails sono solo sulla SVN e non sulla stable di tracker ora disponibile e non scrivono “tracker è una merda perchè non trova le mail” usando la versione che nn ha il supporto delle mail. 😉

Alè le Bluè

Nuovo governo francese:

  • dimezzati i ministeri (solo 15)
  • tre ministeri chiave (e non il classico “pari oppurtunità” alle donne)

E’ vero che parafreasando i Led Zepplin

“There ‘s a lady that is sure

All that glittering is gold…”

non tutto quello che luccica è oro, però sembra realmente differente la marcia con cui è partito il governo Francese.

Speriamo faccia bene, e lavori per l’identità europea (io spero in Francia e Germania… L’UK sono sempre stati filo-americani, la Spagna gioca un pò per gli affari suoi).

L’italia? ._.

Ricerca scientifica in Italia: migliora?

Secondo questo articolo uscito su Nature in Italia si starebbe modificando il criterio di selezione dei ricercatori.

L’idea è introdurre il merito invece che utilizzare il numero di anni spesi sotto l’ala protrettrice del professore-barone (o professoressa-baronessa).

Vedremo. Sicuramente l’Italia ha la sua risorsa nel capitale umano, da secoli. Se venisse creata una struttura per fare ricerca che abbia le caratteristiche di essere:

  1. al passo con lo stato dell’arte
  2. capace di portare novità serie al contributo mondiale
  3. avere la strumentazione, i mezzi e la  serietà per far bene

sicuramente il piano potrebbe riuscire.

Manca la volontà politica e la ricerca scientifica viene vista dalla magigor parte della gente come uno spreco di soldi. Bisogna cambiare questa idea.