Category: bioinformatica

SincUThink — Interview with the developer

SyncUThink unofficial logo

So SyncUThink is a tool to synchronize all the papers that you have on CiteUlike with the one that you have on your computer.

The developer is one of my friend and I manage to get an interview for this blog. So enjoy.

Mattions: Hi Greg, Why you don’t introduce yourself to our readers?
Greg: Hi, my name is Greg Jordan, and I’m a new Ph.D. student at the European Bioinformatics Institute in Hinxton, Cambridge. I’ll be working in the area of biological sequence analysis, though I’ve just started, so who knows where I’ll end up.

Mattions: So, why did you start to write SyncUThink?
Greg: I’ve always been a bit frustrated by the process of finding, organizing, and exporting citations when writing papers while at University. So when a friend recently showed me CiteULike, I sure liked!

But I also like to save paper and read things on my computer. So, this tool simply automates what I got tired of doing: finding PDFs for articles stored in my CiteULike library. I’m also a bit of a nut for user interfaces, so I used this program as a test to see how quickly I could “whip something together” as a Java applet.

Mattions: That’s pretty clever and useful to keep everything on sync. So how long did it take to get out the v 0.1?
Greg: I started on Monday afternoon, and by Wednesday I had something working fairly well.

Mattions: Wow, that’s really fast :). Do you want to develop it further?
Greg: Not really. I created the program because I wanted something to automate a very specific and simple task that found myself doing lots of recently (finding and downloading PDFs for reading journal articles), and if I spend too much time trying to satisfy everybody’s very last suggestion or wish for the program, it will nullify the time I tried to save by writing the thing in the first place!

However, I would love to see someone take the original code and develop it further, perhaps making it compatible with a more open reference manager platform such as Connotea.

Mattions: Do you choose any type of license or are you not interested on it?
Greg: Yes, I’m licensing it under the GNU GPLv2.

Mattions: Is the code available or do you think to make it available some day?
Greg: I find Google Code really easy to work with, so it’s available at http://syncuthink.googlecode.com/ .

Mattions: Ok, Greg thanks for the interview and for your time.
Greg: No problem, thanks for the chance to chat about the program. Hopefully some people will find it useful!

EBIMed ed HubMed, attacco ai fianchi di PubMed

Visto che questo blog, ogni tanto (s)parla di bioinformatica come sostenuto dal buon Giovanni su Bioinfo Blog ci apprestiamo a mostrare due strumenti abbastanza interessanti.

Il punto: Come trovo l’articolo scientifico su PubMed tra il marasma di articoli presenti?

  1. Uso il campo di ricerca di PubMed (doh!)
  2. Uso EbiMed
  3. Utilizzo (Mi ero stancato di uso) HubMed

EbiMed

La feature di EbiMed è quella di inquadrare in tabelle, utilizzando diversi tipi di categorizzazione i vari risultati. Inoltre le keywords vengono evidenziate automaticamente e risulta molto legibbile. Le tabelle sono navigabili ed i risultati sono riordinabili secondo le varie keywords

L’attesa è addolcita da “quotation” in stile fortune.

HubMed

Si dice che HubMed sia un’interfaccia più friendly per ricercare tutto MedLine. Può essere. Non sò Non ne sono ancora convinto. Preferisco il bare PubMed ad HubMed

Ma come è noto…

De gustibus non disputandum est

Rescaling boxplot with R

R è un software fenomenale, ed i grafici di R sono eleganti, belli e soprattutto informativi. Ma non è di questo che voglio parlare.

Scenario: Avete dei dati di tipo quantitavo, tipo delle frequenze e volete visualizzarli per capire come sono distribuiti. Ovviamente vi serve un modo per farlo.

Quello che volete è un box plot. 🙂

Importing data:

Con R importare un set di dati separati da tab come questi:

term freq
nitrite/creatinine 2
irration 3
nmole/mumole 4
asid 5
hydrocorphin 6
gln74 7
sidegroups 8
perispindle 9
procline 10
airtract 11
na2autm 12
dptp99a 13
mbmass 14
sr233377 15
pyrocarbon 16
antiamoebin 17
sh3px1 18
thr50 19
visioning 20
swgdam 21

è abbastanza semplice:
data <- read.csv(file="nome_file", sep="t")

ora se volete visualizzare i dati basta dare un
data
e tutti i vostri dati saranno visualizzati. Se sono troppi per essere visualizzati tutti insieme, le funzioni head() and tail() Potranno esservi utili.

Ora volete plottare i vostri dati in un box plot. Come fare?
boxplot(data$freq, main="Medline frequent term")
ed automaticamente vi si aprirà una finestra dove ci sarà il vostro grafico. Da notare che abbiamo indicato la colonna numero 2 (quella delle frequenze) usando l’intestazione :). Very handy.

plot ex 1

Tuttavia come vedete, le frequenze dei dati sono molto differenti tra loro, quindi un plot con una scala diversa potrebbe essere + interessante. Come?
plot <- boxplot(data_t_1$freq, col="lightblue", ylim=c(1,50000))

plot ex 2

Il boxplot prende, come scala, un vettore ylim=c(1,50000).

Se volete vedere le stats del vostro grafico, sono tutte dentro l’oggetto plot

> plot
$stats
[,1]
[1,] 2.0
[2,] 2378.5
[3,] 6203.0
[4,] 20226.0
[5,] 46960.0
attr(,"class")

...