Latest Event Updates

Neuroinformatics coauthor network – so far

Posted on

neuroinformatics coauthor network 2016-06-28

Screenshot of neuroinformatics coauthor network – so far. Only the big cluster is shown. Network with Jonas Kress default setup querying WDQS.

Backup of directory

Posted on Updated on

I at times does not recall the command to backup a directory. So here for my own sake of reference:

$ rsync -au /home/fnielsen/Pictures/ /media/fnielsen/a4f11e07-3f63-45cc-bcab-e7d135c14b9c/backup/Billeder/

the -a is the standard archive option. the -u is ‘update’ (“skip files that are newer on the receiver”).

Page rank of scientific papers with citation in Wikidata – so far

Posted on Updated on

A citation property has just be created a few hours ago, – and as of writing still not been deleted. It means we can describe citation network, e.g., among scientific papers.

So far we have added a few citations, – mostly from papers about Zika. And now we can plot the citation network or compute the network measures such as page rank.

Below is a Python program using everything with Sparql, Pandas and NetworkX:

statement = """
select ?source ?sourceLabel ?target ?targetLabel where {
  ?source wdt:P2860 ?target .
  SERVICE wikibase:label {
    bd:serviceParam wikibase:language "en" .
  }
} 
"""

service = sparql.Service('https://query.wikidata.org/sparql')
response = service.query(statement)
df = DataFrame(response.fetchall(),
    columns=response.variables)

df.sourceLabel = df.sourceLabel.astype(unicode)
df.targetLabel = df.targetLabel.astype(unicode)

g = nx.DiGraph()
g.add_edges_from(((row.sourceLabel, row.targetLabel)
    for n, row in df.iterrows()))

pr = nx.pagerank(g)
sorted_pageranks = sorted((rank, title)
    for title, rank in pr.items())[::-1]

for rank, title in sorted_pageranks[:10]:
    print("{:.4} {}".format(rank, title[:40]))

The result:

0.02647 Genetic and serologic properties of Zika
0.02479 READemption-a tool for the computational
0.02479 Intrauterine West Nile virus: ocular and
0.02479 Internet encyclopaedias go head to head
0.02479 A juvenile early hominin skeleton from D
0.01798 Quantitative real-time PCR detection of 
0.01755 Zika virus. I. Isolations and serologica
0.01755 Genetic characterization of Zika virus s
0.0175 Potential sexual transmission of Zika vi
0.01745 Zika virus in Gabon (Central Africa)--20

Occupations of persons from Panama Papers

Posted on Updated on

Can we get an overview of the occupations of the persons associated with the Panama Papers? Well … that might be difficult, but we can get a biased plot by using the listing in Wikidata, where persons associated with the Panama Papers seems to be tagged and where their occupation(s) is listed. It produces the plot below.

PanamaPapersOccupations

It is fairly straightforward to construct such a bubble chart given the new plotting capabilities in the Wikidata Query Service. Dutch Wikipedian Gerard Meijssen seems to have been the one who has entered the information in Wikidata linking Panama Papers to persons via the ‘significant event‘ property. How complete he yet has managed to do this I do not know. Our Danish Wikipedian Ole Palnatoke Andersen set up a page on the Danish Wikipedia at Diskussion:Panama-papirerne/Wikidata tabulating with the nice Listeria tool of Magnus Manske. Modifying Ole’s SPARQL query we can get the count of occupations for the persons associated with the Panama Papers in Wikidata.

SELECT ?occupationLabel(count(distinct ?person) as ?count) WHERE {
  ?person wdt:P793 wd:Q23702848 ; wdt:P106 ?occupation .   
  service wikibase:label { bd:serviceParam wikibase:language "en" . }
} group by ?occupationLabel

Some people may see that politicians are the largest group, but that might simply be an artifact of the notability criterion of Wikidata: Only people who are somewhat notable or are linked to something notable are likely to be included in Wikidata, e.g., the common businessman/woman may not (yet?) be represented in Wikidata.

The bubble chart cuts letters of the words for the occupation. ‘murd’ is murderer. Joaquín Guzmán has his occupation set to murderer in Wikidata, – without source…

 

Om Henrik Krügers ‘Sømænd i Helvede’

Posted on

Sært at en enorm katastrofe med over tusinde dræbte kan affærdiges som en lille promille i 2. Verdenskrigs hav af rædsel. På sin vis virker det tyske overraskelsesangreb på den italienske havn Bari i 1943, hvor de fik ram på allierede skibe lastet med konventionel ammunition og sennepsgasbomber, som en parrallel til Henrik Krügers bog om samme. På trods af at hændelsen omtales som Lille Pearl Harbor, finder man ikke at angrebet indtager en større plads i litteraturen om 2. Verdenskrig. Heller ikke Krügers bog har gjort sig særligt bemærket. Krüger har selv udgivet bogen på on-demand-forlaget Skriveforlaget, og jeg fandt den tilfældig i udsalg fra det lokale bibliotek for vel ikke mere end 10 kroner.

Selv blev jeg overrasket over at læse at man ikke blot havde eksperimenteret med giftgas under 2. Verdenskrig, men tillige fabrikeret et stort antal giftgasbomber og transporteret dem til Europa til opmagasinering just-in-case. Krüger argumenterer for at adskillige døde som følge af hemmeligholdelsen af ladningen med giftgas, – giftgas, der havde regnet ned over soldater og søfolk efter at ammunitionsskibene var eksploderet. Grunden til at vi har hørt så lidt om angrebet skyldtes måske at den blot lagde sig i rækken af krigens almindelige død. Det skete på mindre end en time den 2. december 1943. Samme nat sendtes i følge A.C. Graylings opgørelse over 400 bombefly mod Berlin og natten efter over 500 mod Leipzig, hvor Grayling noterer 1.717 døde. Tænksom bliver man når man hører det tyske sprog blandt turister, hvis forfædre 2. generationer bagud kan have lidt i brandbombernes helvede.

Krüger skriver at det er en historie der aldrig er fortalt. Krüger støtter sig dog til engelsk-sprogede bøger. Hvor han får merit er gennem den danske vinkel, hvor han har interviewet flere danskere omkring skibet med navnet Lars Kruse. Med dette får han mindet de danske sømænds stille heroiske indsats.

Fra LibraryThing.

Altmetrics for a department

Posted on

Suppose you want to measure the performance of individual researchers of a university department. Which variables can you get hold on and how relevant would they be to measure academic performance?

Here is my take on it:

  1. Google Scholar citations number. Google Scholar records total number of citations, h-index and i10-index as well as the numbers for a fixed period.
  2. Scopus citation numbers.
  3. Twitter. The number of tweets and the number of followers would be relevant.
    One issue here is that the number of tweets may not be relevant to the academic performance and it is also susceptible to manipulation. Interestingly there has been a comparison between Twitter numbers and standard citation counts with a coefficient between the two numbers named the Kardashian index.
  4. Wikidata and Wikipedia presence. Whether Wikidata has a item of the researcher, the number of articles of the researchers, the number of bytes they span, the number of articles recorded in Wikidata. There is an API to get these numbers, and – interestingly – Wikidata can record a range of other identifiers for Google Scholar, Scopus, Twitter, etc. which would make it a convenient open database for keeping track of researcher identifiers across sites of scientometric relevance.
    The number of citations in Wikipedia to the work of a researcher would be interesting to have, but is somewhat more difficult to automatically obtain.
    The numbers of Wikipedia and Wikidata are a bit manipulable.
  5. Stackoverflow/Stackexchange points in relevant areas. The question/answering sites under the Stackexchange umbrella have a range of cites that are of academic interest. In my area, e.g., Stackoverflow and Cross Validated.
  6. GitHub repositories and stars.
  7. Publication download counts. For instance, my department has a repository with papers and the backend keeps track of statistics. The most downloaded papers tend to be introductory or material and overviews.
  8. ResearchGate numbers: Publications, reads, citations and impact points.
  9. ResearcherID (Thomson Reuters) numbers: total articles in publication list, articles with citation data, sum of the time cited, average citations per article, h-index.
  10. Microsoft Academic Search numbers.
  11. Count in the dblp computer science bibliography (the Trier database).
  12. Count of listings in ArXiv.
  13. Counts in Semantic Scholar.
  14. ACM digital library counts.

 

Kritik af Thomas Ladegaards ‘Palmemordet

Posted on Updated on

Så kom endnu en dansk bog om Palmemordet. Og det op til 30-årsdagen. Teksten er på henvend 190 sider og altså ikke så lang som den dansk-oversatte Jan Bondeson bog. Mens andre Palmemordsforfatter ofte vælger en vinkling på stoffet så undgår Thomas Ladegaard at introducere nye tendentiøse teorier i bogen. Ja, faktisk lægges er det pauvret hvad der lægges frem af nyt materiale eller analyse, og Ladegaard synes ikke rigtigt at komme med nye meninger. Tag Christer Pettersson og vurderingen af hans skyld. Der ligger Ladegaards sig ganske op af Gunnar Wall. For kilderne benytter han sig tilsyneladende hovedsageligt af tidligere udgivne bøger og særligt Granskningskommissionen rapport. Lidt interview med Gunnar Wall og Poutiainen er det blevet til. På sin vis er det udmærket at Ladegaard holder sig til the-middle-of-the-road.

Givet at jeg har skrevet det meste af den danske Wikipedia var jeg ganske spændt på om bogen er påvirket Ladegaard og om der skulle være reference til WIkipedia. For mig at se er det tydeligt at Ladegaard har læst den danske Wikipedia artikel. Bogens struktur synes at være inspireret af den danske Wikipedia artikels struktur, og i visse afsnit finder man reminisenser, der enten skyldes at han har læst Wikipedia og haft den i baghovedet eller at vi har samme forlæg.

For eksempel på side 85 skriver Ladegaard: “Beviserne mod Underwood var nemlig overvældende i form af DNA, fodspor, ballistiske test, fund af tape og Underwoods tidligere trusler og jalousi”. På WIkipedia har jeg skrevet: “Til grund for afgørelsen lagde appelretten at beviserne mod Underwood var overvældende: DNA, fodspor, ballistiske test, fund af tape og Underwoods tidligere trusler og jalousi”

På side 140 skriver Ladegaard: “Rimborn skyndte sig tilbage til politibovedkvarteret, hvorefter man udsendte et signalement af to gerningsmænd, der muligvis tilhørte Ustasa-bevægelsen. I de kaotiske timer efter mordet blev dette signalement sendt ud og bidrog yderligere til forvirringen.” På Wikipedia: “Rimborn tog tilbage til politihovedkvarteret hvor man udfærdigede et signalement på to mænd med angivelse af at de muligvis tilhørte Ustasja-bevægelsen. I de kaotiske timer efter mordet blev dette signalement sendt rundt på telex omkring klokken to om natten.” Min tekst er med kilde fra Bondeson, – som det ses i referencen på Wikipedia. Bondeson skriver: “Rimborn vender straks tilbage til det kaotiske politihovedkvarter, hvor man udarbejder en generel alarm til hele det svenske politi.”

Hist og her er der andre eksempler hvor Ladegaard lader sig inspirere. For mig at se er der ikke tale om plagiering. Når jeg skriver på Wikipedia parafraserer jeg også, – måske for meget nogle gange. Skulle Ladegaard have citeret Wikipedia? Nja, det skal man normalt lade være med. Normalt gør os Wikipedianer et forsøg på at være korrekte, men man bør anse Wikipedia som en trin på vejen til de “rigtige” kilder og citerer dem i stedet. Man kan eventuelt takke Wikipedia som indgangsportal. Jeg finder ikke Wikipedia nævnt i appendix.

Det er to problemer når skribenter låner hist og her fra Wikipedia: 1) Hvis ikke de skriver at deres parafrase eller citat er fra Wikipedia kan Wikipedia komme til at fremstå som om det er Wikipedia der har lånt fra skribenten og ikke omvendt. 2) Hvis skribenten tror at det der står på Wikipedia er rigtigt og benytter det i sin tekst uden kilde til Wikipedia, så vil en fremtidig Wikipedianer kunne komme for skade at benytte skribentens tekst som kilde på Wikipedia. Nu sker der så en cirkulær killdereference, hvor fiktion kan opstår. Jeg ser ikke at Ladegaard forsynder sig her i det sidste tilfælde.

Overordnet synes jeg bogen er jævnt godt skrevet og den kommer rundt om alle de konventionelle emner med en fin vægtning. Det var nyt for mig at høre om “Stay behind”-netværket. Her synes Ladegaard at støtte sig til Gunnar Walls nyeste bog, som jeg ikke har haft lejlighed til at læse. En anden historie som jeg ikke havde hørt før var om det svenske DC-3 fly skudt ned af Sovjetunionen i 1952. En af kapitlerne er en lille Palme-biografi og navnene på politifolkene der har været nævnt som involveret i sagen lader Ladegaard nævne ved navn.

Hvis jeg skal kritisere elementer ved fremstilling: Ladegaard skriver på side 61 at hvis vidnet Morelius tidsangivelse holder, så blev “Palme offer for en forbrydelse, hvor der var flere involverede”. Det er jeg faktisk ikke enig. En spekulation der vist aldrig er fremført er at gerningsmanden har stået ved Dekorima og ventet og skudt Palme. Mordet kunne for eksempel have været sket som et mislykket gaderøveri, – ikke at jeg selv tillægger den teori noget særligt. En andet element er ved omtalen af en af 1970’ernes skandaler. Her skrives “justitsminister Lennart Geijer havde gjort brug af en prostitutionsring”. Jeg var under indtryk af at han blot var under beskyldninger for det. Det er muligt jeg tager fejl, men på WIkipedia har jeg ihvertfald formuleret mig med “Palmes justitsminister Geijer og oppositionslederen Thorbjörn Fälldin blev beskyldt for at have købt seksuelle ydelser.” Der er forskel på at benytte en prostitutionsring og at være beskyldt for at benytte en prostitutionsring.

På side 35 skriver Ladegaard “…besluttede parret at skifte til det modsatte fortov, da Lisbet gerne ville se på en kjole i et butiksvindue.” Jeg var under indtryk af at det først var efter de havde krydset gade at Lisbet valgte at stoppe op ved butiksvinduet, men jeg kan se at også Bondeson skriver at parret krydsede gaden fordi Lisbet ville. Det indgår ellers i en af fringe teorierne at Palme skulle eller ville mødes med nogen på vejen. Granskningskommissonens side 148 nævner ikke hvem der traf beslutningen om at krydse gaden.

Som så mange andre Palmemordsforfatter vælger Ladegaard at kritisere det svenske politis indsats stærkt. Det forekommer mig for nemt. På et tidspunkt vil jeg måske skrive om at det svenske politi nok ikke har været helt så dårligt som de ofte bliver malet frem til.

Fra LibraryThing.