Ich habe mir dieses Papier angesehen, in dem es um die Fehlberechnungen in den BLOSUM-Matrizen geht und wie die "falsche" BLOSUM62-Matrix besser abschneidet als die korrigierte Version. Ich habe versucht, die korrigierte Version zu finden, von der sie sprechen, um damit zu experimentieren, aber der Link, den sie in der Zeitung auflisten, scheint tot zu sein.
Weiß jemand, wo ich die korrigierte Matrix finden kann, über die die Autoren sprechen? (vorzugsweise eine Version, die die Frequenzen statt der Punktzahlen auflistet)
Okay, ich habe Dr. Mark Styczynsk (einem der Autoren) eine E-Mail geschickt, um nach einem Link zur Matrix zu fragen. Hier sind die Links, die er mir gegeben hat:
http://web.mit.edu/bamel/blosum/revised_blosum.c
http://web.mit.edu/bamel/blosum/original_blosum.c
http://web.mit.edu/bamel/blosum/RBLOSUM64 (isentrop mit BLOSUM62)
http://web.mit.edu/bamel/blosum/RBLOSUM62 (nicht isentropisch, aber 62)
Der erste Link führt zum C-Code, um das korrigierte BLOSUM zu generieren. Laut Mark kann durch einfaches Ersetzen der ursprünglichen c-Datei im ursprünglichen BLOSUM-Tarball durch die überarbeitete c-Datei die korrigierte Matrix für alle BLOSUMs (30, 50, 92) generiert werden. Habe das selbst noch nicht probiert.
Ihre Frage machte es schwierig zu verstehen, wonach Sie suchen, daher hoffe ich, dass diese beiden Links Ihnen die gewünschten Daten liefern.
0. Ein Quellenlink zu dem betreffenden Papier und seiner ergänzenden Datei .
WYSIWYG