Is doch ganz einfach im Kopf zu rechnen.
Als Grundlage für ein Instruction nimmt man typischerweise eine Addition mit der Datenbreite des Cores, in diesem Falle also 32 Bit.
Ein Athlon (XP) kann gleichzeitig in einem Takt einen 3DNow! Befehl mit 128 Bit (also 4*32 Bit),2 MMX-Befehle (2*64 = 4*32 Bit), 0 FPU-Befehle (da die FPU für MMX genutzt wird) und 4 Pipelined Core-Befehle à 32 Bit ausführen, macht als 9 32-Bit-Befehle auf einmal (wenn man ihn stets optimal mit Befehlen füttert). Bei 'ner Taktrate von 1533 Mhz macht das also maximal 13797 MIPS bzw. 13,8 BIPS im Idealfall.
Denk dran: Diese Werte geben nur die Performance für vollständig parallelisierbare Algorithmen wieder (MPEG,Ray-Tracing etc.). Bis auf diese Killer-Apps sind parallele Algortihmen eher selten und orientieren sich her an der Taktrate (z.B. Verschlüsselung). In aller Regel (d.h. Windows, Office-Apps, Games usw.) sind die Algortihmen auch nicht wirklich optimiert und orientieren sich eher an der architekturellen Performance, welche bei Athlons wesentlich besser ist beim Pentium 4.