Distribuited client per OS4 (Altivec)

Riflessioni, eventi, curiosità

Distribuited client per OS4 (Altivec)

Messaggioda ikir » mer set 01, 2004 12:21 pm

http://amigaworld.net/modules/news/arti ... oryid=1687

Naturalmente per usare l'Altivec bisogna avere il kernel aggiornato che sarà incluso negli update.

Comunque funziona bene dire, facendo il benchmark addirittura il mio AmigaOne clockato a 800 batte il mio Pentium 4 2400mhz. Non so mi lascia perplesso perchè mi sembra troppo, sarà poco otimizzato il client x86 che ne so. Con l'Altivec quasi si raddoppia ho visto :-O
Avatar utente
ikir

Admin
 
Messaggi: 10202
Iscritto il: mer gen 08, 2003 7:33 pm
Località: SYS:Prefs/

Messaggioda kaosmaster^rbs » mer set 01, 2004 1:14 pm

Batte il tuo PC con il supporto ALTIVEC disabilitato ? :mah:
kaosmaster^Iris
Avatar utente
kaosmaster^rbs

Veterano
 
Messaggi: 161
Iscritto il: lun giu 21, 2004 3:04 pm
Località: Wonderland

Messaggioda ikir » mer set 01, 2004 2:18 pm

Sembro non essero il solo!

http://amigaworld.net/modules/news/arti ... oryid=1687 (in fondo)

Mi sembra strano, sarà un errore in uno dei due benchmark :-)

Update: altri ancora in seconda pagina, confronto con un AMD1000, ci può stare, ma in effetti i risultati di A1 sono più che doppi.
Avatar utente
ikir

Admin
 
Messaggi: 10202
Iscritto il: mer gen 08, 2003 7:33 pm
Località: SYS:Prefs/

Messaggioda riko » mer set 01, 2004 2:59 pm

kaosmaster^rbs ha scritto:Batte il tuo PC con il supporto ALTIVEC disabilitato ? :mah:


Diciamo che la cosa non mi sorprende piu` di tanto. Se fa per esempio calcolo in virgola mobile, e` normale che si mangi i pentium. PPC usa registri floating point a 64 bit nativi... e questa e` tanta roba. E ne ha credo 32... un buon compilatore ci si puo` divertire. Il gcc ha subito pesanti ottimizzazioni da Apple.. tanto da renderlo in assoluto ottimizzato per PPC grosso modo quanto l'Intel lo e` per Pentium. Chiaramente a livello di codice anche Amiga beneficia di queste ottimizzazioni.
Per capirci su un semplice algoritmo numerico, senza allocazione di memoria, il mio *portatile* si faceva il 25% di vantaggio contro un P4 con il *doppio* di clock, e questo su un fisso.
Inoltre il portatile era in uso ci continuavo a lavorare, mentre sul PC era l'unico task che lavorava (sia con Windows - compilatore .Net 2003 -- ottimo aggeggio --, sia con Linux con il gcc).
Non solo... il principale vantaggio del PPC (ora anche il PIV ha registri *grossi* per lavorare in doppia precisione nativamente) e` il numero di registri. 32 contro 8. Ragion per cui pensando ad un algorirmo che facesse uso di *tante* variabili, immagino che il divario sarebbe stato anche supertiore.

Faccio notare che questo, come ogni altro possibile benchmark dice solo 1/10 della storia. Centra quanto ottimizzato e` il codice... per esempio il Watcom e` piu` veloce del Microsoft, anche se e` meno aderente allo standard . Contano i processi in background.

E tornando all'altivec, anche io non ho visto *gigantesche* perdite di performance disabilitandolo. Dipende cosa uno deve fare. E quanto bene il codice lo sfrutta.

Un esempio? GMP e` piu` veloce su AMD che su PPC. Semplicente per AMD qualcuno si e` messo ad ottimizzarlo fin nel piu` piccolo budello, mentre per PPC usa codice generico.

Meditate gente, meditate!
-enrico
fibs = 0 : 1: [ a + b | (a, b) <- zip fibs (tail fibs) ]


Akropolix: Community OFF-TOPIC di IKSnet
http://www.akropolix.net/forum

"se do da mangiare a un affamato mi dicono che sono un santo, se mi chiedo perch? ? affamato mi dicono che sono un comunista" (Helder C?mara, Arcivescovo di Recife)
Avatar utente
riko

Supremo
 
Messaggi: 3329
Iscritto il: gio mar 04, 2004 4:28 pm
Località: Chiba City

Messaggioda Seiya » mer set 01, 2004 3:59 pm

Sembro non essero il solo!

http://amigaworld.net/modules/news/arti ... oryid=1687 (in fondo)

Mi sembra strano, sarà un errore in uno dei due benchmark :-)

Update: altri ancora in seconda pagina, confronto con un AMD1000, ci può stare, ma in effetti i risultati di A1 sono più che doppi.


i test rc5/72 con i powerPC g4 sono molto più veloci anche a cpu x86 notevolmente superiore come potenza ad un G4 800.
Sui programmi reali non c'è paragone, una cpu x86 AMD 1 Ghz supera un G4 800, ma con l'RC5, i G4 sono ben più veloci.
andrebbe verificato se effettivamente sono risultati veri o solo numeri per attirare l'attenzione.
Seiya
 

Messaggioda riko » mer set 01, 2004 4:08 pm

Seiya ha scritto:Sui programmi reali non c'è paragone, una cpu x86 AMD 1 Ghz supera un G4 800, ma con l'RC5, i G4 sono ben più veloci.


Mmmh. Si di notte, se il G4 e` spento.
Uso reale, non pippe e benchmark!
-enrico
fibs = 0 : 1: [ a + b | (a, b) <- zip fibs (tail fibs) ]


Akropolix: Community OFF-TOPIC di IKSnet
http://www.akropolix.net/forum

"se do da mangiare a un affamato mi dicono che sono un santo, se mi chiedo perch? ? affamato mi dicono che sono un comunista" (Helder C?mara, Arcivescovo di Recife)
Avatar utente
riko

Supremo
 
Messaggi: 3329
Iscritto il: gio mar 04, 2004 4:28 pm
Località: Chiba City

Messaggioda Seiya » mer set 01, 2004 4:14 pm

[Per capirci su un semplice algoritmo numerico, senza allocazione di memoria, il mio *portatile* si faceva il 25% di vantaggio contro un P4 con il *doppio* di clock, e questo su un fisso.
Inoltre il portatile era in uso ci continuavo a lavorare, mentre sul PC era l'unico task che lavorava (sia con Windows - compilatore .Net 2003 -- ottimo aggeggio --, sia con Linux con il gcc).


Il P4 ha delle lunghe pipeline per permettergli di salire in Mhz, ma tutti quei mhz sono, ormai lo sanno anche i muri ,"manovra di mercato per
attirare clienti".
Infatti basta vedere un AthlonXP 3200+ (clock r4eale mi pare 2200 mhz)
a prestazioni pari ad un P4 3200 Mhz effettivi.
Quindi il P4 spreca Mhz solo per attirare clienti senza dare la giusta potenza.

infatti:

"La pipeline, infatti, viene sempre riempita dalle istruzioni che hanno una maggiore probabilità di essere eseguite. Se però, il flusso previsto è sbagliato, le istruzioni già parzialmente elaborate devono essere scartate e ne devono essere caricate di nuove per il nuovo flusso di dati. La pipeline del Pentium 4, essendo il doppio di quella del Pentium III, nel caso di una previsione sbagliata del flusso, deve lavorare il doppio per scaricare e ricaricare le istruzioni. Per questo motivo il flusso di istruzioni della pipeline è molto importante e può determinare un decadimento delle prestazioni."

"Il portavoce di Apple si è premurato di spiegare il motivo di questa differenza in termini di prestazioni, motivando la lentezza del Pentium 4 con la lunghezza eccessiva del pipeline e con un'architettura meno ottimizzata. Buona parte di questo aumento di prestazioni va però imputato al maggior quantitativo di cache installato nel nuovo G4 rispetto al Pentium 4, fattore che favorisce in maniera determinante le prestazioni."
Seiya
 

Messaggioda Seiya » mer set 01, 2004 4:17 pm

riko ha scritto:
Seiya ha scritto:Sui programmi reali non c'è paragone, una cpu x86 AMD 1 Ghz supera un G4 800, ma con l'RC5, i G4 sono ben più veloci.


Mmmh. Si di notte, se il G4 e` spento.
Uso reale, non pippe e benchmark!


appunto uso reale..
dato che ho proposto qui di fare dei test reali e a quanto pare avete paura a farli, non vi resta che l'RC5 è l'unico che da ragione al G4.
Seiya
 

Messaggioda riko » mer set 01, 2004 5:01 pm

Seiya ha scritto:dato che ho proposto qui di fare dei test reali e a quanto pare avete paura a farli, non vi resta che l'RC5 è l'unico che da ragione al G4.


Ma come fai a 'riportare' uso reale? E` uso, non numeri.
Io posso dirti che lavoro tanto su PPC e anche su x86. E la differenza la sento. Sul Mac ho sempre una macchina fluida e responsiva a prescindere da quello che le faccio fare. Su PC se non sta facendo nulla, al limite e` piu`reattiva, ma se appena fai qualcosa *si pianta*. Non nel senso che crasha, ma nel senso che sembra di lavorare con un PII.

Poi vedila come vuoi. Non devo certo convincere te, che sei inconvincibile. Io devo lavorare, ragion per cui faccio le scelte che reputo migliori (e non ne sono mai stato deluso).

Ti piace x86? Giocaci!
-enrico
fibs = 0 : 1: [ a + b | (a, b) <- zip fibs (tail fibs) ]


Akropolix: Community OFF-TOPIC di IKSnet
http://www.akropolix.net/forum

"se do da mangiare a un affamato mi dicono che sono un santo, se mi chiedo perch? ? affamato mi dicono che sono un comunista" (Helder C?mara, Arcivescovo di Recife)
Avatar utente
riko

Supremo
 
Messaggi: 3329
Iscritto il: gio mar 04, 2004 4:28 pm
Località: Chiba City

Messaggioda riko » mer set 01, 2004 5:06 pm

Seiya ha scritto:Il P4 ha delle lunghe pipeline per permettergli di salire in Mhz, ma tutti quei mhz sono, ormai lo sanno anche i muri ,"manovra di mercato per
attirare clienti".

Non lo ho mai negato... ma dovevo pure descrivere in qualche modo il processore con cui lo ho confrontato. Se no avresti provato a sostenere che lo avevo scontrato contro un PII.

Quindi il P4 spreca Mhz solo per attirare clienti senza dare la giusta potenza.


Non e` che li spreca. Ha un architettura diversa, tutto qui. Che ha bisogno di un clock insano per non lumacare.


Buona parte di questo aumento di prestazioni va però imputato al maggior quantitativo di cache installato nel nuovo G4 rispetto al Pentium 4, fattore che favorisce in maniera determinante le prestazioni."


Dovresti datarla....
-enrico
fibs = 0 : 1: [ a + b | (a, b) <- zip fibs (tail fibs) ]


Akropolix: Community OFF-TOPIC di IKSnet
http://www.akropolix.net/forum

"se do da mangiare a un affamato mi dicono che sono un santo, se mi chiedo perch? ? affamato mi dicono che sono un comunista" (Helder C?mara, Arcivescovo di Recife)
Avatar utente
riko

Supremo
 
Messaggi: 3329
Iscritto il: gio mar 04, 2004 4:28 pm
Località: Chiba City

Messaggioda ShInKurO » mer set 01, 2004 5:53 pm

Seiya ha scritto:

"La pipeline, infatti, viene sempre riempita dalle istruzioni che hanno una maggiore probabilità di essere eseguite. Se però, il flusso previsto è sbagliato, le istruzioni già parzialmente elaborate devono essere scartate e ne devono essere caricate di nuove per il nuovo flusso di dati. La pipeline del Pentium 4, essendo il doppio di quella del Pentium III, nel caso di una previsione sbagliata del flusso, deve lavorare il doppio per scaricare e ricaricare le istruzioni. Per questo motivo il flusso di istruzioni della pipeline è molto importante e può determinare un decadimento delle prestazioni."

"Il portavoce di Apple si è premurato di spiegare il motivo di questa differenza in termini di prestazioni, motivando la lentezza del Pentium 4 con la lunghezza eccessiva del pipeline e con un'architettura meno ottimizzata. Buona parte di questo aumento di prestazioni va però imputato al maggior quantitativo di cache installato nel nuovo G4 rispetto al Pentium 4, fattore che favorisce in maniera determinante le prestazioni."


Mi dici la fonte plz?
Avatar utente
ShInKurO

Eroe
 
Messaggi: 1428
Iscritto il: dom mar 14, 2004 3:10 pm

Messaggioda amighista » mer set 01, 2004 8:27 pm

Seiya ha scritto:
Sembro non essero il solo!

http://amigaworld.net/modules/news/arti ... oryid=1687 (in fondo)

Mi sembra strano, sarà un errore in uno dei due benchmark :-)

Update: altri ancora in seconda pagina, confronto con un AMD1000, ci può stare, ma in effetti i risultati di A1 sono più che doppi.


i test rc5/72 con i powerPC g4 sono molto più veloci anche a cpu x86 notevolmente superiore come potenza ad un G4 800.
Sui programmi reali non c'è paragone, una cpu x86 AMD 1 Ghz supera un G4 800, ma con l'RC5, i G4 sono ben più veloci.
andrebbe verificato se effettivamente sono risultati veri o solo numeri per attirare l'attenzione.


Scusa ma sai leggere? in sostanza i tuoi benchmark sono tutti da buttare, perchè e' una questione di ottimizzazioni. Io ormai se devo far comprare un PC assemblato mi baso solo sul prezzo e sulla capacita' dei vari chip di far girare bene i programmi necessari, e BASTA, non su megaherz, pipeline, registri e cavoli vari.
Avatar utente
amighista

Eroe
 
Messaggi: 1681
Iscritto il: mer set 24, 2003 11:55 am
Località: Milano

Messaggioda Seiya » mer set 01, 2004 9:14 pm

Mmmh. Si di notte, se il G4 e` spento.
Uso reale, non pippe e benchmark!


Anzi te ne dirò un altra per aver letto una graduatoria di prestazioni
che mi pare accettabile:

un G3 800 Mhz è più o meno un P3 850/866 Mhz
un G4 800 Mhz è sostanzialmente un G3 con altivec (e una unità fpu in meno)
Quindi se non usi l'altivec..un G4 800 Mhz è più o meno come lo stesso P3 850/866.

Con l'Altivec sei circa un P3 1 Ghz.

Un Athlon/Duron a parità di clock sono più veloci dei P3...
Seiya
 

Messaggioda Seiya » mer set 01, 2004 9:29 pm

Su PC se non sta facendo nulla, al limite e` piu`reattiva, ma se appena fai qualcosa *si pianta*. Non nel senso che crasha, ma nel senso che sembra di lavorare con un PII.


Io parlo di prestazioni, non di uso.
Del fatto che ti rallenta tutto, sono problemi di sovraaffollamento di programi e un rigonfiamento del registro.
Prova a riempire AmigaOS di librerie e poi vede se non avverti la stessa sensazione da 286?

Ti piace x86? Giocaci!


Sicuramente un sistema più prestante senza alcun dubbio.
Seiya
 

Messaggioda Seiya » mer set 01, 2004 9:31 pm

ShInKurO ha scritto:
Seiya ha scritto:


Mi dici la fonte plz?


Google;

G4 pipeline
Pentium 4 pipeline

trovi tutto quello che ti serve :)
Seiya
 

Prossimo

Torna a Amiga in generale

Chi c’è in linea

Visitano il forum: Nessuno e 14 ospiti

cron