Article Revioo.com

Intel Core 2 QX9650 : Que vaut le Penryn ?

Par Vincent-G le 29/10/2007 à 06h00
Catégorie :

SOMMAIRE



Introduction


Un peu plus d’un an après la sortie de l’architecture Conroe, Intel innove à nouveau avec un processeur réutilisant les qualités de la microarchitecture Core tout en y apportant quelques améliorations et surtout en innovant sur les processus de fabrication.

Comme vous l’aurez sans doute compris au travers de cette petite introduction, la véritable nouveauté du Penryn est l’introduction du procédé de gravure en 45nm qui aura obligé Intel a développer une technologie que Gordon Moore qualifie lui même de 'plus grande avancé sur les transistors depuis la fin des années 60'
Rien que ça...

L’article que nous vous proposons aujourd’hui vous permettra donc de découvrir le fameux procédé qui à une fois de plus permis à Intel de respecter la fameuse loi de Moore. Vous découvrirez ensuite les autres nouveautés de l’architecture Penryn et enfin nous vous inviterons à partager avec nous une belle et grande séance de benchmark Penryn VS Conroe.

Evolution du procédé de gravure


Le 24 octobre dernier, nous avons été conviés par Intel à venir découvrir l’architecture Penryn et ses nouveautés. L’une de ces nouveautés est justement l’introduction de la gravure en 45 nm, et pour l’occasion le procédé de fabrication nous à été présenté par Ann Kelleher qui n’est autre que la responsable de l’usine F24 située en Irelande. Je peux donc vous assurer que ce n’est pas n’importe qui et que l’on aurait difficilement pu trouver meilleur interlocuteur pour nous expliquer le bien fondé du processus de gravure à 45nm.

Commençons par nous demander quel est l’intérêt pour Intel de passer au 45nm tout de suite ? Après tout, leurs processeurs en 65nm fonctionnent plutôt bien (c’est rien de le dire) et mettent sérieusement à mal la concurrence. Il semble cependant qu’Intel ai tiré les leçons de son attitude un peu trop attentiste lors des générations Pentium 4 et ai décidé cette fois-ci de s’imposer un calendrier strict et d’y tenir.
Ainsi, une nouvelle finesse de gravure devrait apparaitre tous les deux ans alors le 65nm étant apparu en 2005 il est donc logique de voir le 45nm pointer aujourd’hui le bout de son nez.
Second point important : produire le même processeur, sur le même Wafer mais avec une finesse de gravure plus petite permet bien sur d’en caser plus et donc de produire plus de processeur avec la même quantité de silicium. Le bénéfice en terme de productivité est évident et permet à Intel de rendre la production de ses processeurs moins onéreuse.
Dernier point important, cette nouvelle finesse de gravure introduit des nouvelles technologies. En des termes plus techniques sachez qu’auparavant Intel utilisait du dioxyde de silicium comme isolant pour fabriquer ses transistors et qu’aujourd’hui celui-ci est remplacé par un diélectrique High-K. Sans que l’on sache vraiment ce qui se cache derrière le High-K, je peux tout de même vous dire que ce nouvel isolant possède les mêmes propriétés électrique que son prédécesseur tout en se permettant le luxe d’être plus fin. Les nouveaux transistors gravés sur un die de Penryn le sont donc grâce à ce fameux High-K et même si çà ne vous parle pas plus que çà, selon Gordon Moore, il s’agit là d’une des avancées majeures dans la fabrication de transistors depuis 1960 !

Selon les prévisions d’Intel, l’approvisionnement de processeurs en 45nm depassera celui en 65nm d’ici au troisième trimestre 2008 et comme le futur est déjà en marche Intel à dores et déjà présenté un prototype de SRAM gravé en 32nm au dernier IDF en septembre dernier.


Un Conroe plus petit ?


Je vous l’ai dit en introduction, la micro architecture Penryn est plutôt à voir comme une grosse mise à jour de l’architecture Core (déja excellente au demeurant). Mais alors si on excepte la gravure en 45nm, pourquoi sortir un nouveau processeur maintenant ? Existe-t-il un bénéfice direct pour le consommateur ?

Lors de la conférence sur le Penryn que j’ai évoqué à la page précédente, le papa du Penryn, j’ai nommé Stephen Fischer, était présent alors une fois de plus il est inutile de vous dire que l’on n’aurait pas pu réver meilleur interlocuteur. Voici donc un tour d’horizon des nouveautés du Penryn en comparaison avec le Conroe.

En quelques chiffres le Conroe comportait 293 Millions de transistors sur un Die de 143mm2, le Penryn quand à lui comporte 410 Millions de transistors sur 107mm2 c’est à dire presque 30% de transitors en plus sur une surface 25% plus petite !

Les nouveautés du Penryn


La première nouveauté concerne la taille du cache de niveau 2 qui passe de 4Mo à 6Mo. Cette augmentation peut être directement mise au crédit du 45nm car, on le sait, le cache de niveau 2 dégage beaucoup de chaleur.

Intel introduit aussi avec l’architecture Penryn le Deep Power Down et le Enhanced Dynamic Acceleration. Dérriere ces terminologies issues fort probablement d’une bonne grosse seance de brainstorming entre marketteux, se cachent deux technologies destinées aux ordinateurs portables.
Le DPD est un nouvel outil de veille pour les processeurs. Lorsque le système d’exploitation n’a plus besoin de toute la puissance du processeur, il envoit une requête à ce dernier lui permettant de rentrer dans un état de veille plus ou moins avancé. Il existe actuellement 4 états :

[li>C0 : C’est le statut actif, toutes les fonctionnalitées du processeur sont activées.
[li>C1 : La tension et la fréquence du processeur sont abaissées.
[li>C3 : En plus de l’état C2, les PLL sont arrêtées et le cache de niveau 1 est vidé.
[li>C4 : En plus de l’état C3, une partie du cache de niveau est vidé.[/li>
En plus de tout celà Intel rajoute l’état C6 (le fameux DPD), mais cette fois, les cores et les différents cache sont complètement éteint, seul reste alimentées deux mémoires de 8Kb contenant les informations de reveil. Le processeur est alors alimenté en 0.3V.
Le gain est donc très facile à imaginer sur les ordinateurs portables

L’Enhanced Dynamic Acceleration est pour sa part un peu différent car il propose d’augmenter la tension d’un coeur lorsque l’autre est inactif dans les applications n’exploitant pas les deux coeurs.
Prennons par exemple un processeur sur lequel on sollicite beaucoup le premier coeur sur une application, mais le second est dans un état C3, la fréquence et la tension du premier coeur, vont donc être poussés un peu plus loin (à une fréquence appelée EDAT) cependant l’enveloppe thermique du processeur restera la même car le second coeur est dans un état de sommeil.
Le principe est donc très simple à comprendre et finalement on se demande pourquoi personne y a pensé avant ! Encore une fois cette technologie est reservée aux processeurs pour ordinateurs portables.

Enfin dernière innovation majeure de l’architecture Penryn, les instructions SSE4 pointent le bout de leur nez. Que l’on soit bien d’accord ce jeu d’instruction étant complètement nouveau il sera très difficile de conclure sur le bénéfice de celles-ci, en effet il faudrait compiler et linker à nouveau les applications pour les utiliser. Cependant elles sont là et méritent par conséquent que l’on s’y attarde un tant soit peu. Ces instructions sont au nombre de 47 et la principale force mise en avant par Intel concerne l’encodage vidéo. En effet lors d’un compression vidéo, beaucoup de travail d’analyse et de comparaison sont nécessaires au processeur.
Imaginons un match de football avec un tir au but le ballon va donc se déplacer sur l’écran et plutôt que de réencoder à chaque fois le ballon, le codec va déterminer sa trajectoire grâce à des algorithmes de comparaison (attention ne prennez pas ceci pour argent comptant, c’est très simplifié). Une des nouvelles instructions SSE4 propose donc de remplacer ce qui nécessite plusieurs lignes de code et plusieurs comparaisons en une seule instruction compréhensible par le processeur.
La gain annoncé par Intel sur une compression au format DivX (version de test 6.6.1 utilisant le SSE4) est de l’ordre de 63%. Très impressionnant et augurant de belle chose pour les HTPC.

Comme vous pouvez le constater l’architecture Penryn s’inscrit donc dans la continuité de l’architecture Conroe, mais la grosse nouveautée ne sera surement pas la plus visible pour le consommateur car il s’agit bel et bien du passage au 45nm.

Introduction


Passons maintenant au test de ce fameux processeur gravé en 45nm le Core 2 Quad QX9650. Il s’agit du tout premier Penryn commercialisé et cerise sur le gateau (surtout pour moi ...) c’est un Extrême Edition.
Comme son nom le laisse présager ce processeur possède 4 coeurs et comme sur les précédents Quad Intel, il s’agit tout simplement de deux die collés sur le même PCB.

Protocole de test


Les tests du processeur seront réalisés sur la machine suivante :

[li>Carte mère : Gigabyte P35 DQ6
[li>RAM : 4x1Go Crucial PC8500 EPP
[li>Carte Graphique : 8800GTS 640Mo
[li>OS : Windows Vista Home premium 32 bits
[/li>

Quoi de mieux pour vérifier la vélocité du Penryn que de lui opposer son petit frère à architecture Conroe cadencé aux mêmes fréquences ?
N’ayant pas à notre disposition de QX6850, nous avons pris un Q6600 overclocké à 3 Ghz (333*9).
Le refroidissement du processeur est quand à lui assuré par un refroidissement liquide.

Benchmark


Voici pour finir la liste des benchmark que je vous propose de découvrir au fil de ce test.

[li>BenchMark Revioo fait par un forumeur (Palito)
[li>CineBench R10
[li>SuperPI 8 Mega
[li>ScienceMark2 Primordia
[li>Compression Video DivX 6.7
[li>Compression Audio Lame
[li>Compression + Décompression RAR
[li>PCMarkVantage
[li>Blender
[li>Crysis[/li>
SuperPI 8M


Dès les premières présentations de l’architecture Core 2 Duo, SuperPI à été utilisé comme argument marketing car il faut bien l’avouer les processeurs Intel sont particulièrement à l’aise sur ce benchmark.
Ce benchmark permet de valoriser un ensemble Processeur / Mémoire, car les timings mémoires ont par exemple un impact non négligeable sur les performances. Pour valider l’apport du Penryn sur ce benchmark nous avons pris la version 8M de ce bench qui en règle générale, met entre 3 et 4 minutes à s’exécuter. Pour les scores c’est ci-dessous que ça se passe tout en sachant que plus il est bas et meilleur il est :



Sur ce benchmark notre Penryn est 6.5% plus rapide que l’ancienne architecture Intel. Sans être exceptionnel ce petit aperçu nous situe probablement l’écart de performances que l’on devrait retrouver par la suite.

ScienceMark 2


Il c’est plus particulièrement le benchmark Primordia qui a été utilisé pour évaluer les performances de nos processeurs sur les calculs scientifiques. Ce benchmark utilise principalement des calculs itératifs. Les résultats de ce test vont par conséquent principalement intéresser ceux qui sont adeptes du calcul distribué car c’est un principe de calcul qu’on retrouve très souvent dans ces projets. Voici les scores (le plus petit étant le meilleur) :



Une nouvelle fois on s’approche des 6%, ce qui peut sembler assez normal tant un super PI et un Primordia sont semblables en termes de calculs.

CineBench R10


CineBench est un benchmark effectuant le rendu d’une image, il s’agit de la nouvelle version R10 sortie en 2007. Les résultats présentés ci-dessous montrent les scores en mono et multi thread.



Dans la version MultiThread, le gain du Penryn est de l’ordre de 5%, c’est à dire toujours dans la même veine que les benchmarks précédents.
Compression Audio


Les tests de compression audio ont été effectués avec LameEnc, le fichier source est un fichier WAV de 45 minutes. Les résultats correspondent donc au temps (en secondes) nécessaire à cette conversion.



Je suis sur que vous vous attendez à ce que je vous dise qu’on gagne encore 5% et vous avez raison, le gain est similaire aux autres benchmark. Mais tout cela peut sembler cohérent car pour le moment, la seule nouveautés que l’on teste sur le Penryn est l’apport des 2Mo supplémentaires de cache de niveau 2.


Compression + Décompression RAR


Pour effectuer ce test, la version 3.61 de RAR à été mise à contribution. Le test porte sur la compression d’un gros fichier (500Mo), puis la décompression de celui-ci dans la foulée.



Cette fois-ci le gain passe à 10% en compression, l’apport du cache est très bénéfique à cette opération relativement couteuse en mémoire. En décompression en revanche les performances décollent puisqu’on observe un gain de 44% ! Je vous assure que quand j’ai vu ce résultat la première fois, j’ai recommencé le benchmark à plusieurs reprises, mais l’écart est toujours resté bel et bien le même !

Compression Vidéo


Pour ce benchmark nous avons pris le Codec DivX 6.7 qui supporte les instructions SSE4, fraichement inaugurées sur le Penryn. Le test consiste donc à prendre une vidéo MPEG de 654Mo (44 minutes) et à l’encoder en 1 passe à débit constant de 720Kb/sec


Le gain est cette fois-ci de 33% environ et même si l’on est loin des 60% annoncés par Intel lors de sa session de benchmark, on ne peut pas dire que ce soit négligable. Les apports du SSE4 en compression vidéo semblent se vérifier et offrir un potentiel assez intéressant.Voici deux benchs tout à fait nouveaux dans notre panoplie.

Blender


Blender est un logiciel de rendu d’images en 3D. Pour notre benchmark Le rendu concerne l’image suivante :



Plus le temps nécessaire pour effectuer le rendu de l’image est faible, meilleur est le processeur :



Le gain offert par le Penryn est de l’ordre de 14%, pour un processeur basé sur la même architecture ce résultat est très intéressant.

PcMark Vantage


Ce benchmark de FutureMark est sorti il y a très peu de temps. Pour notre processeur nous avons choisi de garder uniquement les scores Memories, TV and Movies et Gaming. Ces scores étant ceux qui correspondent le plus à l’usage courant du processeur :



Aussi surprenant que cela puisse paraitre en score gaming c’est bel et bien notre Q6600 qui semble le mieux s’en sortir. D’ailleurs sur ce benchmark nos processeurs sont tout à fait équivalents car notre Penryn n’est meilleur que de 3% en 'TV and Movies'.
BenchMark Revioo


Enfin terminons par un benchmark maison développé par un de nos forumeurs à savoir Palito.
Ce benchmark est constitué de 3 principaux tests et au final donne un score global. Vous pouvez le retrouver sur ce topic.



Si l’on prends le score global le gain offert par le Penryn est de l’ordre de 18%. Nous avions pu remarquer sur notre forum que le cache de niveau 2 revetait une certaine importance, en voici la confirmation.


Crysis


Enfin terminons notre séance de torture, par un benchmark on ne peut plus récent puisqu’il est sorti ce week end. Il s’agit du jeu tant attendu par des hordes de gamers, j’ai nommé Crysis !
Le benchmark en question est livré avec la démo. Nous avons fait tourner ce benchmark avec une carte graphique NVidia 8800GTS 640 en 1280*1024 sans utiliser l’anti aliasing. La demo fournie par Crytek met en scène plusieurs explosions et fait donc appel au processeur pour calculer notamment les effondrements et la physique.



Et non je ne me suis pas trompé dans les courbes c’est bien le Q6600 qui est devant (mais attention de très très peu) et on peut donc dire que les scores sont identiques. Je ne vais pas me risquer à expliquer cela, ce serait par trop hasardeux...
Gardez juste en tête que c’est un bench issu d’une démo et qu’a ce titre il est quand même largement sujet à caution.
Overclocking


Depuis les premières lignes de cet article, je vous ai dit que sur cette nouvelle gamme de processeurs l’accent avait été mis sur l’économie d’énergie toutefois ce n’est pas pour ça que nous allons nous dispenser d’une bonne petite séance d’overclock des familles !
Voici donc la fréquence maximum que nous avons pu obtenir, en refroidissant ce processeur avec un watercooling et en montant le Vcore à 1.45V (à l’origine à 1.25V) :



L’overclocking semble être encore une fois de la partie et ce Penryn ne semble pas en reste.
Pour vous donner un indice de performances, à cette fréquence j’ai pu boucler un SuperPI de 1Mo en 10 secondes et 584 centièmes.


Conclusion


Il reste un aspect de ce Penryn que je n’ai pas pu tester faute de moyen: sa consomation. Intel nous annonce qu’à fréquence équivalente le Penryn consomme 60W de moins en charge que son prédesceceur. Il s’agit certes d’une donnée mise en avant par Intel mais ce chiffre approximatif m’a été confirmé par une source complètement indépendante et d’ailleurs vous devriez le retrouver dans les tests de nos confères.

Si on devait synthétiser ce Penryn la plus grosse avancé, on le savait déjà, concerne le procédé de gravure en 45nm. C’est ce procédé a permis à Intel de rajouter 2Mo de cache supplémentaire par Coeur.
Les performances brutes sont en amélioration sensible mais il faut surtout voir que ce Penryn prépare l’avenir et met l’accent sur l’énergie.

Mais attention énergie ne rime pas forcément avec dégagement calorifique, en effet le Qx9650 conservec un TDP de 135W, d’ailleurs les différents relevés que nous avons réalisés au cours de notre test (sous watercooling) montrent une température complètement équivalente à notre Q6600 (Revision G0).

Concernant le processeur que nous avons testé aujourd’hui, il s’agit d’une version Extreme Edition et on devrait la retrouver dans le commerce le 12 Novembre prochain pour un prix aux alentours du millier d’euros. Je ne vais pas vous dire que le jeu en vaut la chandelle mais ce processeur préfigure la gamme qui déboulera au premier trimestre 2008 avec les versions un peu plus 'démocratiques' du Penryn.

Pour conclure on peut affirmer sans se tromper que ce processeur est dans la lignée des précédents Core 2. Intel à réussi avec brio son passage au 45nm en produisant un processeur un peu plus performant que la génération précédente mais surtout avec un joli potentiel (voir l’encodage DivX) tout en étant moins gourmant en énergie. Il s’agit donc d’un très bon produit même si je serais tenté de dire que l’on en attendait pas moins au regard des annonces d’Intel.





  • Commenter cet article sur notre forum!
  • Processeurs Intel sur notre comparateur de prix