enfrdepluk
Rechercher trouver 4120  discussion sociale  tg2 f2 lin2 in2 Icône X 3 y2  p2 Tik vapeur2

AMD dévoile ROCm 7 : accélération de l'inférence IA jusqu'à 3.8 x et prise en charge complète du MI350

AMD a officiellement annoncé la prochaine génération de logiciels open source - ROCm 7, concentré sur Accélération et prise en charge de l'inférence IA pour la série Instinct MI350La nouvelle pile technologique remplace ROCm 6 et comprend prise en charge des formats FP8, FP6 et FP4et optimisations pour le traitement distribué et le pré-remplissage.

AMD ROCm 7

ROCm 7 introduit de nouveaux algorithmes et noyaux, notamment Autoréglage GEMM, MoE, Attention et noyaux Python, et des frameworks ont également été ajoutés vLLM v1, llm-d et SGLangLe principal gain de performance a été enregistré dans les tâches d’inférence : jusqu'à 3.5× plus rapide que ROCm 6, avec un maximum 3.8× dans DeepSeek R1, 3.2× dans Llama 3.1 70B и 3.4× dans Qwen2-72B.

ROCm 7 sur MI355X surpasse Blackwell B200 avec CUDA de 30 % par le débit dans DeepSeek R1 (FP8). De plus, Accélérez l'apprentissage jusqu'à 3× Obtenu dans Llama 2, 3.1 et Qwen 1.5. La nouvelle pile est également évolutive en termes de CPU, GPU et DPU, fournissant Solutions universelles pour les tâches d'IA d'entreprise et d'IA GenAI.

Ajouter un commentaire

AMD présente l'Instinct MI350 : 20 PFLOP, 185 milliards de transistors et jusqu'à 36 To de mémoire HBM3e dans un rack

AMD a officiellement annoncé Instinct MI350 - nouvelle génération GPU pour l'IA et le HPC, basé sur l'architecture Technologie de procédé CDNA 3 et TSMC 3 nmLe produit phare MI355X contient jusqu'à 185 milliards de transistors et prend en charge Calcul FP6/FP4 avec des performances de pointe jusqu'à 20 PFLOP.

instinct

Les MI350X et MI355X sont équipés de HBM3e d'une capacité allant jusqu'à 288 Go et offrent un débit allant jusqu'à 8 To/s. Un seul nœud peut utiliser à 8 GPU, et dans le rack du serveur - jusqu'à 128 accélérateurs et 36 To HBM3e. AMD a également introduit la nouvelle norme UBB8 pour une intégration rapide du refroidissement liquide et par air.

Performances du MI355X FP64 jusqu'à 79 TFLOP, et en FP16 - 5 PFLOP. Comparé au MI300X, le gain dans les tâches d'IA (par exemple, Llama 3.1) atteint 35× par débit. Également enregistré Des performances jusqu'à 2.2 fois supérieures à celles des B200 et GB200 dans le calcul FP6, malgré le prix inférieur.

Le MI355X est 1.2 à 1.3 fois plus rapide que le B200/GB200 dans les tâches de génération de jetons et de lamas DeepSeek, et une série Le MI400 est déjà en développement et sortira en 2026.

Ajouter un commentaire

La RX 9070 XT avec mémoire Samsung GDDR6 s'est avérée plus lente : jusqu'à -2 % de performances

Une étude indépendante est parue sur la plateforme chinoise Bilibili, révélant Baisse des performances de la RX 9070 XT avec la mémoire Samsung GDDR6 Comparé à des cartes graphiques similaires utilisant des puces SK Hynix, ces résultats ont été confirmés après avoir testé plus de 20 cartes graphiques.

GtPEklhbgAAbrd8

La différence était comprise entre 1 et 2 % dans les indices de référence synthétiques, y compris 3DMark Speedway, où même les versions overclockées avec mémoire Samsung étaient inférieures aux modèles standard sur SK Hynix. Le chercheur a également signalé Samsung a augmenté la latence de la mémoire, atteignant 380 ns, contre 360 ​​ns pour les concurrents.

AMD confirme le problème, citant les timings spécifiques et les caractéristiques architecturales de la mémoire GDDR6 de Samsung. Ceci est un nouvel exemple de l'impact du type de mémoire sur les performances réelles, même au sein d'un seul modèle. GPU.

Même aux mêmes fréquences, la RX 9070 XT avec mémoire SK Hynix surpasse systématiquement ses homologues Samsung GDDR6, malgré le fait que les autres paramètres soient identiques. Le problème affecte tous les lots avec des puces Samsung quel que soit le fabricant de la carte vidéo.

Ajouter un commentaire

AMD publie le pilote Adrenalin 25.6.2 avec de nouveaux jeux et la prise en charge de FSR 4

AMD publie une mise à jour facultative du pilote Adrenalin 25.6.2, qui inclut la prise en charge de nouveaux jeux, une liste étendue de projets avec FSR 4 et des correctifs pour plusieurs problèmes. Le pilote est disponible pour Windows 10 et Windows 11.

GPUs Dans Adrénaline

La liste des nouveaux jeux avec prise en charge complète de Radeon a été ajoutée The Alters et FBC : Pare-feu. En outre, La technologie AMD FSR 4 est désormais officiellement prise en charge dans quatre nouveaux jeux: The Alters, Delta Force, Dragonkin: The Banished et RoadCraft. Cela renforce la présence de la mise à niveau évolutive nouvelle génération sur les titres actuels de 2025.

Le pilote corrige également des bugs critiques liés aux RX 9060 XT et RX 9070. En particulier, les plantages et les temps morts dans Marvel's Spider-Man 2 ont été éliminés, The Last of Us Part I et Warhammer 40,000 : Darktide. Problème de teinte verte résolu pour les propriétaires d'Oculus Rift S.

Les problèmes connus incluent l'instabilité dans Oblivion Remastered avec FSR activé, des plantages dans Cyberpunk 2077 et les chutes de FPS sur YouTube en 4K. Dans certains cas, des solutions temporaires sont suggérées, notamment la modification du taux de rafraîchissement et la désactivation du FSR.

Le package complet comprend la version du pilote 25.10.13.04 et une mise à jour pour Ryzen AI NPU, avec prise en charge des APU hybrides des séries Ryzen 7000 et AI 300. Vous pouvez télécharger le pilote depuis le site officiel d'AMD.

Ajouter un commentaire

Le PDG de Nvidia prévient que les restrictions américaines sur l'IA renforcent la position de la Chine

Le PDG de Nvidia, Jensen Huang, a exprimé ses inquiétudes quant à la politique américaine en matière d'IA envers la Chine. Lors de la conférence VivaTech à Paris, il a déclaré que malgré la supériorité technologique des États-Unis, l'isolement commercial pourrait conduire à une perte de terrain dans la course mondiale à l'IA.

huang

« Huawei couvre la Chine – et couvrira tous les autres si les États-Unis refusent de participer », a déclaré Huang. Il a toutefois noté que les mesures actuelles – notamment les restrictions à l’exportation, les restrictions de visa pour les étudiants chinois et les révisions de la loi CHIPS – pourraient saper le leadership de l’infrastructure américaine de l’IA.

Nvidia reconnaît son avantage technologique sur Huawei, mais met en garde contre la sous-estimation de son concurrent. En Chine, Huawei joue un rôle clé dans la construction de ses propres piles d'IA, et les restrictions américaines ne font qu'accélérer ce processus. Si l'écosystème américain refuse de coopérer avec la Chine, la pile chinoise pourrait devenir une norme mondiale, estime Huang.

Ces dernières années, la Chine a dépassé les États-Unis en termes de volume et de qualité des publications scientifiques dans le domaine des puces électroniques. Selon un rapport récent, la Chine a doublé la productivité scientifique américaine dans le domaine des semi-conducteurs avancés au cours de la dernière décennie. Cette tendance pourrait s'accélérer si les États-Unis continuent de réduire leurs financements et de limiter la collaboration internationale.

Huang a appelé à prendre en compte les conséquences à long terme des politiques à court terme. Tout en soulignant qu'il soutient le président et croit en une stratégie, Nvidia appelle à une approche plus prudente pour maintenir le leadership mondial de la technologie américaine.

Ajouter un commentaire

15 mois avec un moniteur OLED MSI : premiers signes de brûlure

Monitors Unboxed a publié un rapport mis à jour à propos des performances du moniteur OLED MSI MPG 321URX après 15 mois d'utilisation intensive. Le test a simulé le comportement d'un utilisateur régulier qui ne prend pas de mesures particulières pour se protéger contre l'épuisement professionnel : 8 heures par jour, 7 jours par semaine, Windows dans un thème clair, pas d'économiseurs d'écran ni d'applications statiques dans des zones fixes de l'écran.

Test de 3800 heures

Malgré les conditions extrêmes d'utilisation, l'état général du panneau reste acceptable. Le burn-in principal est observé en bas de l'écran (dans la zone de la barre des tâches) et verticalement, là où l'utilisateur place constamment le navigateur et l'éditeur de texte. Les images filtrées aident à révéler un épuisement professionnel invisible à l'œil nu, en particulier lorsque vous regardez des vidéos YouTube où la compression masque des changements subtils.

Des écarts notables ont également été enregistrés dans la balance des couleurs : le sous-pixel vert est celui qui s'est le plus dégradé. Selon l'auteur, le moniteur, dans son état actuel, peut encore être utilisé pour la correction colorimétrique professionnelle pendant un maximum de neuf mois. Sa durée de vie totale sous de telles charges est d'environ deux à trois ans.

Il est important de prendre en compte que les tests sont effectués sur une seule instance, contrairement aux grands projets comparatifs. Cependant, Monitors Unboxed continuera de publier des mises à jour à mesure que le panneau OLED s'use davantage.

Ajouter un commentaire

Zen 7 : jusqu'à 32 cœurs et un nouveau socket AM6

Bien que AMD n'a pas encore dévoilé sa gamme de processeurs Zen 6, de nouvelles fuites sont apparues en ligne révélant Spécifications préliminaires du Zen 7, prévu au plus tôt en 2026. Selon les informations d'un initié La loi de Moore est morte, les futures puces recevront jusqu'à 32 cœurs et 64 threadset utilisera le nouveau socket AM6.

Zen 7

Il est rapporté que Zen 7 sur ordinateur de bureau sera composé de deux puces CCD à 16 cœursCe changement architectural améliorera les performances et étendra la mémoire cache. La fuite souligne spécifiquement que sera disponible en versions « classiques » avec V-Cache, ainsi que des variantes sans mise en cache 3D. Cependant, même les processeurs de base conserveront une quantité accrue de cache LXNUMX sur chaque CCD.

Il est prévu que les versions avec 3D V-Cache seront plus économes en énergie, mais avec une fréquence plus basse, tandis que les processeurs Zen 7 standard pourront offrir hautes fréquences et tensionsCela signifie qu'AMD s'en tiendra toujours à deux directions : pour les joueurs et les professionnels, en mettant l'accent sur différentes priorités : fréquence et cache.

Ajouter un commentaire

Lian Li dévoile l'Uni Fan SL-Infinity Wireless : des ventilateurs presque sans fil avec des limitations

Lian Li annonce les ventilateurs sans fil Uni Fan SL-Infinity, positionné comme « véritablement sans fil ». Cependant, en pratique, il ne sera pas encore possible de se débarrasser complètement des câbles. Les ventilateurs nécessitent soit un module avec un fil, soit une alimentation électrique à durée limitée provenant d'une banque d'alimentation.

Lian Lis

Les premières versions de test peuvent fonctionner jusqu'à 30 minutes depuis une batterie externe, mais l'option de base implique l'utilisation de module sans fil, qui se connecte à un groupe de ventilateurs et reçoit de l'énergie via un connecteur PWM standard. Les commandes sont transmises sans fil., et le contrôle est effectué par Récepteur USB, connecté à la carte mère. Support logiciel L-Connect 3 vous permet de personnaliser le rétroéclairage, d'ajuster la vitesse de rotation et de surveiller les paramètres du système.

Les fans de Lian Li apprécieront le look haut de gamme - chaque éventail comprend 58 LED RVB, situés autour du périmètre, au centre et sur les côtés, ainsi que effets « miroir infini »Les modèles sont disponibles en noir et blanc, ainsi qu'avec des lames normales et inversées. La version standard fonctionne à des vitesses allant jusqu'à 2300 tr/min avec des niveaux de bruit allant jusqu'à 30 dBA, et le réversible - jusqu'à 2200 tr/min avec un débit d'air plus élevé, mais aussi un bruit jusqu'à 32 dBA.

Ajouter un commentaire

MIG Flash est désormais compatible avec la Nintendo Switch 2

L'équipe MIG Flash (anciennement MIG-Switch) a officiellement confirmé que sa nouvelle version de la carte flash prend en charge la Nintendo Switch 2, malgré des problèmes de compatibilité initiaux. Le site web du produit affiche déjà un message « Compatible avec la Switch 2 », et une démo récente a montré comment lancer à partir d'un appareil La Légende de Zelda : Échos de la Sagesse — bien qu’avec un retard de chargement notable.

Flash MIG

MIG Flash est un émulateur de cartouche, qui se fait passer pour des cartes de jeu originales et permet d'exécuter des images de jeu depuis une microSD. Initialement destinée au stockage de copies personnelles et au soutien des développeurs indépendants, la carte flash est rapidement tombée dans le collimateur des pirates. Cependant, le fabricant ne le révèle pas. comment la compatibilité avec la Switch 2 a-t-elle été obtenue, cependant, la cause la plus probable était mise à jour du firmware, contournant les nouveaux mécanismes de sécurité de Nintendo.

Il est important de comprendre que Les jeux Switch 2 ne peuvent pas encore être abandonnés, et le lancement avec MIG Flash n'est possible que pour les projets de la première console. Cependant, même une telle fonctionnalité est alarmante, car Chaque cartouche Switch contient un identifiant uniqueEt Nintendo pourrait suivre les tentatives de lancement de sauvegardesCela peut conduire à une interdiction de compte, à une interdiction de console ou même à son blocage.

Ajouter un commentaire

NVIDIA prépare une GeForce RTX 5060 SUPER avec 12 Go de GDDR7

Suite à la fuite concernant les puces GDDR3 de 7 Go dans la RTX PRO 6000, il est devenu connu que NVIDIA prévoit de dévoiler la GeForce RTX 5060 SUPER avec 12 Go de mémoire dès fin 2025. Ce sera la première carte graphique grand public basée sur l'architecture Blackwellqui recevra configuration GDDR7 non standard - 3 Go par puce au lieu des 2 Go habituels.

GeForce RTX 5060 SUPER

Selon les données d'ingénierie, la RTX 5060 SUPER utilisera 4 puces GDDR7 de 3 Go, ce qui donnera un volume total de 12 Go à Bus 128 bits. Auparavant, ces puces mémoire étaient — Samsung K4VCF325ZC — n'étaient présentes que dans les RTX PRO 6000 et RTX 5090 mobile, où elles étaient utilisées pour des configurations de 24 et 48 Go respectivement. Ces puces fonctionnent à des fréquences allant jusqu'à 28 Gbps et vous permettent d'augmenter le volume sans augmenter le nombre de canaux mémoire.

Il est important de noter que tous les ordinateurs de bureau RTX 50xx actuels utilisent des puces de 2 Go (K4VAF), et les puces de 3 Go étaient considérées comme expérimentales. Cependant, les circuits imprimés des modèles équipés de puces Blackwell étaient initialement conçus pour prendre en charge ces modules, et des vidéos d'ingénierie ainsi qu'une vidéo officielle NVIDIA du début de l'année le confirment. la transition vers 3 Go de GDDR7 ne nécessite pas de nouvelle architecture - seulement un changement dans la configuration STRAP et micro firmware.

Si la RTX 5060 SUPER est livrée avec 12 Go de mémoire, cela résoudrait l'un des principaux problèmes de la RTX 5060 de base (8 Go), qui a été critiquée pour ne pas avoir suffisamment de capacité dans les jeux modernes. Cela ouvrira également la voie aux futures versions. RTX 5080 SUPER avec 24 Go и RTX 5090 SUPER avec 48 Go, qui pourra utiliser les mêmes 12 ou 16 puces de 3 Go, sans modifier la conception de la carte.

Ajouter un commentaire