Alors que je me dirigeais vers le centre d'accueil Intel à Santa Clara, en Californie, un grand groupe d'adolescents sud-coréens a couru de leur bus et s'est rassemblé avec enthousiasme autour du grand panneau Intel pour les selfies et les photos de groupe. C'est le genre de fandom que vous pourriez vous attendre à voir chez Apple ou Google. Mais Intel?

Ensuite, je me suis souvenu qu'Intel est la société qui a mis le «silicium» dans la Silicon Valley. Ses processeurs et autres technologies ont fourni une grande partie de la puissance sous le capot pour la révolution des ordinateurs personnels. À 51 ans, Intel a toujours une certaine puissance star.

Mais elle traverse également une période de profond changement qui remodèle la culture de l'entreprise et la façon dont ses produits sont fabriqués. Comme toujours, les principaux produits d'Intel sont les microprocesseurs qui servent de cerveau aux ordinateurs de bureau, aux ordinateurs portables et tablettes et aux serveurs. Ce sont des tranches de silicium recouvertes de millions ou de milliards de transistors, dont chacun a un état "on" et "off" correspondant au langage binaire "uns et zéros" des ordinateurs.

Depuis les années 1950, Intel a réalisé une augmentation constante de la puissance du processeur en bloquant toujours plus de transistors sur ce morceau de silicium. Le rythme était si soutenu que le cofondateur d'Intel, Gordon Moore, pouvait faire sa fameuse prédiction de 1965 selon laquelle le nombre de transistors sur une puce doublerait tous les deux ans. La «loi de Moore» a été maintenue pendant de nombreuses années, mais l'approche de bourrage de transistors d'Intel a atteint un point de rendement décroissant, selon les analystes.

À 51 ans, Intel a toujours une certaine puissance star.

Pendant ce temps, la demande de plus de puissance de traitement n'a jamais été aussi grande. La montée de l'intelligence artificielle, qui, selon les analystes, est désormais largement utilisée dans les processus métier de base dans presque tous les secteurs, pousse la demande de puissance de calcul à un surmultiplié. Les réseaux de neurones nécessitent des quantités massives de puissance de calcul et ils fonctionnent mieux lorsque des équipes d'ordinateurs partagent le travail. Et leurs applications vont bien au-delà des PC et des serveurs qui ont fait d'Intel un monstre en premier lieu.

«Qu'il s'agisse de villes intelligentes, que ce soit un magasin de détail, que ce soit une usine, que ce soit une voiture, que ce soit une maison, tout cela ressemble à des ordinateurs aujourd'hui», explique Bob Swan, président d'Intel depuis janvier 2019. Le changement tectonique de l'intelligence artificielle et les ambitions d'Intel à se développer ont obligé la société à modifier les conceptions et les fonctionnalités de certaines de ses puces. L'entreprise élabore des logiciels, conçoit des puces qui peuvent fonctionner ensemble et cherche même à l'extérieur de ses murs pour acquérir des entreprises capables de les mettre à niveau dans un monde informatique en mutation. Plus de transformation est sûre à venir, car l'industrie s'appuie sur Intel pour alimenter l'IA qui trouvera de plus en plus sa place dans nos vies professionnelles et personnelles.

La mort de la loi de Moore

Aujourd'hui, ce sont principalement les grandes entreprises technologiques dotées de centres de données qui utilisent l'IA pour l'essentiel de leurs activités. Certains d'entre eux, comme Amazon, Microsoft et Google, proposent également l'IA en tant que service cloud aux entreprises. Mais l'IA commence à se propager à d'autres grandes entreprises, qui formeront des modèles pour analyser et agir sur d'énormes corps de données d'entrée.

Une photo de 1978 montre Gordon Moore (à droite) avec les cofondateurs d'Intel Andy Grove et Robert Noyce. (Photo: gracieuseté d'Intel Corporation)

Ce changement nécessitera une quantité incroyable de calcul. Et la soif des modèles d’IA pour la puissance de calcul est le point de départ de la renaissance de l’IA dans la loi de Moore.

Pendant des décennies, la prédiction de Moore de 1965 a eu beaucoup de sens pour l’ensemble de l’industrie technologique. Tant les fabricants de matériel que les développeurs de logiciels ont traditionnellement lié la feuille de route de leurs produits à la puissance qu’ils peuvent attendre des CPU de l’année prochaine. La loi de Moore a permis à tout le monde de «danser sur la même musique», comme le dit un analyste.

La loi de Moore impliquait également la promesse qu'Intel continuerait de déterminer, année après année, comment fournir le gain attendu de puissance de calcul dans ses puces. Pendant la majeure partie de son histoire, Intel a tenu sa promesse en trouvant des moyens de caler plus de transistors sur des morceaux de silicium, mais c'est devenu plus difficile.

«Nous manquons de gaz dans les usines de puces», explique Patrick Moorhead, analyste principal de Moor Insights & Strategy. "Il devient de plus en plus difficile de fabriquer ces énormes puces et de les rendre économiques."

Nous manquons de gaz dans les usines de puces. "

Patrick Moorhead

Il est toujours possible de presser un plus grand nombre de transistors dans des tranches de silicium, mais cela devient plus cher et prend plus de temps à le faire – et les gains ne sont certainement pas suffisants pour répondre aux exigences des réseaux de neurones que les informaticiens construisent. Par exemple, le plus grand réseau de neurones connu en 2016 avait 100 millions de paramètres, tandis que le plus grand à ce jour en 2019 a 1,5 milliard de paramètres, un ordre de grandeur plus grand en quelques années seulement.

C'est une courbe de croissance très différente de celle du paradigme informatique précédent, et cela met la pression sur Intel pour trouver des moyens d'augmenter la puissance de traitement de ses puces.

Cependant, Swan considère l'IA comme une opportunité plutôt qu'un défi. Il reconnaît que les centres de données peuvent être le principal marché d'Intel à en bénéficier, car ils auront besoin de puces puissantes pour la formation et l'inférence sur l'IA, mais il pense qu'Intel a une opportunité croissante de vendre également des puces compatibles avec l'IA pour les petits appareils, tels que les caméras intelligentes et capteurs. Pour ces appareils, c'est la petite taille et l'efficacité énergétique, et non la puissance brute de la puce, qui font toute la différence.

Le PDG d'Intel, Bob Swan (Photo de Mark Sullivan prise au siège d'Intel à Santa Clara, en Californie, le 17 octobre 2019.)

«Il y a trois types de technologies qui, selon nous, continueront de s'accélérer: l'une est l'IA, l'autre la 5G, et l'autre les systèmes autonomes – des choses qui se déplacent qui ressemblent à des ordinateurs», explique Swan, l'ancien directeur financier d'Intel qui a succédé en tant que PDG. lorsque Brian Krzanich est parti après des allégations d'une liaison extraconjugale avec un membre du personnel en 2018.

Nous sommes assis dans une grande salle de conférence non descriptive au siège d'Intel. Sur le tableau blanc à l'avant de la salle, Swan fait ressortir les deux côtés des activités d'Intel. Sur le côté gauche se trouve le secteur des puces pour ordinateurs personnels – dont Intel tire environ la moitié de ses revenus maintenant. À droite se trouve son activité de centre de données, qui comprend les marchés émergents de l'Internet des objets, des voitures autonomes et des équipements de réseau.

«Nous étendons (dans) ce monde où de plus en plus de données sont nécessaires, ce qui nécessite plus de traitement, plus de stockage, plus de récupération, un mouvement plus rapide des données, des analyses et des renseignements pour rendre les données plus pertinentes», dit Swan.

Plutôt que de prendre une part de quelque 90% du marché des centres de données de 50 milliards de dollars, Swan espère prendre une part de marché de 25% sur le marché plus vaste de 300 milliards de dollars qui comprend des appareils connectés tels que des caméras intelligentes, des voitures futuristes autonomes et équipement réseau. C'est une stratégie qui, selon lui, «commence par nos compétences de base et nous oblige à inventer d'une certaine manière, mais étend également ce que nous faisons déjà». Cela pourrait également être un moyen pour Intel de rebondir après son échec à devenir un acteur majeur. fournisseur de technologie pour le secteur des smartphones, où Qualcomm a longtemps joué un rôle similaire à Intel. (Plus récemment, Intel a renoncé à son investissement majeur sur le marché des modems pour smartphones et a vendu les restes à Apple.)

Le marché de l'Internet des objets, qui comprend des puces pour robots, drones, voitures, caméras intelligentes et autres appareils qui se déplacent, devrait atteindre 2,1 billions de dollars d'ici 2023. Et tandis que la part d'Intel sur ce marché a augmenté de deux chiffres par an- sur un an, l'IoT ne représente encore aujourd'hui qu'environ 7% des revenus globaux d'Intel.

Le secteur des centres de données représente 32%, le deuxième plus gros segment derrière le secteur des puces PC, ce qui représente environ la moitié du chiffre d'affaires total. Et c'est le centre de données que l'IA a le plus d'impact. C'est pourquoi Intel a modifié la conception de son processeur le plus puissant, le Xeon, pour prendre en charge les tâches d'apprentissage automatique. En avril, il a ajouté une fonctionnalité appelée «DL Boost» à ses processeurs Xeon de deuxième génération, qui offre de meilleures performances pour les réseaux neuronaux avec une perte de précision négligeable. C’est également la raison pour laquelle la société commencera l’année prochaine à vendre deux nouvelles puces spécialisées dans l’exécution de grands modèles d’apprentissage automatique.

La renaissance de l'IA

En 2016, il était devenu clair que les réseaux de neurones allaient être utilisés pour toutes sortes d'applications, des algorithmes de recommandation de produits aux robots en langage naturel pour le service client.

Comme d'autres fabricants de puces, Intel savait qu'il devrait proposer à ses gros clients une puce dont le matériel et les logiciels étaient spécialement conçus pour l'intelligence artificielle, qui pourraient être utilisés pour former des modèles d'intelligence artificielle, puis tirer des conclusions à partir d'énormes pools de données.

À l'époque, Intel manquait d'une puce qui pourrait faire le premier. Le récit de l'industrie était que les processeurs Xeon d'Intel étaient très bons pour analyser les données, mais que les GPU fabriqués par le rival d'Intel en IA, Nvidia, étaient meilleurs pour la formation – une perception importante qui avait un impact sur les activités d'Intel.

Ainsi, en 2016, Intel est allé faire du shopping et a dépensé 400 millions de dollars pour une jeune entreprise dynamique appelée Nervana qui avait déjà travaillé sur une architecture de puce rapide déchirante conçue pour la formation de l'IA.

Cela fait trois ans depuis l'acquisition de Nervana, et il semble que ce soit une décision intelligente d'Intel. Lors d'un événement en novembre à San Francisco, Intel a annoncé deux nouveaux processeurs de réseau neuronal Nervana, l'un conçu pour exécuter des modèles de réseau neuronal qui déduisent la signification de grands corps de données, l'autre pour former les réseaux. Intel a travaillé avec Facebook et Baidu, deux de ses plus gros clients, pour aider à valider la conception de la puce.

Nervana n'était pas la seule acquisition d'Intel cette année-là. En 2016, Intel a également acheté une autre société, appelée Movidius, qui avait construit de minuscules puces qui pourraient exécuter des modèles de vision par ordinateur à l'intérieur de choses telles que des drones ou des caméras intelligentes. Les ventes de puces Movidius par Intel ne sont pas énormes, mais elles se sont développées rapidement et s'adressent au plus grand marché de l'IoT dont Swan est excité. Lors de son événement à San Francisco, Intel a également annoncé une nouvelle puce Movidius, qui sera prête au premier semestre 2020.

Intel Nervana NNP-I pour l'inférence (Photo: gracieuseté d'Intel Corporation)

De nombreux clients d’Intel effectuent au moins une partie de leurs calculs d’IA sur des processeurs Intel standard à l’intérieur de serveurs de centres de données. Mais il n'est pas si facile de relier ces processeurs afin qu'ils puissent associer le travail dont un modèle de réseau neuronal a besoin. Les puces Nervana, en revanche, contiennent chacune plusieurs connexions, de sorte qu'elles fonctionnent facilement en tandem avec d'autres processeurs dans le centre de données, me dit le PDG et fondateur de Nervana, Naveen Rao.

«Maintenant, je peux commencer à prendre mon réseau de neurones et je peux le séparer sur plusieurs systèmes qui fonctionnent ensemble», explique Rao. "Nous pouvons donc avoir un rack entier (de serveurs), ou quatre racks, travaillant ensemble sur un problème."

Naveen Rao, Vice-président et directeur général d'Intel, le groupe de produits d'Intelligence Artificielle Intel, présente un processeur Intel Neural Network à des fins d'inférence lors de son discours d'ouverture le mardi 12 novembre 2019, lors du sommet AI d'Intel à San Francisco. (Photo: Walden Kirsch / Intel Corporation)

En 2019, Intel prévoit de générer 3,5 milliards de dollars de revenus grâce à ses produits liés à l'IA. À l'heure actuelle, seule une poignée de clients Intel utilisent les nouvelles puces Nervana, mais ils devraient toucher une base d'utilisateurs beaucoup plus large l'année prochaine.

Transformer Intel, à partir de la puce

Les puces Nervana représentent l'évolution d'une croyance de longue date d'Intel selon laquelle un seul morceau de silicium, un processeur, pourrait gérer toutes les tâches informatiques qu'un PC ou un serveur devait effectuer. Cette croyance répandue a commencé à changer avec la révolution du jeu, qui exigeait le muscle informatique extrême nécessaire pour afficher des graphiques complexes sur un écran. Il était logique de décharger ce travail sur une unité de traitement graphique, un GPU, afin que le processeur ne s'enlise pas avec. Intel a commencé à intégrer ses propres GPU avec ses CPU il y a des années, et l'année prochaine, il sortira un GPU autonome pour la première fois, me dit Swan.

Cette même pensée s'applique également aux modèles d'IA. Un certain nombre de processus d’IA peuvent être gérés par le processeur au sein d’un serveur de centre de données, mais à mesure que le travail s’intensifie, il est plus efficace de le décharger sur une autre puce spécialisée. Intel a investi dans la conception de nouvelles puces qui regroupent un processeur et un certain nombre de puces d'accélérateur spécialisées d'une manière qui correspond aux besoins de puissance et de charge de travail du client.

"Lorsque vous construisez une puce, vous voulez assembler un système qui résout un problème, et ce système nécessite (souvent) plus qu'un processeur", explique Swan.

Lorsque vous construisez une puce, vous voulez mettre en place un système qui résout un problème. "

Bob Swan

De plus, Intel s'appuie désormais beaucoup plus sur les logiciels pour conduire ses processeurs vers des performances plus élevées et une meilleure efficacité énergétique. Cela a modifié l'équilibre des pouvoirs au sein de l'organisation. Selon un analyste, le développement logiciel chez Intel est désormais «un citoyen égal» avec le développement matériel.

Dans certains cas, Intel ne fabrique plus toutes ses puces par lui-même, ce qui change radicalement la pratique historique de la société. Aujourd'hui, si les concepteurs de puces demandent une puce qu'une autre entreprise pourrait fabriquer mieux ou plus efficacement qu'Intel, il est acceptable que le travail soit externalisé. La nouvelle puce Nervana pour la formation, par exemple, est fabriquée par le fabricant de semi-conducteurs TSMC.

Intel a externalisé une partie de la fabrication de puces pour des raisons logistiques et économiques. En raison des limites de capacité de ses processus de fabrication de puces les plus avancés, beaucoup de ses clients ont dû attendre leurs commandes de nouveaux processeurs Intel Xeon. Intel a donc externalisé la production de certaines de ses autres puces à d'autres fabricants. Intel a envoyé une lettre à ses clients plus tôt cette année pour s'excuser du retard et exposer ses plans de rattrapage.

Tous ces changements remettent en question les croyances de longue date d’Intel, changent les priorités de l’entreprise et rééquilibrent les anciennes structures de pouvoir.

Le fait est que les appareils mobiles sont devenus des distributeurs automatiques de services fournis à votre téléphone via le cloud.

Au milieu de cette transformation, les activités d'Intel se portent plutôt bien. Son activité traditionnelle de vente de puces pour ordinateurs personnels est en baisse de 25% par rapport à il y a cinq ans, mais les ventes de processeurs Xeon aux centres de données sont «en marche», comme le dit l'analyste Mike Feibus.

Certains clients d’Intel utilisent déjà les processeurs Xeon pour exécuter des modèles d’IA. Si ces charges de travail augmentent, ils pourraient envisager d'ajouter des nouvelles puces spécialisées Nervana. Intel s'attend à ce que les premiers clients de ces puces soient des «hyperscalers» ou de grandes entreprises qui exploitent d'énormes centres de données – les Google, les Microsofts et les Facebook du monde.

C'est une vieille histoire qu'Intel a raté la révolution mobile en cédant le marché des processeurs pour smartphones à Qualcomm. Mais le fait est que les appareils mobiles sont devenus des distributeurs automatiques de services fournis à votre téléphone via les centres de données du cloud. Ainsi, lorsque vous diffusez cette vidéo sur votre tablette, il est probable qu'une puce Intel vous aide à la diffuser. L'arrivée de la 5G pourrait permettre d'exécuter des services en temps réel tels que les jeux à partir du cloud. Une future paire de lunettes intelligentes pourrait être en mesure d'identifier instantanément des objets en utilisant une connexion ultra-rapide à un algorithme qui s'exécute dans un centre de données.

Tout cela s'ajoute à une époque très différente de celle où le monde technologique tournait autour des PC avec Intel à l'intérieur. Mais à mesure que les modèles d'IA deviennent de plus en plus complexes et polyvalents, Intel a la chance d'être la société la mieux équipée pour les alimenter, tout comme elle a alimenté nos ordinateurs pendant près d'un demi-siècle.


Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *