Les progrès de l’intelligence artificielle dominent la conversation grand public. Les applications de l’IA semblent illimitées-et il n’est pas surprenant qu’elle transforme notre monde et la façon dont nous interagissons avec lui. Avec de nombreuses autres industries, cela s’applique particulièrement à la réalité augmentée.

Les modèles d’IA sont déjà utilisés pour créer des expériences de RA immersives, en particulier sur applications pour appareils mobiles. Les domaines de la réalité augmentée et de l’intelligence artificielle travaillent ensemble pour créer des expériences intuitives et uniques qui mélangent plus profondément les mondes réel et numérique. La prochaine frontière du développement de l’IA et de la RA consiste à mettre en œuvre des capacités d’IA avancées dans les lunettes de RA grand public afin d’élargir les possibilités d’engagement immersif.

L’IA générative accélérera la création de mondes 3D et créera des possibilités illimitées pour porteurs de créer leurs propres réalités

L’IA générative présente des avancées dans les algorithmes, les modèles de langage et la puissance de traitement accrue disponible pour exécuter les calculs nécessaires pour cartographier et interagir avec le monde physique.

À ce jour, il y a limitations sur les modèles 3D dans les lunettes AR car elles sont essentiellement manuelles. Cependant, Generative AI les créerait très rapidement et de manière autonome. L’IA générative dans les lunettes AR aidera à créer des modèles 3D plus rapidement, libérant ainsi tout le potentiel de la RA. Cette création du monde numérique, pour superposer le monde physique, sera plus rapide, plus complète et immersive sans travail manuel intensif nécessaire.

L’IA générative transformera également l’expérience utilisateur et la façon dont nous interagissons avec l’espace physique. Avec les lunettes AR compatibles Generative AI, les porteurs peuvent littéralement transposer leur imagination dans le monde réel. Sans avoir besoin de coder, les porteurs peuvent utiliser la reconnaissance vocale pour”dire”leurs images et objets 3D à travers leurs lunettes AR exactement comme ils le souhaitent. Ils pourraient dire: « imaginez qu’il y a un dauphin nageant dans la pièce » – et il apparaîtrait devant eux. Les possibilités de cette immersion sont pratiquement illimitées pour le divertissement, le travail et au-delà.

Les lunettes AR qui utilisent l’IA générative vont également changer le monde du jeu pour créer une expérience de jeu beaucoup plus immersive et personnalisée. Par exemple, avec ChatGPT, il sera plus facile de créer des personnages plus réalistes et d’ajouter de nouvelles quêtes ou des mondes de jeu. Il pourrait également être utilisé pour améliorer l’expérience de jeu en analysant le comportement du joueur et en rendant le jeu plus facile ou plus difficile pour le joueur en temps réel, en personnalisant l’expérience de manière autonome.

Traduction de la parole activée par l’IA + le texte écrit réduira les barrières linguistiques

La reconnaissance automatique de la parole (ASR) utilise la reconnaissance vocale audiovisuelle par réseau de neurones (un algorithme reposant sur le traitement d’image pour extraire le texte). Cela peut traduire un texte écrit-comme celui d’un menu dans un pays étranger-dans votre langue maternelle en temps réel.

Lorsqu’il est appliqué dans des lunettes AR, il peut fournir des sous-titres en temps réel de votre langue maternelle pendant que quelqu’un parle dans une autre langue-le tout dans les cadres de vos lunettes AR. Cela élimine la frustration des touristes et des hommes d’affaires qui tentent de communiquer dans la langue locale et favorise ainsi un monde plus communicatif et collaboratif.

La reconnaissance de texte et la traduction se combinent Techniques de reconnaissance optique de caractères (OCR) IA avec des moteurs de traduction texte à texte tels que DeepL. Les moteurs d’IA comme Stable Diffusion peuvent également améliorer la communication avec des animations ou d’autres aides visuelles qui peuvent aider à transmettre des concepts complexes ou détaillés. Cela renforce l’engagement de l’utilisateur : une paire de lunettes AR utilisant cette IA peut présenter une image ou une vidéo correspondante en temps réel qui est pertinente par rapport à ce que l’utilisateur dit devant lui lors d’un panel ou d’une présentation. Google a récemment taquiné le développement de la RA des lunettes avec cette fonctionnalité.

Il permet également au communauté sourde pour s’engager dans des conversations quotidiennes sans avoir besoin de lire sur les lèvres ou d’établir un contact visuel en transformant instantanément l’audio en sous-titres qui s’affichent devant les yeux du porteur.

L’IA s’impose dans les domaines de la santé, de l’éducation et de nombreux autres domaines. Bientôt, nous aurons un verre AR intelligent qui, comme la science-fiction populaire, transportera les gens dans des environnements de réalité augmentée ou virtuelle où l’IA cartographiera rapidement la pièce et la position de l’orateur pour rendre la communication virtuelle transparente et moins encombrante, peu importe où se trouve l’une ou l’autre des parties.

L’IA aide les lunettes AR à détecter et à étiqueter facilement les objets dans le monde réel, ce qui renforce l’engagement.

Les algorithmes de réseau neuronal convolutif (CNN) dans la détection d’objets sont actuellement utilisés dans les appareils mobiles pour estimer la position et l’étendue des objets dans une scène. Une fois qu’il détecte un objet, le logiciel AR peut y superposer du texte ou générer un autre objet dans le monde physique, et créer une interaction entre les deux. Les objets qui sont transposés dans le monde réel ont de nombreuses applications, notamment l’instruction, la navigation, l’alimentation et la nutrition, et bien d’autres.

Lorsqu’il porte une paire de lunettes AR avec ces capacités d’IA, par exemple, un utilisateur peut marcher les rues de n’importe quelle ville et découvrez n’importe quel point de repère en temps réel lors de sa visualisation. Les lunettes AR peuvent identifier, étiqueter et fournir des informations sur la ville et ses monuments-tout au long des montures du porteur. À mesure que la technologie de reconnaissance d’objets s’améliore, des données nutritionnelles telles que les calories, les protéines, les graisses et le cholestérol de tous les aliments et de toutes les portions seront disponibles. En attendant, de simples codes QR sur les produits évoqueront les détails nutritionnels pour les utilisateurs.

En dehors de la simple détection d’objets, les logiciels de reconnaissance faciale deviennent également monnaie courante pour la détection de personnes. Déjà, la reconnaissance faciale décolle dans l’industrie du transport aérien alors que de plus en plus de vols utilisent la technologie pour confirmer l’identité d’un passager, ajoutant une couche de sécurité supplémentaire et accélérant le processus d’embarquement. La reconnaissance faciale, lorsqu’elle est utilisée dans les lunettes AR, pourrait donner le pouvoir de reconnaissance aux porteurs du monde entier. Par exemple, dans un avenir proche, avec les lunettes AR, vous pourrez peut-être rencontrer d’autres personnes sur les réseaux sociaux et recevoir leurs informations de fond instantanément avant de décider si vous souhaitez vous lier d’amitié avec eux ou vous connecter avec eux.

IA Les lunettes AR compatibles changent nos vies et leurs visuels et leurs capacités continueront de s’améliorer. Dans notre monde de plus en plus connecté, ils simplifient les tâches et font tomber des barrières que l’on croyait il y a encore quelques années impénétrables. Les progrès de l’intelligence artificielle se produisent si rapidement qu’au cours des 10 prochaines années, l’IA fera plus de progrès que dans les cinquante qui l’ont précédée. Qu’il s’agisse du gouvernement, des entreprises ou d’un environnement personnel, l’intelligence artificielle fusionnera bientôt avec les lunettes AR pour mélanger nos environnements physiques et numériques.

By Henry Taylor

Je travaille en tant que développeur back-end. Certains d'entre vous m'ont peut-être vu à la conférence des développeurs. Dernièrement, j'ai travaillé sur un projet open source.