人工智能的進步正在主導主流話題。 AI 的應用似乎是無限的——它會改變我們的世界以及我們與之互動的方式也就不足為奇了。與許多其他行業一樣,這尤其適用於增強現實。

AI 模型已被用於構建身臨其境的 AR 體驗——尤其是在 移動設備應用程序。增強現實和人工智能領域正在共同創造直觀、獨特的體驗,更徹底地融合真實世界和數字世界。 AI 和 AR 開發的下一個前沿領域是將先進的 AI 功能應用到消費類 AR 眼鏡中,以擴大沉浸式參與的可能性。

生成式 AI 將加速 3D 世界的創建,並為佩戴者創造自己的現實

生成式 AI 在算法、語言模型和增強的處理能力方面取得了進步,可用於運行必要的計算來映射物理世界並與之交互。

迄今為止,AR 眼鏡中的 3D 模型限制,因為它們本質上是手動的。然而,生成式 AI 會非常快速且自主地創建這些。 AR 眼鏡中的生成式 AI 將有助於更快地構建 3D 模型,從而釋放 AR 的全部潛力。這種覆蓋物理世界的數字世界的創建將更快、更完整和身臨其境,而無需大量的體力勞動。

生成式 AI 還將改變用戶體驗以及我們與物理空間的交互方式.借助支持生成式 AI 的 AR 眼鏡,佩戴者可以真正將他們的想像力轉移到現實世界中。無需編碼,佩戴者可以使用語音識別通過他們的 AR 眼鏡“說出”他們想要的圖像和 3D 對象。他們可以說:“想像一下,有一隻海豚在房間裡游來游去”——然後它就會出現在他們面前。這種沉浸式體驗在娛樂、工作等方面幾乎是無限的。

採用生成式 AI 的 AR 眼鏡也將改變遊戲世界,創造更加身臨其境和個性化的遊戲體驗。例如,使用 ChatGPT,可以更輕鬆地創建更逼真的角色並添加新的任務或遊戲世界。它還可用於通過分析玩家行為來改善遊戲體驗,讓玩家實時更輕鬆或更具挑戰性,自主定制體驗。

支持 AI 的語音翻譯+ 書面文字將減少語言障礙

自動語音識別 (ASR) 使用神經網絡視聽語音識別(一種依靠圖像處理來提取文本的算法)。這可以將書面文字(例如外國菜單上的文字)實時翻譯成您的母語。

當應用於 AR 眼鏡時,它可以提供您母語的實時字幕,而有人正在用另一種語言說話——一切都在你的增強現實眼鏡的框架內。這消除了試圖用當地語言交流的遊客和商務人士的挫敗感,從而營造了一個更具交流性和協作性的世界。

文本識別和翻譯相結合 AI 光學字符識別 (OCR) 技術與文本到文本的翻譯引擎,例如 DeepL。 Stable Diffusion 等 AI 引擎還可以通過動畫或其他有助於傳達複雜或詳細概念的視覺輔助來增強人們的交流。這加深了用戶的參與度:一副採用這種 AI 的 AR 眼鏡可以實時展示與用戶在面板或演示中在他們面前所說的內容相關的相應圖像或視頻。 Google 最近取笑開發 AR具有此功能的眼鏡。

它還啟用了 聾人社區通過立即將音頻轉換為顯示在佩戴者眼前的字幕,無需唇讀或眼神交流即可參與日常對話。

人工智能正在醫療保健、教育和許多其他領域發揮作用。很快我們就會擁有智能 AR 眼鏡,就像流行的科幻小說一樣,它將把人們帶入增強現實或虛擬現實環境,在這種環境中,AI 可以快速映射房間和說話者的位置,無論任何一方身在何處,都可以實現無縫且不那麼繁瑣的虛擬通信。

AI 幫助 AR 眼鏡輕鬆檢測和標記現實世界中的物體——加深參與度。

對象檢測中的捲積神經網絡 (CNN) 算法目前在移動設備中用於估計場景中對象的位置和範圍。一旦它檢測到一個物體,AR 軟件就可以將文本疊加到它上面或在物理世界中生成另一個物體,並在兩者之間創建交互。轉移到現實世界中的對象具有許多應用,包括指導、導航、飲食和營養等等。

例如,當佩戴具有這些 AI 功能的 AR 眼鏡時,用戶可以走路任何城市的街道,並在查看時實時了解任何地標。 AR 眼鏡可以通過佩戴者的鏡架識別、標記和提供有關城市及其地標的信息。隨著物體識別技術的改進,任何食物和份量的卡路里、蛋白質、脂肪和膽固醇等營養數據都將可用。與此同時,產品上簡單的二維碼將為用戶聯想到營養細節。

除了純粹的物體檢測,人臉識別軟件也越來越普遍地用於人物檢測。隨著越來越多的航班使用該技術來確認乘客的身份,面部識別已經在航空業起飛——增加了額外的安全層並加快了登機過程。當面部識別應用於 AR 眼鏡時,可以為任何地方的佩戴者提供識別能力。例如,在不久的將來,借助 AR 眼鏡,您可能能夠在社交媒體上與其他人會面並即時接收他們的背景信息,然後再決定是否要與他們“交朋友”或聯繫。

AI支持 AR 的眼鏡正在改變我們的生活,它們的視覺效果和功能將不斷提高。在我們日益互聯的世界中,他們正在簡化任務並打破僅在幾年前被認為是不可逾越的障礙。人工智能的進步如此之快,以至於在接下來的 10 年裡,人工智能將取得比之前 50 年更多的進步。無論是政府、企業還是個人環境,人工智能都將很快與 AR 眼鏡融合,融合我們的物理環境和數字環境。

By Henry Taylor

我是後端開發人員。 你們中有些人可能在開發者大會上見過我。 最近我一直在做一個開源項目。