在近年来的科技浪潮中,人工智能(AI)无疑是最闪耀的明星之一。从深度学习到生成式技术,不同领域的创新不断推动着AI的边界。2024年9月19日,腾讯研究院的最新AI速递中报道了一系列引人瞩目的AI进展和应用,涵盖了人形机器人、增强现实、视频生成等多个前沿领域,让我们一同来探讨这些创新背后的核心科技和未来趋势。
首先,OpenAI对人形机器人初创公司1X的重金投资终于见到了成果。1X发布了名为NEO的机器人,它背后的「世界模型」技术,可以根据真实数据生成行为预测和交互模拟。这意味着,NEO不仅能够在不同环境中预测物体的交互,还能够有效完成诸如开窗、叠衣等日常任务。尽管这一模型还处于开发阶段,面临物体一致性和物理定律理解的挑战,但其潜力已经引发了广泛关注。
其次,在增强现实领域,社交巨头Snap发布了全新的AR眼镜Spectacles'24。新款眼镜具备改进的视野和分辨率,同时支持手部追踪功能,专为开发者设计。Spectacles'24的独立运行模式和内置电源使得使用更加便捷,配合SnapOS操作系统,为社交互动提供了更多可能。在这个信息爆炸的时代,Snap寄希望于开发者社区推动AR眼镜的应用,尽管当前硬件和软件仍有很大的发展空间。
此外,由北京大学、香港中文大学及腾讯联合推出的开源项目ViewCrafter为视频创作提供了新的思路。通过从单张图像或稀疏视角图像生成新视角视频,ViewCrafter结合了点云表征和视频扩散模型,展现出了高保真度的新视角生成能力。这将为视频制作、动画设计等多领域带来智能化的支持,简化创作过程。
在视频生成赛道上,Runway和Luma相继推出了API服务。Runway基于其先进的Gen-3AlphaTurbo模型,为用户提供了高速、低成本的视频生成服务,而Luma的DreamMachineAPI则支持文本输入生成视频,并具备高级的视频编辑功能。这两款服务的推出不仅旨在简化开发者的视频生成和编辑流程,也开启了AI视频创作的新局面。
在AI治理方面,OpenAI的安全委员会近日进行了重组,新委员会由卡内基梅隆大学的Zico Kolter担任主席,Sam Altman则已离开委员会。此举反映出AI监管的复杂性和日益严峻的挑战,正如众多专家所提及的,如何在快速发展的AI技术与安全、伦理之间找到平衡,将是未来的重要课题。
与此同时,英伟达宣布以1.65亿美元收购AI初创公司OctoAI。OctoAI专注于帮助开发者快速调整AI模型以适应不同芯片,其收购将进一步加强英伟达在AI和云计算市场的竞争力。这一战略布局不仅有助于降低开发成本,还能促进AI模型的广泛应用,展示出未来AI与硬件融合的潜力。
微软与贝莱德联合成立的全球最大AI投资基金GAIIP,目标是为AI技术的发展提供强有力的支持。募资规模达到300亿美元,增加总投资潜力至700亿美元,通过此举,微软旨在推动数据中心及能源设施的发展,使美国在全球AI领域的竞争力得到提升。
无独有偶,马斯克的Neuralink公司也在继续前行,其新产品Blindsight获得FDA“突破性设备认定”,旨在通过脑植入芯片帮助盲人恢复视觉。虽然这项技术的实际效果仍需进一步验证,但其在脑机接口领域的探索无疑为未来治疗视觉障碍提供了新的可能性。