Meta开发通用神经解码器,显著提升XR手势键盘输入性能
可通用的神经解码器
(映维网Nweon 2025年04月03日)单词手势键盘(Word-Gesture Keyboards/WGK) 是一种通过连续滑动或手势轨迹输入单词的键盘技术,核心思想是通过用户手指在虚拟键盘的滑动路径,快速识别并输入完整单词,而非逐个字母点击。
WGK对于扩展现实而言是一种富有前景的键盘输入。传统的方法容易产生解码不准确的噪点轨迹。尽管基于神经网络的解码器(神经解码器)已有提出训练文字手势轨迹数据来提高准确性,但它们有自己的局限性:需要大量的训练数据和深度学习专业知识来实现。
为了应对相关挑战,Meta和布里斯托大学团队提出了一种结合了易于实现和高解码精度的新颖解决方案:一种可通用的神经解码器。通过对大规模粗略离散的文字-手势轨迹进行预训练来实现。
这种方法产生了一种现成的解码器。对四个不同的数据集进行评估,它的平均准确率高达90.4%,并以37.2%的增强明显优于SHARK2,并超过传统的神经解码器7.4%。另外,在不牺牲精度的情况下,量化后预训练神经解码器的大小仅为4mb,并且可以实时运行,在Quest 3中只需97毫秒即可执行。
......(全文 1691 字,剩余 1297 字)
请微信扫码通过小程序阅读完整文章或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限