Meta开源通用框架Theseus，可互补传统技术、视觉方法、深度学习的优势

编辑：广东客 | 分类：论文 | 2022年10月31日

适用于计算机视觉等用例

（映维网Nweon 2022年10月31日）Meta人工智能团队早前开源了一个可微分非线性最小二乘（NLS）的优化技术库Theseus。据介绍，Theseus基于PyTorch，适用于机器人和计算机视觉等用例，允许研究人员能够轻松地将专家领域知识融入现代AI架构。它将knowledge表示为优化问题，并在基于梯度的学习过程中将其作为模块化“优化层”添加到架构之中。这个domain knowledge与训练数据不同，它可以帮助模型实现更为准确的预测。例如，为了确保机器人的运动平稳，研究人员可以将机器人的实现方式和运动模式的knowledge作为一个层，同时对机器人进行端到端的运动训练。

Theseus是一个为可微非线性优化提供跨应用框架的库。Theseus非常高效，可通过支持批处理、GPU加速、稀疏解算器和隐式微分来加速计算和内存。Meta宣称，它比谷歌基于C++的Ceres Solver（不支持端到端学习）快四倍。

Theseus融合了将prior knowledge注入人工智能系统的两种主流方法的最佳方面。在深度学习出现之前，研究人员使用更简单、独立的AI优化算法来解决机器人中的单个问题。通过计算手动选择的因素组合的最小值，机器人系统学会了执行命令的最佳方式。这种方法有效但不灵活。特定于应用的优化算法通常难以适应新的系统或环境。

另一方面，深度学习方法的可扩展性要高得多，但它们需要大量的数据，会产生有效但在training domain之外脆弱的解决方案。

......（全文 1638 字，剩余 1146 字）

wx_mp