您现在的位置:首页 >> 创意家居

李飞飞团队提出零样本一般化的技术,性能超越SOTA!

发布时间:2025/07/29 12:16    来源:昆山家居装修网

采样。

写作者还科学研究了以上的组合,并尝试发现从低频和高频结构阻尼之中的随机抽样造成了最佳的总体结果。写作者注意到,在分离之中添加随机布料略微有利性能的大大提高,可能是因为它改善了校内手段也就是说的空间内不变性。

实验者以下内容

四种相同场景的感官手段普遍化相对于试验(从上至下):DMControl Suite、CARLA、Robosuite和iGibson

首到时,写作者重申了一个符合做四种相同分析方法的相对于试验,系统地评核感官agent的普遍化并能。

在每个分析方法之中,制作组科学研究了在一个生态环境之中军事训练的解法,在零采样最初设之中的各种确有生态环境之中的展示出如何。此时没有加分信号和额之外的试验。

在每个使命之中,SECANT以此前的SOTA解法为相对于:SAC、SAC+crop、DR、NetRand、SAC+IDM和PAD。

DMControl

科学研究制作组依照近人的最初设,用到来自DMControl的8个使命顺利完成实验者。

测量普遍化并能,随机聚合背景和机械人本身的颜色,将真实的视频作为动态背景。

除了一项使命之外,SECANT在所有使命之中都显着不强于到时前的SOTA,通常高于88.3%。

所有作法都经过50万步军事训练,有之外围的使命特定加分。

Robosuite:机械人可用升级版

Robosuite是用做机械人科学研究的模块化升级版。

写作者在4个具吸引力的改进型和双手可用使命上对SECANT和到时前作法顺利完成了相对于试验。

用到具可用空间内整体集中的Franka Panda机械人数学方法,并用到特定于使命的之外围加分顺利完成军事训练。

所有agent都转送一个168×168以自我为之该中心的RGB快照作为输入。

与此前SOTA比起,SECANT有337.8%的大大提高

实验者断定,与此前的最佳作法比起,SECANT在恰当最初设之中获得的加分不等减低了287.5%,在困难最初设之中减低了374.3%,在极端最初设之中减低了351.6%。

CARLA:自动驾驶升级版

为了大幅度可验证SECANT对自然变化的普遍化并能,写作者在CARLA升级版之中相结合了一个具感官推论的真实驾驶场景。

试验目标是在1000个时间步长内沿着8字形国道(CARLA Town 4)停靠最大限度远,不与行人或车辆发生断裂。

agent在「晴朗的之下午」犹如不能接受军事训练,并在之下午和日落时对各种动态天候和光照必需顺利完成评核。

例如,炎热天候的特点是沿路具高反射光点。经过不等每个天候超过10集和5次军事训练接入,SECANT在试验之中必须比此前的SOTA停靠的距离减低47.7%。

iGibson:场地粒子辅助

iGibson是一个交互式升级版,有整体逼真的3D房间和珠宝首饰。

在这个升级版之中,实验者的目标是最大限度接近一盏灯。

加分函数激励agent使灯在视野之中所%的像素%最大,当这个%在不间断10个步骤之中超过5%时就算获得成功。

在本试验之中,在确有过的房间里,SECANT的获得成功率比此前的作法高于15.8%。

写作者简介

本文一作是郭飞飞门下自傲门生Linxi Fan,他毕业于上海附属之中学,本科毕业明尼阿波利斯哥伦比亚的大学,目前在斯坦福的大学求学哈佛的大学,主修计算机科学感官、增不强求学以及机械人高效率。在英伟达借调其间完成了本文章。

本文二作黄德安都只师从郭飞飞,本科毕业于国立台湾的大学,获得了卡内基梅隆的大学硕士学位。目前在斯坦福的大学计算机科学科学专业求学哈佛的大学学位,在NVIDIA做普遍化求学类科学研究。

三作禹之鼎也是来自NVIDIA的科学家,获得华南理工的大学电机工程建立联系班学士学位、香港科技的大学磁性工程学士学位,2017年在卡内基梅隆的大学获得了ECE哈佛的大学学位。2018年加入英伟达,现在是英伟达机器求学科学研究组的高级科学研究科学家。

参考资料:

广州看男科到哪家医院好
武汉看癫痫哪家最好
深圳看妇科去哪家医院
襄阳妇科最好医院是哪个
青岛看妇科哪里最好
急支糖浆治疗支气管炎效果好吗
先诺欣
癫痫治疗
妇科医院
胸闷

上一篇: 在华中首家旗舰店里,还展现了华为的转型之中华路

下一篇: 绘画打特殊效果怎么打?教你5种类型的打光方式!

友情链接