0.53%
1.54%
1.88%
BTC
$65,032.80
0.04%
2.38%
2.28%
ETH
$1,763.93
0.38%
2.01%
4.09%
BNB
$599.56
0.73%
1.06%
6.45%
XRP
$1.16
0.30%
0.62%
1.39%
SOL
$74.31
0.09%
1.51%
3.77%
TRX
$0.33136397
0.35%
1.29%
6.10%
DOGE
$0.08448590
0.06%
0.04%
14.06%
ADA
$0.16158894
0.19%
1.99%
4.00%
LINK
$8.10
0.50%
0.96%
1.07%
LTC
$45.49
0.53%
1.54%
1.88%
BTC
$65,032.80
0.04%
2.38%
2.28%
ETH
$1,763.93
0.38%
2.01%
4.09%
BNB
$599.56
0.73%
1.06%
6.45%
XRP
$1.16
0.30%
0.62%
1.39%
SOL
$74.31
0.09%
1.51%
3.77%
TRX
$0.33136397
0.35%
1.29%
6.10%
DOGE
$0.08448590
0.06%
0.04%
14.06%
ADA
$0.16158894
0.19%
1.99%
4.00%
LINK
$8.10
0.50%
0.96%
1.07%
LTC
$45.49
   /       /       /    Nvidia показала систему для обучения роботов

Nvidia показала систему для обучения роботов

Nvidia показала систему для обучения роботов

Исследователи Nvidia, Carnegie Mellon University и Калифорнийского университета в Беркли представили ENPIRE — фреймворк, который позволяет ИИ-агентам для программирования улучшать политики управления роботами на реальном оборудовании.

Система запускает замкнутый цикл: робот выполняет задачу, среда автоматически оценивает результат и возвращается в исходное состояние, а ИИ-агент анализирует ошибки, переписывает код и запускает следующую серию испытаний.

Как работает ENPIRE

В робототехнике обучение на реальном оборудовании остается дорогим и медленным процессом. После неудачной попытки нужно вернуть сцену в исходное состояние, проверить результат, изменить алгоритм и снова провести испытание. Обычно часть этой работы требует участия инженеров.

ENPIRE переносит в физический мир подход, который в Nvidia называют AutoResearch: ИИ-агенты пишут код, тестируют его и улучшают в следующих итерациях. Однако в отличие от цифровой среды здесь каждый эксперимент связан с реальными роботами, камерами, объектами, ошибками захвата, трением и другими физическими ограничениями.

Фреймворк состоит из четырех модулей:

  • Environment отвечает за автоматический сброс сцены, проверку результата, логирование и интерфейсы безопасности;
  • Policy Improvement запускает улучшение политики управления;
  • Rollout оценивает политику на одном или нескольких физических роботах;
  • Evolution позволяет агентам анализировать логи, искать идеи в литературе, менять инфраструктуру обучения и исправлять код.

После первичной настройки среды цикл может идти без постоянного наблюдения человека. Агент получает данные из видео, траекторий и функции награды, предлагает новую гипотезу, меняет код, тестирует результат на роботе и сохраняет изменения, если они улучшают показатель.

Зачем нужны автоматическая проверка и сброс

Ключевой элемент ENPIRE — автоматизация двух операций: проверки результата и возврата сцены в исходное состояние. Первый нужен для того, чтобы система могла сама определить, выполнена ли задача. Например, в сценарии с кабельной стяжкой функция оценки объединяла детектор, сегментационную модель и проверку по двум камерам. Так агент получал сигнал успеха или ошибки без ручной разметки каждого прогона.

Автоматический сброс позволяет запускать много попыток подряд. После неудачного действия робот должен вернуть объект или сцену в состояние, пригодное для следующего эксперимента. Без этого обучение на реальном оборудовании быстро упирается в необходимость постоянного участия человека.

Как отметили в Decrypt, на первом этапе человек помогает агенту создать постоянные инструменты — процедуру сброса и функцию награды. После этого они используются повторно, а агент берет на себя дальнейшее улучшение политики.

Что показали на роботах

В реальных экспериментах команда тестировала ENPIRE на нескольких задачах манипуляции. Push-T проверяет, может ли робот толкать T-образный объект в заданную зону. Pin Insertion требует вставлять штыри в отверстия диаметром 4 мм. Также показаны установка GPU и операции с кабельной стяжкой.

На странице проекта Nvidia указано, что в реальных задачах манипуляции система успешно справлялась с заданием в 99% случаев, если агенту давали до восьми попыток с учетом предыдущих ошибок. Показатель отражает способность системы восстанавливаться после неудач и повторять действия с учетом контекста, а не точность одной изолированной попытки.

В качестве агентов для программирования команда сравнила Codex на GPT-5.5, Claude Code на Opus 4.7 и Kimi Code на Kimi K2.6. Оценка проходила в бенчмарке AutoEnvBench на задачах Push-T и Pin Insertion.

Исследователи также проверили ENPIRE в RoboCasa — симуляторе бытовых задач вроде открытия шкафов, ящиков и включения или выключения объектов на кухне. В этих сценариях ENPIRE превзошел GR00T от Nvidia и CaP-X — агентную систему, которая использует инструменты, но не запускает полный цикл автоматического исследования.

Восемь роботов ускорили обучение

Отдельный блок работы посвящен масштабированию на парк роботов. Nvidia провела эксперимент на восьми роботизированных станциях с двумя манипуляторами. У каждой были собственные оборудование, компьютер и ИИ-агент для программирования.

Станции обменивались результатами через Git: удачная идея или изменение кода могли быстро распространяться между агентами. Такой подход позволил сократить время обучения. По данным Decrypt, переход от одного робота к восьми сократил время освоения Push-T примерно с пяти до двух часов. Для Pin Insertion время снизилось с более чем 90 минут до около 40 минут.

Ограничения

Авторы подчеркнули, что масштабирование не решает всех проблем. Когда агенты читают логи, пишут код, отлаживают его или ждут ответа базовой языковой модели, роботы и вычислительные ресурсы используются не полностью. С ростом числа роботов увеличивается GPU-активность, но средняя загрузка самих роботов снижается. Команды агентов тратят больше времени на обобщение результатов других веток и координацию, а не только на физические прогоны.

Еще одно ограничение — рост расхода токенов. Больший парк роботов быстрее приводит политику к рабочему состоянию, но требует больше токенов из-за чтения логов, обмена идеями и координации между агентами.

Кроме того, ENPIRE пока показан на ограниченном наборе задач манипуляции. Его результаты не означают, что роботы уже могут самостоятельно осваивать произвольные физические навыки в открытой среде без инженерной подготовки.

Напомним, в июне Nvidia представила Isaac GR00T Reference Humanoid Robot — исследовательский референс-дизайн для разработки и тестирования навыков гуманоидных роботов. В конфигурацию вошли корпус Unitree H2 Plus и тактильные пятипалые кисти Sharpa Wave.

Ранее Unitree представила «первого в мире готового к серийному производству» пилотируемого робота. Андроид способен передвигаться на двух и четырех конечностях.

Источник: ForkLog

18-06-2026
Криптовалюты / Новости в мире криптовалют

Новости в мире криптовалют

Alibaba представила ИИ-модели для управления роботамиAlibaba представила ИИ-модели для управления роботамиGPU-майнеры для AMD и Nvidia с поддержкой ProgPoWGPU-майнеры для AMD и Nvidia с поддержкой ProgPoW

Случайная цитата о деньгах

"Экономист – это человек, который знает о деньгах больше, чем те, кто их имеет. Экономика – это способ тратить деньги, не получая от них никакого удовольствия."

Дж. Остин

Интересные записи в других разделах блога

Информация

Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.

Последние материалы

все статьи →
Shocking Ripple Price Predictions as XRP Plunges 65% From Its ATHНовости в мире криптовалютShocking Ripple Price Predictions as XRP Plunges 65% From Its ATHHow realistic is it for XRP to skyrocket into double-digit territory?22-06-2026Ethereum Validators Face New Proposal To Redirect Up To 10% Of Staking RewardsНовости в мире криптовалютEthereum Validators Face New Proposal To Redirect Up To 10% Of Staking RewardsA new Ethereum Research proposal would let validators redirect up to 10% of staking rewards toward ecosystem funding, sparking governance debate.22-06-2026Zoomex X Space Recap With Djibril Cissé and the World Cup Trading PanelНовости в мире криптовалютZoomex X Space Recap With Djibril Cissé and the World Cup Trading PanelFormer football star Djibril Cissé believes the difference between confidence under pressure and paralysis comes down to one question: do you actually want to22-06-2026Major Figure in $15 Billion Bitcoin Scam Network Arrested in TokyoНовости в мире криптовалютMajor Figure in $15 Billion Bitcoin Scam Network Arrested in TokyoJapanese police arrested an alleged high-ranking member of one of Asia's largest crypto-facing crime organizations.22-06-2026Kraken Prop Explained: Funded Crypto Trading Arrives Inside Kraken ProНовости в мире криптовалютKraken Prop Explained: Funded Crypto Trading Arrives Inside Kraken ProKraken Prop brings funded trading into Kraken Pro, giving experienced crypto traders a new route to larger buying power after a paid evaluation. Traders prove22-06-2026Japan’s Nikkei Hits Record High as Yen Slides Toward Its 1986 LowНовости в мире криптовалютJapan’s Nikkei Hits Record High as Yen Slides Toward Its 1986 LowJapan’s Nikkei 225 recorded a new all-time high on Monday as the yen continued to slide. The currency softened to 161.7 per dollar, just short of 161.96. A22-06-2026Toss Bank And Solana Foundation Team Up On Stablecoin Remittance TestНовости в мире криптовалютToss Bank And Solana Foundation Team Up On Stablecoin Remittance TestSouth Korea’s Toss Bank and Solana Foundation will test stablecoin-based remittance infrastructure through a phased proof-of-concept.22-06-2026Ethereum MEV King “Jaredfromsubway” Speaks Out After Massive $15 Million ExploitНовости в мире криптовалютEthereum MEV King “Jaredfromsubway” Speaks Out After Massive $15 Million ExploitJaredfromsubway.eth offered the attacker a 50% white hat deal with a 48-hour deadline, threatening legal action if funds are not returned.22-06-2026UK Central Bank Eases Stablecoin Rules Following Market ResponseНовости в мире криптовалютUK Central Bank Eases Stablecoin Rules Following Market ResponseSystemic stablecoin issuers will now have clearer rules for scaling within the UK's digital money framework.22-06-2026
ВойтиMasterInvest
RUENUK