**Gemini Robotics-ER 1.5 — когда AI выходит в физический мир**
**Gemini Robotics-ER 1.5 — когда AI выходит в физический мир**
😚😚 **Что это:** новая модель видения + языка, адаптированная для роботов. Она понимает визуальные сцены, связки объектов и планы действий по командам на естественном языке.
😚😚**Ключевые функции:**
😚• обнаружение объектов и их координат
😚• разбивка сложных задач на подзадачи и управление ими
😚• генерация траекторий движения, планирование маршрутов
😚• взаимодействие с внешними функциями и API (исполнение кода)
⚠️ **Ограничения и нюансы:**
😶🌫️модель сейчас в статусе preview — подходит скорее для экспериментов и прототипов
😶🌫️возможны ошибки (галлюцинации) при неоднозначных ситуациях
😚задержки при сложных расчетах или больших “thinking_budget”
📌 **Идеи применения / что попробовать прямо сейчас:**
😚**Управление манипуляторами:** “подними красный блок и положи его в миску”.
😚**Навигация в пространстве:** пусть робот «видит», где препятствия, оптимизирует маршрут.
😚**Взаимодействие с людьми:** дать голосовую/текстовую команду и видеть, как робот исполняет её в физической среде.
😚**Системы автоматизации на складе:** сортировка, упаковка, извлечение товара.
😚**Исследования в робототехнике:** проверка новых сценариев, обучение в гибридной среде (виртуал + физика).
🥲☺️😊
[LINK](https://ai.google.dev/gemini-api/docs/robotics-overview)
[IPYNB](https://github.com/google-gemini/cookbook/blob/main/quickstarts/gemini-robotics-er.ipynb) для тестов, если у вас есть что-то роботное
Больше узнать про [Gemini Robotics](https://deepmind.google/models/gemini-robotics/)
```Я пока разгребаю множество проблем, потому мои планы по изучению робототехники посыпались. Делюсь для вас!```
Похожие записи
Запрещёнка релизнула модель [SAM Audio]( для изоляции звуков на аудио и видео.

**Topaz**: вышли с [20 обновами]( для своих апскейлеров. Фокус на реализме.
Прокрутите вниз для загрузки следующего материала