"Яндекс" поможет робомобилям справиться со сдвигом данных

2021-7-22 18:05

"Яндекс" выложил в свободный доступ набор данных, который должен помочь создать более совершенные алгоритмы для самоуправляемых автомобилей. А именно — сделать так, чтобы они успешнее справлялись с так называем "сдвигом данных", проблемой, возникающей при внезапной смене условий на дороге.

"Яндекс" опубликовал часть данных, собранных его беспилотным подразделением. 1600 часов движения робомобилей, разбитых на 600 000 размеченных отрезков из поездок по дорогам России, Израиля и США в хорошую погоду, в снег и в дождь.

Такой массив данных (а уверяют, что это теперь самый большой набор из общедоступных) компания выложила в открытый доступ для конкурса Shifts Challenge, который "Яндекс" проведет вместе с учёными из Оксфорда и Кембриджа. И, как говорят в компании, самая главная задача конкурса – привлечь внимание к проблеме "сдвига данных" в машинном обучении.

"Сдвиг данных — это примерно следующее. Вот вы приехали в Лондон, а там движение с другой стороны, другие марки машин, немного другие ПДД, и вообще другой город. Вот это сдвиг данных — поначалу вы будете водить осторожно, неуверенно, потом вы быстро адаптируетесь и будет все хорошо. И мы примерно такое же хотим от наших машин: чтобы модели, обученные в одних условиях, так же хорошо работали в других условиях.

Проблема сдвига данных известна давно, и много кто над ней работал, но для ее решения требуются большие корпуса, большое количество данных с большим количество примеров настоящих сдвигов из жизни и для разных задач. Но, к сожалению, большинство датасетов, которые сейчас существуют, маленькие и в них синтетически созданные сдвиги. Этого для успешного решения проблемы не хватает".

Андрей Малинин

Старший исследователь Yandex Research

Для понимания масштабов опыта, которым обладают лидеры отрасли: "Яндекс" в марте этого года объявил, что его робомобили суммарно проехали 10 млн километров. Гугловская Waymo, которая начала беспилотные разработки существенно раньше, разменяла уже 30 млн. И им есть чем поделиться не только с менее крупными компаниями, но и друг с другом. Просто потому, что у каждой из компаний свой набор условий тестирования.

"У нас есть задача предсказания движения траектории других автомобилей, очень важная в беспилотном стеке. И мы можем видеть, что если мы возьмем за обучающую выборку только Москву летом, то качество предсказания траектории в других городах будет ниже. Мы пытаемся придумать другие алгоритмы машинного обучения, у которых качество на Тель-Авиве будет выше. Например, мы как раз разметили, какие сдвиги есть: погодные условия, время дня, города и т.д. У нас даже есть разметка — классификация разных траекторий: траектория ускоряющаяся, обгоняющая, такие вещи. Мне кажется, такой дотошной разметки нет у других датасетов, потому что они нацелены на другие задачи".

Андрей Малинин

Старший исследователь Yandex Research

В компании также подчеркивают, что все опубликованные данные обезличены: датасет содержит высокоточные карты маршрутов и треки всех окружающих машин и пешеходов (их положение, скорость, ускорение и прочее), но не использует видео, где были бы видны номера машин или лица прохожих.

"Яндекс" не первым выкладывает в паблик свой массив накопленных данных с тренировок робомобилей. Это стало хорошим тоном в отрасли. Доступ к своим датасетам, предназначенным для обучения нейросетей беспилотных машин, ранее открыли гугловская "дочка" – компания Waymo, автопроизводители Ford и Audi, компания Aptiv Autonomous Mobility и сервис онлайн-заказа такси Lyft (он, правда, потом свое беспилотное подразделение продал).

Подробнее читайте на ...

данных яндекс машин других другие набор компания доступ

"Яндекс" разрешил удалять свои данные. Вот как это сделать

"Яндекс" разрешил пользователям просматривать данные, которые накопили его различные сервисы, и при желании удалять их. Сделать это можно в разделе "Управление данными" пункта "Дополнительные настройки" сервиса "Яндекс ID" (passport.yandex.ru). vesti.ru »

2021-06-01 12:26

Фото: lenta.ru

«Яндекс» и Mail.ru оправдались за передачу данных за границу

Передача российскими коммерческими приложениями, обязательными к установке с 1 апреля 2021 года, части информации за границу не угрожает личным данным российских пользователей. Таким образом исследование АНО «Информационная культура» прокомментировали в компаниях «Яндекс» и Mail.ru. lenta.ru »

2021-04-03 13:28

«Яндекс» и Mail.ru ответили на сообщения о передаче данных за рубеж

Персональные данные россиян не будут скомпрометированы из-за использования трекеров приложений «Яндекса» и Mail. ru Group, поскольку все применяемые внешние инструменты проходят строгий аудит внутренней безопасности. tvzvezda.ru »

2021-04-03 12:51

«Яндекс» и Минцифры опровергли сообщения о сливе данных россиян за рубеж

МОСКВА, 3 апреля, ФедералПресс. Представители «Яндекса», Mail.ru Group и Минцифры опровергли появившуюся информацию о том, что предустановленное на смартфоны программное обеспечение будет передавать данные россиян зарубежным IT-компаниям, передают СМИ. fedpress.ru »

2021-04-03 12:42

Фото: nsn.fm

«Яндекс» обнаружил утечку данных почти пяти тысяч почтовых ящиков

Служба безопасности «Яндекса» обнаружила внутреннюю утечку, в результате которой были скомпрометированы данные 4 887 тысяч почтовых ящиков nsn.fm »

2021-02-12 13:09

Фото: vz.ru

Яндекс раскрыл утечку данных около 5 тыс. почтовых ящиков

Служба безопасности Яндекса выявила внутреннюю утечку, в результате которой были скомпрометированы данные почти 5 тыс. почтовых ящиков. Владельцы этих аккаунтов получили уведомления о необходимости смены пароля, говорится в сообщении компании на сайте. vz.ru »

2021-02-12 12:23

Фото: lenta.ru

«Яндекс» сообщил об утечке данных тысяч пользователей

В компании «Яндекс» сообщили об утечке данных около пяти тысяч почтовых ящиков. Внутренняя утечка была обнаружена во время проверки службой безопасности «Яндекса». Выяснилось, что один из сотрудников предоставлял несанкционированный доступ к почтовым ящикам пользователей. lenta.ru »

2021-02-12 12:17

Фото: social.mk.ru

"Яндекс" впервые раскрыл статистику выдачи данных пользователей властям

Российская интернет-компания "Яндекс" раскрыла статистику выдачи данных пользователей по запросам властей РФ social.mk.ru »

2020-10-26 14:50

«Яндекс» опубликовал статистику по выдаче данных пользователей властям

Компания «Яндекс» представила статистику по запросам от органов государственной власти, которые касаются пользовательских данных.
Читать далее russian.rt.com »

2020-10-26 14:41

Фото: tass.ru

"Яндекс" впервые опубликовал отчет о выдаче данных россиян по запросу госорганов

Законы стран, в которых работает "Яндекс", позволяют государственным органам запрашивать определенные данные и сведения о пользователях компании tass.ru »

2020-10-26 13:16

Фото: aif.ru

Гол как сокол. Кому доступна информация о нас?

В связи с режимами ограничений этого года мы вдруг обнаружили, что цифровой мир — это не завтра, а уже сегодня. И это не просто «удобства в кармане», а возможность тотального контроля. Поэтому с правом на частную жизнь можно распрощаться. aif.ru »

2020-09-30 12:46

Фото: metronews.ru

В Vpnscanner.com рассказали о десяти лучших браузерных VPN-расширениях

Специалисты сервиса Vpnscanner.com подготовили топ-10 VPN-расширений для популярных браузеров. Все продукты из рейтинга обеспечивают пользователям высокий уровень надежности и анонимность в сети. metronews.ru »

2020-09-18 16:46