![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Я редко здесь рассказываю о своей основной работе, а там случаются интересные истории. Вот, например, занимался я таким проектом по машинному зрению - обучал детектор типов транспорта для автоматической парковочной системы. Первые результаты были ужасные. Я уже выкладывал иллюстрацию того, как мой искусственный идиот принял мусорный бак за полицейскую машину. С тех пор нейросеть значительно улучшилась (после того как я перешёл с YOLO3 на YOLO5 и кое-что сам подправил в архитектуре - изменил функции активации, добавил BatchNorm где надо и т.п.) Сейчас сетка практически не ошибается с машинами, но откуда-то вылез непонятный систематический глюк. Участились ошибки первого рода в классе "person", т.е., попросту говоря, нейросеть стала видеть людей там, где их нет.
Например:

Число после названия класса - confidence, т.е. вероятность нахождения объекта данного класса ("человек") в очерченном прямоугольнике. Как видим, сеть приписывает этому пустому прямоугольнику весьма высокую вероятность содержать фото человека. Бывает, что confidence у таких пустых мест даже выше, чем у реальных людей:

Я бы ещё понял, если бы сеть увидела человеческую фигуру в каких-нибудь пятнах на асфальте. Это дело обычное. Но вот два снятых подряд кадра. Все пятна на своих местах, а глюк переместился:


Я стал тестировать свою сеть на других фото, не с парковок. Оказалось, что на обычных городских фото она глючит довольно редко (как и на парковочных), а вот если взять фотографии разных полуразрушенных и заброшенных мест, там ложноположительный класс "person" детектируется сплошь и рядом:





Ну и в завершение. В этом году я поменял квартиру - купил у наследницы недавно умершего старика, и купил сравнительно дёшево, потому что квартира была совершенно убитая, ремонт не делался с самой постройки дома в 1970-х гг. (обои были наклеены на газеты с речами Брежнева). Вид был такой запущенный, что я уверен, на фотографиях этот глюк всплыл бы. Но в изначальном состоянии я квартиру не фотографировал. А вот пара снимков уже в ходе ремонта, пропущенных через мою нейросеть:


Вроде уже никакой разрухи, а глюк всё равно вылезает. Не знаю, что и думать. Если кто хочет погонять мою сеточку, пишите ваш аккаунт на гитхабе. Репозиторий приватный, я пришлю приглашение.
Например:

Число после названия класса - confidence, т.е. вероятность нахождения объекта данного класса ("человек") в очерченном прямоугольнике. Как видим, сеть приписывает этому пустому прямоугольнику весьма высокую вероятность содержать фото человека. Бывает, что confidence у таких пустых мест даже выше, чем у реальных людей:

Я бы ещё понял, если бы сеть увидела человеческую фигуру в каких-нибудь пятнах на асфальте. Это дело обычное. Но вот два снятых подряд кадра. Все пятна на своих местах, а глюк переместился:


Я стал тестировать свою сеть на других фото, не с парковок. Оказалось, что на обычных городских фото она глючит довольно редко (как и на парковочных), а вот если взять фотографии разных полуразрушенных и заброшенных мест, там ложноположительный класс "person" детектируется сплошь и рядом:





Ну и в завершение. В этом году я поменял квартиру - купил у наследницы недавно умершего старика, и купил сравнительно дёшево, потому что квартира была совершенно убитая, ремонт не делался с самой постройки дома в 1970-х гг. (обои были наклеены на газеты с речами Брежнева). Вид был такой запущенный, что я уверен, на фотографиях этот глюк всплыл бы. Но в изначальном состоянии я квартиру не фотографировал. А вот пара снимков уже в ходе ремонта, пропущенных через мою нейросеть:


Вроде уже никакой разрухи, а глюк всё равно вылезает. Не знаю, что и думать. Если кто хочет погонять мою сеточку, пишите ваш аккаунт на гитхабе. Репозиторий приватный, я пришлю приглашение.
no subject
Date: 2021-04-01 06:22 am (UTC)no subject
Date: 2021-04-01 09:12 am (UTC)no subject
Date: 2021-04-01 05:06 pm (UTC)