среда, 20 февраля 2013 г.

семпл столкновения машин

Найдя максимально стабильные обл

Белые области на изображении являются областями экстремума. Мы можем проанализировать как долго та или иная область экстремума присутствует в последовательности изображений. Для этого можно использовать еще одну пороговую функцию. Например, со значением 10. Если область экстремума присутствует больше чем на 10 изображениях последовательности, то такая область называется максимально стабильной областью экстремума.

Горячие области на изображении обнаруживаются с помощью метода под названием «Максимально стабильные области экстремума» (МСЕР от англ. Maximally Stable Extremal Regions [1]). Исходное изображение обрабатывается пороговой функцией с изменяющимся значением порога. В результате получается новая последовательность изображений, размер которой соответствует количеству различных значений порога (например, для монохромного изображения со значениями пикселей от 0 до 255 получим 256 изображений). Первое изображение в последовательности будет абсолютно белым. Дальше появятся черные области и самое последнее изображение в последовательности будет полностью черным. На рисунке ниже представлена такая последовательность в виде анимации:

Извлечение признаков, которые используются для распознавание образов, и их классификация занимают достаточно много времени. Обработка одного кадра с 6 7 объектами в Матлабе может занять целую минуту. Для систем, ориентированных на работу в реальном времени, такая длительная обработка неприемлема. На скорость сильно влияет количество обнаруженных теплых объектов, а человек не единственный теплый объект. Части машин, окна, светофоры тоже могут выделяться на общем температурном фоне. В данной работе упор сделан на скорость обработки информации. Нам нужно быстро отсеять максимум объектов, которые точно не являются людьми. При этом желательно не пропустить ни одного реального человека. Все оставшиеся объекты можно затем классифицировать с помощью полноценного статического классификатора.

Извлечение областей интереса

Конечно, на тестовой машине все немного иначе. Во первых, приведенный рисунок показывает расположение статических сенсоров: их положение не меняется со временем. Во вторых, на нашей тестовой машине используется другой тип лидара трехмерный. Он установлен посередине крыши автомобиля. Камера устанавливается в передней части крыши. Таким образом, центры сенсоров уже нельзя считать находящимися в одной точке. Вариантов решения данной проблемы я вижу два: параллельно перенести данные из системы координат одного сенсора в систему координат другого сенсора (предварительно измерив расстояние между ними), либо же (автоматически)откалибровать сенсоры.

Рассмотрим каким образом можно совмещать данные двух сенсоров: находим горячую область на изображении (полагаем, что это голова человека), вычисляем угол, под которым находится центр этой область, приводим этот угол к системе координат лидара и по этому углу получаем расстояние до объекта. Для перевода угла из одной системы координат в другую, сенсоры должны быть откалиброваны. Вместо настоящей калибровки сенсоров используется их специфическое расположение, при котором центры сенсоров совпадают в горизонтальной плоскости:

Зачем вообще нам лидар? Посмотрим для начала на наши картинки. Вся идея предварительной обработки изображения сводится к тому, чтобы локализовать области интереса. Нам не важно, что из себя представляет все изображение. Мы хотим выделить несколько областей и работать дальше с ними. В идеале область интереса должна охватывать изображения человека целиком. Зная что голова человека теплее окружающей среды, мы легко находим её на изображении. Дальше нам надо оценить размер человека. Тут то и приходят на помощь данные от лидара. Зная расстояние до объекта, фокусное расстояние камеры, размер объекта в координатах реального мира, легко подсчитать размер объекта в пикселях. Мы определили размер объекта в координатах реального мира равный прямоугольнику 2 на 1 метр в уверенности, что среднестатистический человек вписывается в такой прямоугольник. Но в системе координат изображения области интереса все еще разного размера. Еще одно преобразование масштаба и наконец все области интереса не только охватывают одинаковую область реального мира, но и имеют одинаковые размеры в пикселях.

В своей работе я использую два сенсора: инфракрасную камеру и . Температура тела человека обычно выше окружающей среды. Поэтому на изображении с инфракрасной камеры человека можно легко локализовать. Как правило, легко обнаружить незакрытые одеждой части тела: голову и кисти рук. Но с помощью одной только камеры сложно определить размеры объекта, сложно сказать насколько далеко человек находится от камеры. Здесь на помощь приходит лидар. Он измеряет расстояние до объектов.

Обнаружение пешеходов используется главным образом в исследованиях, посвященных беспилотным автомобилям. Общая цель обнаружения пешеходов предотвращение столкновения автомобиля с человеком. На Хабре недавно был топик про « ». Создание подобных систем очень популярное направление исследований ( ). Я занимаюсь распознаванием пешеходов для подобного проекта интеллектуальных автомобилей. Очевидно, что проблема обнаружения пешеходов программная, а предотвращение столкновения аппаратная. В данной статье я упомяну лишь о программной части, кратко расскажу об одном способе обнаружения людей на изображении и алгоритме классификации.

Обнаружение пешеходов

3 августа 2010 в 03:53

Обнаружение пешеходов / Хабрахабр

Комментариев нет:

Отправить комментарий