Вопрос науки: Как устроено зрение человека?

Чем отличается компьютерное зрение от нашего? Можно ли научить робота смотреть на мир глазами человека? Как мы различаем цвета? Чтобы ответить на эти вопросы ведущий передачи «Вопрос науки» Алексей Семихатов встретился с кандидатом физико-математических наук, заведующим Лабораторией зрительных систем и заместителем директора Института проблем передачи информации РАН Дмитрием Николаевым.

Видеть и представлять

Чтобы понять, что значит «видеть», лучше всего представить себе, что  мы постоянно рисуем картину окружающего мира. Видимые объекты наносятся на внутреннюю карту того, что по нашему представлению находится вокруг. Зачастую мы ищем предмет, который находится прямо перед нами, но никак не можем его увидеть. Это пример нарушенного представления, а не зрения. Существует множество психофизиологических экспериментов, посвященных визуальному представлению о мире. В большинстве случаев мы извлекаем информацию о предмете только по его форме, а все, что находится внутри, естественным образом додумываем.

В нашем восприятии имеется механизм различения затемнения и изменения окраски. В науке это называется феноменом цветовой константности. Следует различать спектральные цвета от неспектральных: первые имеют цветовой тон, который может показать призма или лазер, вторые демонстрируют только смесь таких цветов.  

Сигнал цвета

Мы начинаем видеть, когда по нервным окончаниям проходит сигнал.  Для этого сигнала нужно, чтобы из одной молекулы вылетел электрон. Есть молекулы, которые поглощают свет волн разной длины, и в зависимости от длины фотона, электрон может либо выбиться, либо нет. Клетка собирает свет на условной площадке глазной сетчатки за определенное время. Для полноценной картинки необходимо большое количество фотонов, иначе она будет неразличима на фоне шума собственных клеток. За это время мозг “понимает”, что из сетчатки поступают сигналы и от коротковолновых, и от длинноволновых фотонов. Тогда мы начинаем различать цвета.

Человек против машины

Зрение делает нас почти идеальными измерительными приборами. При помощи него мы можем давать количественные оценки, определять расстояние, цвет, форму. Говоря про “зрение” компьютера, как правило имеется в виду распознавание — оно основывается на запоминании, сугубо эмпирическом восприятии.

Поэтому научить нейросеть видеть по-человечески — целое искусство, которое пока что нам недоступно. Цветовое пространство робота, возможно, будет богаче, чем у нас, но все математические принципы будут точно такими же. Более того, у робот все равно будет испытывать на себе оптические иллюзии — как цветовые, так и пространственные. Ведь задача зрения математически не корректна, и всегда решается нами с большими оговорками.

12.05.2017 18:52:09