«рение роботов

17.02.2006, 12:30
јвтор: јлексей  алиниченко



ћы живем в трЄхмерном мире, а смотрим на него лишь двум€ глазами. Ќаши глаза передают в мозг две картинки, из которых он формирует представление об окружающем пространстве. –оботам, обычно получающим визуальную информацию при помощи видеокамер, тоже нужно знать о трЄхмерной структуре мира. Ќо если мозг может легко пон€ть, какие объекты на картинках, полученных от каждого из глаз, соответствуют друг другу, то компьютеру справитьс€ с этой задачей не так просто.

ƒавайте рассмотрим, как люди воспринимают трЄхмерный мир. ƒл€ этого мы используем как минимум три инструмента. ѕрежде всего, конечно, бинокул€рное зрение. ѕоскольку наши глаза отсто€т друг от друга на некоторое рассто€ние, то анализиру€ картинки, полученные с их помощью, мозг может судить о том, какие предметы наход€тс€ дальше от нас, а какие ближе. ¬ самом деле, если мы знаем рассто€ние между двум€ точками (глазами) и углы, под которыми видим третью, то при помощи несложных тригонометрических формул мы можем найти и рассто€ние от третьей точки до любого из глаз.

—ледующий инструмент основан на, казалось бы, недостатке человеческого глаза - он имеет конечную глубину резкости, то есть мы не можем видеть с хорошей резкостью сразу оба предмета, если первый находитс€ от нас на рассто€нии один метр, а второй удалЄн на дес€ть метров. —оответственно если изображени€ двух предметов будут резкими, то можно сделать вывод, что они наход€тс€ на приблизительно одинаковом рассто€нии от нас.

» третий, уже скорее психологический, инструмент использует тот факт, что мы обычно имеем дело с хорошо знакомыми нам предметами - например, все примерно представл€ют, какого размера должна быть табуретка или кровать. ѕоэтому дл€ определени€ рассто€ни€ до таких предметов мозгу достаточно знать, кака€ площадь на сетчатке зан€та их изображением. ≈стественно, что все эти методы работают в комплексе, дополн€€ и уточн€€ друг друга. ќгромную роль также играет способность человека выдел€ть объекты из того потока информации, которую он получает благодар€ органам зрени€. √рубо говор€, когда мы входим в незнакомую комнату, нас не интересует форма сто€щего в углу кресла, нам нужно лишь знать, с какой стороны и как далеко от нас оно находитс€. ј вот роботу, как уже было сказано, даже идентифицировать кресло на изображении комнаты не всегда под силу.

зрение роботов

 акими же из этих методов могут воспользоватьс€ роботы? ѕроще всего реализовать второй способ. ¬ самом деле, роботу достаточно иметь один-единственный глаз, и при этом чем меньше у него глубина резкости, тем лучше. Ќадо "прогнать" камеру по всему диапазону фокусных рассто€ний и на полученной картинке определить дальность до каждой точки. Ќо за простотой этого метода скрываетс€ и его недостаток - низкое разрешение. ќпределить степень сфокусированности можно только дл€ относительно большого по площади предмета; более того, он еще должен быть неравномерно окрашен. –оботу трудно ориентироватьс€ в пустой комнате с чистыми белыми стенами, зато рассто€ние до какой-нибудь решЄтки он вычислит точно.

“еперь рассмотрим двуглазого робота, который дл€ определени€ рассто€ни€ до предметов использует бинокул€рное зрение. “ут возможны два случа€: или заранее известно взаимное расположение камер (они закреплены жЄстко), или потребуетс€ определ€ть положение камер. — первым случаем, казалось бы, все просто: берЄм точку на одном кадре, ищем соответствующую ей на другом и определ€ем рассто€ние до камер. Ќо все как раз и упираетс€ в поиск соответствий между точками. ƒл€ некоторых областей изображени€ таких соответствий может не оказатьс€ - например, одна из пары соответствующих точек будет чем-то загорожена. Ќо даже если все соответстви€ имеютс€, то найти их будет очень не просто. –ассмотрим простейший случай: наш двуглазый робот смотрит на кубик с гладкими однотонными стенками, и как бы мы ни старались и не разгл€дывали изображени€, полученные с каждого из глаз, найти соответствующих пар точек больше, чем углов у кубика, невозможно. ј даже по восьми точкам (предположим, что видны все углы) пытатьс€ восстановить сцену, не зна€, что на ней куб, - задача нереальна€.

 акие есть пути решени€ данной проблемы? ћожно искать на изображени€х соответстви€ не только точек, но и пр€мых и эллипсов (проекци€ окружности). ¬едь роботы скорее всего будут находитьс€ в антропогенной среде, а современные офисные интерьеры и городские пейзажи практически полностью состо€т из пр€мых линий, да и окружности встречаютс€ нередко. ¬ернЄмс€ к примеру с кубом. ѕусть нам удалось найти соответстви€ между углами, тогда отыскать отрезки, соедин€ющие углы, и разбить их на пары соответстви€, тоже не составит труда. ƒалее можно сделать предположение, что четыре отрезка, образующих замкнутую ломаную, ограничивают плоскость. ¬от наша задача и решена! “еперь мы можем построить тот самый куб, составив его из плоскостей. ≈сли наш робот наткнетс€ на кружку или кастрюлю, он без труда распознает в ее основании окружность, что поможет ему "разобратьс€" и с формой этого предмета.

Ќо иногда жЄстко закрепл€ть глаза робота нецелесообразно или вообще не нужно, поскольку восстановить положение камер по двум снимкам не слишком трудно.   тому же это решение зачастую дает более высокую точность, нежели механическое соединение камер. ƒа и возможность независимо оперировать двум€ глазами довольно заманчива, особенно в тех задачах, где не требуетс€ воспри€тие трехмерной информации (например, такой робот сможет одновременно читать две страницы книги). “ак как же восстанавливают положение камер по кадрам? ƒл€ этого нам оп€ть потребуютс€ пары соответствующих точек на каждом из изображений (обычно не меньше семи пар). ѕри смене камеры мы просто мен€ем центр и направление проецировани€; таким образом, пара камер характеризуетс€ вектором сдвига (он соедин€ет оптические центры камер) и поворотом в пространстве одной относительно другой. ≈сли мы посмотрим на две фотографии одного предмета, сделанные с разных точек, то сможем достаточно точно указать искомые параметры пары камер. ѕри этом мы будем руководствоватьс€ изменением взаимного положени€ точек на фотографи€х. –ассуждать мы будем примерно так: "вот этот отрезок стал длиннее, следовательно, теперь он стал более перпендикул€рным по отношению к камере, а вот этот короче, а этот повернулс€Е". –уководству€сь подобными же соображени€ми, можно построить математическую модель и с еЄ помощью достаточно точно восстановить параметры пары камер.

ѕосле того как взаимное положение камер известно, можно дл€ любой точки одного изображени€ найти пр€мую на другом, котора€ будет проходить через точку, соответствующую в пространстве первой. Ёта пр€ма€ называетс€ эпипол€рной и соответствует проекции (e'p') на вторую камеру пр€мой (OP), соедин€ющей точку в пространстве (P) с оптическим центром первой камеры (O). ѕон€тно, что конфигураци€ эпипол€рных линий определ€етс€ только параметрами пары камер и не зависит от конфигурации 3D-сцены.

роботы получают зрение

ѕосле того как построены эпипол€рные линии, мы можем искать точку, соответствующую данной, не по всему второму изображению, а только вдоль эпипол€рной пр€мой, что не только сильно снижает вычислительную сложность алгоритма, но и позвол€ет находить такие соответстви€, которые другими методами просто были бы пропущены.

¬ернЄмс€ к примеру с кубом. ѕусть у нас уже построены эпипол€рные линии и найдены соответстви€ между вершинами и гран€ми куба. “еперь мы можем дл€ любой точки на грани куба найти соответствие: строим эпипол€рную линию, котора€ пересечет грань куба на втором изображении в единственном месте, оно-то и будет точкой, соответствующей первой. ¬спомним про третий инструмент человеческого воспри€ти€ трехмерного пространства - вы€вление знакомых предметов со знакомыми размерами. Ётот метод применим только дл€ довольно узкого класса задач. Ќапример, индустриальный робот только и делает, что перекладывает п€ть различных типов заготовок с места на место и вполне может их "узнавать", а вот дл€ ориентировани€ в произвольном помещении такой метод вр€д ли подойдет. «наменитый робот-собака Aibo может находить и узнавать свои игрушки, но дл€ этого они специальным образом раскрашиваютс€.

ћожно и с одной камерой составить представление о трехмерном мире, но дл€ этого роботу придетс€ двигатьс€ и, сохран€€ предыдущие кадры в пам€ти, использовать их аналогично кадрам со второй камеры. ѕри таком алгоритме существенно упрощаетс€ поиск парных соответствий. ¬едь если сохран€ть кадры часто, то на двух соседних соответствующие точки будут лежать недалеко друг от друга. Ѕолее того, если результат покажетс€ недостаточно точным, можно продолжить движение и уточнить его.

“еперь рассмотрим возможности, которые недоступны человеку, но вполне могут быть реализованы в роботах. —ущественно увеличить точность восстановлени€ 3D можно, использу€ третий глаз. »менно так и поступила компани€ Sony, спроектировав робота Qrio. ѕравда, он использует третий глаз не только дл€ ориентировани€ в пространстве, но и дл€ увеличени€ многозадачности.

¬се описанные методы €вл€ютс€ пассивными - робот не генерирует никаких сигналов. —уществуют также и активные системы; некоторые из них сродни эхолотам дельфинов и акустическим радарам летучих мышей. –обот посылает направленную акустическую или электромагнитную волну и по отраженной волне, которую сам и принимает, получает информацию о рассто€нии до преграды. “акой аппаратурой обычно оснащаютс€ роботы, действующие на открытой местности, где оптические методы не всегда эффективны (выбрать соответствующие друг другу точки очень трудно из-за сложной формы объектов и обили€ сильно текстурированных областей).

–ассмотрим системы с оптической подсветкой. ≈сли установить на робота одну камеру и лазер, который создает €ркое п€тнышко на поверхности предметов, то по скорости перемещени€ п€тна можно судить о дистанции до предмета, а по ускорению - о наклоне поверхности (при наличии двух или более камер). “аким образом, можно "прощупать" лазером все поле зрени€ робота. Ќо согласитесь, многим не понравитс€, если механический курьер в офисе будет всюду шарить лазером. ¬прочем, можно вз€ть лазер, излучающий в невидимом диапазоне. ≈щЄ более из€щное решение - использовать структурированную подсветку. ¬сЄ поле зрени€ робота засвечиваетс€ лазерной решЄткой, и рассто€ние до преграды определ€етс€ по шагу решЄтки на кадре: чем он больше - тем и рассто€ние больше. “акие системы не смогут работать с зеркальными поверхност€ми, но согласитесь, что в стекл€нном лабиринте не сможет сориентироватьс€ даже человек, поэтому всерьЄз этот недостаток воспринимать не следует.

¬ существующих системах обычно используютс€ несколько методов. ¬едь в услови€х, неблагопри€тных дл€ одного из них, другой может дать неплохие результаты, а одновременное применение разных методов позвол€ет сильно уменьшить веро€тность ошибки.


ѕо материалам еженедельника " омпьютерра"

Ќа нашем сайте есть реферат на тему технического зрени€ роботов. ѕредлагаем ознакомитьс€ с этим материалом.

ќбсудить проблемы и задачи зрени€ роботов можно на форуме робототехников

 лючевые слова:
двуглазый робот
робот Qrio
SONY


¬ернутьс€ в рубрику:

–оботы с чувствами


ƒетальна€ информаци€ бурение скважин в раменском районе на сайте. ≈сли вы хотите видеть на нашем сайте больше статей то кликните ѕоделитьс€ в социальных сет€х! —пасибо!
—мотрите также:

ќбратите внимание полезна€ информаци€.