Category Archive: компьютерное зрение

Sep 24

How to convert png pair of RGB and Depth frames into Pointcloud library PCD format

There are a lot of accessible dataset of RGB-D data: http://vision.in.tum.de/data/datasets/rgbd-dataset http://rgbd-dataset.cs.washington.edu/dataset.html http://research.microsoft.com/en-us/projects/7-scenes/ http://www0.cs.ucl.ac.uk/staff/M.Firman/RGBDdatasets/ But usually it stored in PNG format and unfortunately Pointcloud library do not provide built-in function neither for treating it as a PointCloud nor for conversion it to PCD. For my experiments I need to test few points using data with …

Continue reading »

May 03

Практическое введение в компьютерное зрение

компьютерное зрение - сплошь математика

Компьютерное зрение?! Итак, вы поддались веянию времени и задумали освоить компьютерное зрение. Спешу вас разочаровать – до вечера не управитесь. Однако, примерно представить себе что это вообще такое и с какой стороны подходить к изучению, пожалуй, сможете. Компьютерное зрение (иногда его величают машинным) – это набор технологий и алгоритмов из уймы связанных и не очень …

Continue reading »

May 03

01 – изображение в компьютерном зрении

пример ортографической проекции

Что такое изображение? Изображение – результат преобразования трехмерного пространства в двумерное. Каждый пиксель изображения – величина отраженного сценой светом в направлении камеры (есть и другие типы – MRI, рентгеновское излучение, изображения получаемые со всяких хитрых штуковин). На практике рассматривают два основных вида преобразований: Перспективная проекция (perspective projection) – вы сами создавали такие проекции с помощью …

Continue reading »

May 03

02 – (пред)обработка изображений

Мона Лиза - все как в тумане - когда не хватает резкости

Обработка изображений Основная причина обработки изображения – сделать его “лучше” с точки зрения человека. Или компьютера. Этот вот обтекаемый термин – “лучше” – может означать что угодно – контрастнее, четче, скрыть неугодные родинки на лице неудачной фотографии или выделить все границы на изображении. Все методы предобработки изображений объединяет одна особенность – на вход они получают …

Continue reading »

May 03

03 – features – локальные особенности – за что зацепиться взгляду

преобразование - сдвиг

[pullquote align=”left|top” textalign=”center” width=”30%”]Лучше один раз увидеть…[/pullquote] Local features – локальные особенности Изображение, бесспорно, представляет собой самое емкое и лаконичное представление большего объема “нефильтрованной” информации. Нефильтрованной, потому как в большинстве случаев, в рамках определенной задачи, нам вполне достаточно некоей “выжимки” данных: есть на изображении объект интереса или нет, где он расположен, каковы его характеристики. Эпическое …

Continue reading »

May 03

05 – машинное обучение для классификации изображений

Машинное обучение – для компьютерного зрения А я предупреждал. В самой еще вводной статье. В компьютерном зрении от компьютера на самом деле очень мало. Пожалуй, только то, что вся эта около-математическая начинка крутится на них, охотно пожирая гигабайты и гигагерцы. Данная статья очередное тому подтверждение. Здесь мы затронем такую щекотливую тему как методы обучения классификаторов …

Continue reading »

May 03

04 – поиск преобразования между особыми точками и немного моделирования

Сопоставление изображений В интернетах гуляет немало фотографий эйфелевой башни. Одни из них сделаны спозаранку, другие – когда уже вечерело, одни сделаны чуть ли не у ее подножия, на других она высится над Парижем. Однако наш острый ум ни на секунду не сомневается, что во всех случаях это именно она – Эйфелева башня. Что же позволяет …

Continue reading »

Jan 04

SLAM – принципы и ссылки на open source

Что такое SLAM? Эта заметка – небольшая памятка на тему что такое SLAM. Здесь описаны основные принципы наиболее популярных методов SLAM (EKF, iSam, TORO и др). В отдельном разделе интересующиеся могут найти ссылки на свободные(!) реализации различных методов SLAM в виде готовых библиотек. А также перечислены блоги и проекты посвященные задаче SLAM. Если вы ищите …

Continue reading »

Sep 20

Как работает Kintinious: визуальная одометрия

Одна из ключевых особенностей Kintinious – стабильная работа методов позиционирования камеры в пространстве. Многие ждут когда же они выложат свой код (дада, они собирались это сделать) но мало кто знает что часть кода вобщем-то и так доступна. В частности, одна из ключевых компонент используемых в их работе – набор методов визуальной одометрии – вполне себе …

Continue reading »

Jul 13

Как работает Kinect Fusion

Описание алгоритма Kinect Fusion На основе анализа кадров глубины, получаемых с сенсора Kinect (или аналогов) формируется детализированное 3D-представление обозреваемой сцены. Данные обрабатываются в реальном режиме. Высокая скорость и детализация достигается за счет использования для всех расчетов GPU, а также новаторским подходом к применению уже известных алгоритмов. В открытой реализации данного проекта в рамках библиотеке PCL …

Continue reading »